AI 모델 Gemini 2.0 발표

이미지

Google DeepMind, 새로운 AI 모델 Gemini 2.0 발표

Google DeepMind는 최신 AI 모델인 Gemini 2.0을 발표했습니다. 이 모델은 이전 버전보다 더 뛰어난 성능과 기능을 자랑하며, 특히 멀티모달 입력과 출력, 그리고 도구 사용이 가능합니다. 이는 AI의 새로운 ‘에이전틱 시대’를 열기 위한 첫걸음으로, Gemini 2.0은 사용자가 더욱 복잡한 문제를 해결할 수 있도록 도와줍니다.

  • Gemini 2.0은 세계적으로 유명한 AI 모델인 AlphaGo를 개발한 Google DeepMind의 최신작으로, AlphaGo는 바둑 경기에서 세계 챔피언을 이긴 바 있습니다.
  • 이 새로운 AI 모델은 멀티모달 기능을 통해 텍스트, 이미지, 음성 입력 모두를 효과적으로 처리할 수 있으며, 이는 AI의 인지 능력과 상호작용 능력을 종합적으로 강화합니다.

Gemini 2.0의 기능과 특징

Gemini 2.0은 네이티브 이미지와 오디오 출력 기능을 포함하여 다양한 기능을 제공합니다. 특히 새로운 도구 사용 기능은 AI가 더 많은 작업을 수행할 수 있게 해주며, 개발자들과 신뢰할 수 있는 테스트 사용자들이 이 모델을 사용해 새로운 AI 에이전트를 구축할 수 있습니다. 이러한 기능은 사용자들에게 보다 유용한 AI 비서를 제공하는 것을 목표로 하고 있습니다.

  • 도구 사용 기능을 통해 Gemini 2.0은 특정 작업을 위한 외부 프로세스를 자동화할 수 있어, 효율성을 극대화할 수 있습니다.
  • 모델은 사용자의 문의를 보다 정확하게 이해할 수 있도록 NLP(Natural Language Processing) 기술이 적용되었으며, 이는 다양한 자연어 처리를 가능하게 합니다.

Gemini 2.0 Flash의 개발자 접근

개발자와 테스트 사용자들은 오늘부터 Gemini 2.0 Flash를 사용할 수 있으며, 내년 초에는 더 넓은 사용자층에게 제공될 예정입니다. Google은 Gemini 2.0을 활용한 다양한 에이전틱 경험을 탐색하고 있으며, Project Astra, Project Mariner 및 Jules와 같은 프로젝트를 통해 이러한 가능성을 실험하고 있습니다.

  • Gemini 2.0 Flash 사용자는 빠른 피드백 루프를 통해 모델의 성능을 개선하고 기능을 확장할 기회를 제공합니다.
  • 이러한 접근 전략은 시장에서 AI 제품의 출시에 있어 일반적으로 6개월에서 1년이 소요되는 것을 고려할 때 매우 빠른 속도로 이루어지고 있는 것입니다.

AI 모델의 책임 있는 개발

Google은 안전성과 보안을 최우선으로 하여 AI를 책임감 있게 개발하고 있습니다. Gemini 2.0은 향상된 추론 능력으로 AI Overviews에 복잡한 수학 문제, 멀티모달 쿼리 및 코딩을 포함한 다양한 질문을 처리할 수 있도록 설계되었습니다. 이러한 기능은 현재 일부 사용자를 대상으로 제한적으로 테스트 중이며, 내년 초에는 더 넓은 범위로 제공될 예정입니다.

  • AI의 안전성을 강화하기 위해 Google은 ‘안전 인스턴트(Recall)’와 ‘위험 평가 모듈(Risk Evaluation Module)’을 도입했습니다.
  • Gemini 2.0은 정확성 향상을 위해 학습 데이터셋의 크기와 다양성을 지속적으로 확장하고 있으며, 이는 AI 모델의 공정성과 윤리적 AI 개발을 지원합니다.

게임 및 로보틱스 분야의 에이전트 활용

Google DeepMind는 게임과 로보틱스 분야에서 Gemini 2.0의 에이전트 기능을 활용하여 새로운 가능성을 탐구하고 있습니다. 게임 개발사와 협력하여 AI 에이전트가 게임 내에서 실시간으로 플레이어를 돕고, Google Search와 연결하여 게임 관련 정보를 제공할 수 있도록 하고 있습니다. 로보틱스 분야에서는 Gemini 2.0의 공간 추론 능력을 활용하여 물리적 환경에서의 지원 가능성을 실험하고 있습니다.

  • AI 에이전트들이 게임 내에서 NPC(Non-Player Character)와 상호작용할 수 있는 시나리오를 구현하여 사용자의 몰입감을 높이고 있습니다.
  • 로보틱스에서 Gemini 2.0은 물체 인식과 경로 탐색 능력을 통해 복잡한 물리적 작업을 자동화시키는 데 활용되고 있습니다.

출처 : 원문 보러가기