AI의 복잡한 추론 시스템 개발 가속화

이미지

복잡한 추론을 향한 AI의 발전

인공지능 연구는 복잡한 추론 시스템 개발을 향해 꾸준히 발전하고 있습니다. 특히 다중 모달 대형 언어 모델(MLLM)은 텍스트와 시각 데이터를 결합하여 처리하는 능력을 갖추고 있어 교육, 과학, 데이터 분석 등 다양한 분야에서 새로운 가능성을 제시합니다.

  • MLLM은 자연어 처리와 이미지 인식을 동시에 결합하여 이해하고, 새로운 형태의 인간-컴퓨터 상호작용을 촉진할 수 있습니다.
  • 이러한 기술은 다양한 산업에서의 데이터 통합을 통해 더욱 심도 있는 분석과 결정을 가능하게 하며, 문제 해결의 효율을 높입니다.

시각 및 텍스트 통합의 도전

기존의 대형 언어 모델은 텍스트나 이미지를 각각 처리하는 데에는 뛰어나지만, 이를 결합하여 추론하는 데는 한계가 있습니다. 이러한 한계는 특히 ‘느린 사고’가 필요한 복잡한 멀티모달 과제에서 두드러지며, MLLM의 실용적 적용을 위한 해결이 필요합니다.

  • 이는 인간의 직관적 사고와 달리 기계적 분석이 제한되는 부분으로, ML 연구에 있어 주요 장애 요소로 작용합니다.
  • 복잡성 높은 분야에서는 모델의 추론 능력 향상을 위한 보다 정교한 데이터 처리 및 분석 방식이 필요합니다.

추론 능력 향상을 위한 두 가지 접근법

현재 MLLM의 추론 능력을 향상시키기 위한 두 가지 주요 접근법이 있습니다. 하나는 보상 모델에 의해 안내되는 구조화된 탐색 방법을 사용하는 것이고, 다른 하나는 긴 형식의 추론 지침을 통해 LLM을 훈련하는 것입니다. 그러나 이러한 방법은 주로 텍스트 기반 과제에 집중되어 멀티모달 시나리오에서는 상대적으로 연구가 부족합니다.

  • 보상 모델은 다양하고 복잡한 입력을 분석, 학습하며 피드백을 통해 성능을 개선합니다.
  • 긴 형식의 지침서는 모델의 이해력을 높이며, 다양한 문맥에서 적응하는 능력을 키우는 데 도움을 줍니다.

새로운 모델 Virgo의 개발

중국 인민대학, Baichuan AI, BAAI의 연구자들은 Virgo라는 모델을 도입하여 멀티모달 컨텍스트에서 ‘느린 사고’ 추론을 강화했습니다. Virgo는 Qwen2-VL-72B-Instruct 모델을 미세 조정하여 개발되었으며, 텍스트형 장기 사고 데이터를 활용해 모달리티 간의 추론 능력을 전이하는 독특한 방법을 사용했습니다.

  • Virgo는 복잡한 문제 해결을 위한 장기적인 데이터의 연계를 통해 효율적인 분석 체계를 구축합니다.
  • 이를 통해 기존 모델의 한계를 넘어 다양한 포맷의 데이터를 포괄적으로 이해할 수 있도록 설계되었습니다.

Virgo의 성능 평가

Virgo의 성능은 MathVerse, MathVision, OlympiadBench, MMMU와 같은 네 가지 까다로운 벤치마크를 통해 평가되었습니다. Virgo는 기존 모델을 능가하는 성과를 보였으며, 특히 OlympiadBench에서는 기본 모델 대비 12.4% 향상된 결과를 기록했습니다.

  • OlympiadBench는 논리적 사고 및 복잡한 문제 해결 능력을 테스트하는데 적합한 도구로, Virgo의 성능을 잘 반영합니다.
  • Virgo의 개선된 성능은 다양한 환경에서 문제 해결 능력을 입증해, 더 넓은 응용 가능성을 엿보게 합니다.

복잡성에 따른 성능 분석

Virgo의 성능은 벤치마크 내의 난이도에 따라 분석되었으며, 복잡한 과제에서 일관된 성능 향상을 보였지만, 단순한 과제에서는 제한적인 개선을 보였습니다. 이러한 결과는 문제의 복잡성에 맞춘 추론 시스템의 중요성을 강조합니다.

  • Virgo는 복잡한 문제 해결의 효율성을 높이지만, 기본적인 과제에서는 큰 차이를 나타내지 않습니다.
  • 이는 AI 시스템이 향후 더욱 복잡한 데이터 세트와 상황을 다루는 데 필요한 강화 학습의 필요성을 의미합니다.

AI 추론 시스템의 미래를 열다

Virgo의 성공은 텍스트형 장기 사고 데이터를 활용한 MLLM 훈련이 멀티모달 시스템의 발전에 효과적임을 보여주며, AI 연구의 새로운 가능성을 제시합니다. 이를 통해 더 발전된 멀티모달 AI 시스템 개발을 위한 길을 열었습니다.

  • 이 연구는 인간의 인지 패턴과 유사한 AI 추론 시스템 개발의 잠재성을 확인시키고 있습니다.
  • Virgo의 접근법은 향후 AI가 복합 데이터 처리를 통해 사회적 의사결정에 더 큰 기여를 할 수 있는 기초를 마련합니다.

출처 : 원문 보러가기