대형 언어 모델 AI의 현실 적용 한계점

이미지

대형 언어 모델의 한계

최근 연구에 따르면 대형 언어 모델(AI)은 표면적으로는 똑똑해 보이지만 실제 세계를 정확히 이해하고 모델링하는 데는 한계가 있다고 합니다.

  • 대형 언어 모델(LLM)은 대량의 데이터를 기반으로 훈련되어 텍스트 생성이나 번역, 요약 등 다양한 작업을 수행할 수 있지만, 이는 패턴 인식에 기반한 것으로, AI 자체가 정보를 ‘이해’한다고 볼 수는 없습니다.
  • OpenAI의 GPT-3와 같은 LLM은 수백억 개의 매개변수로 이루어져 있지만, 오류나 비상식적인 결과가 나타날 수 있어 여전히 사람의 관여가 필요합니다.

생성 AI 시스템의 실제 이해 부족

생성형 인공지능 시스템은 놀라운 결과를 만들어낼 수 있지만, 현실 세계와 그 규칙에 대한 일관된 이해는 부족하다는 연구 결과가 발표되었습니다.

  • 생성 AI가 생성하는 출력물은 문법적으로나 형식적으로 완벽할 수 있지만, 의미적 일관성을 가지지 못하는 경우가 많습니다. 이는 AI가 문맥을 이해하지 못하는 한계를 의미합니다.
  • 이러한 한계를 극복하기 위해, 연구자들은 인간의 피드백을 학습에 활용하거나 강화학습을 통해 AI의 공감 능력을 높이기 위한 여러 접근을 시도하고 있습니다.

연구 배경 및 방법

MIT, 하버드, 코넬 대학교 연구팀은 대형 언어 모델들이 현실 세계를 정확히 나타내는 모델을 만들지 못한다는 사실을 발견했습니다.

  • 연구팀은 여러 시나리오를 설정하고 LLM의 반응을 평가했습니다. 이 과정에서 LLM은 특수한 문맥에서 비논리적 결과를 반복적으로 생성하는 경향을 보였습니다.
  • 이러한 연구의 목적은 LLM의 한계를 명확히 파악하여, 이후 모델 발전의 초석을 마련하는 데 있으며, 연구 결과는 참가자들이 실시간으로 접근할 수 있는 온라인 데이터베이스로 제공되고 있습니다.

뉴욕시의 경로 안내 실험

뉴욕시에서 경로 안내를 제공하는 실험에서 LLM들은 거의 100% 정확도를 보였지만, 사용된 지도가 허구의 거리와 경로로 가득 차 있었습니다.

  • 이 실험은 LLM이 단순히 데이터 패턴에 의존하여 정확한 답을 생성할 수 있음을 보여줍니다. 그러나 실제 유용성과 현실 적합성은 데이터의 정확도와 직접 연관됩니다.
  • 연구팀은 현실 데이터를 사용하지 않는 이유로, LLM이 외부 변수를 어떻게 처리하는지에 대한 이해를 돕기 위하여 실험 조건을 제어하려 했다고 밝혔습니다.

예상치 못한 변수에 대한 대응력 부족

경로에 예상치 못한 변경 사항이 추가되면 LLM의 정확도가 급락했고, 이는 자율주행차와 같은 실제 환경에서의 사용에 대한 우려를 낳습니다.

  • 자율주행차와 같은 시스템에서 실시간으로 변하는 변수에 대응하려면, 지속적인 데이터 업데이트와 상황 인식 능력이 필수적입니다. LLM은 이러한 측면에서 한계를 드러냅니다.
  • 포드, 테슬라 등 대형 자동차 제조사들은 AI의 실시간 경로 계산 능력을 강화하기 위해 자체적인 데이터셋을 구축하고, AI의 학습 프로세스를 개선하기 위한 노력을 기울이고 있습니다.

세계 모델의 이론적 활용 가능성

세계 모델은 도시 내 택시 여행 데이터를 통해 지도 생성 가능성을 제시하지만, 부정확한 지도가 문제를 초래할 수 있습니다.

  • 지도 생성은 지역별 특성과 동적 변화 요소를 정확하게 반영해야 하며, 이는 세계 모델의 데이터 수집 및 처리와 직접적으로 연결됩니다.
  • 세계 모델의 성공적인 활용을 위해 일부 연구팀은 가상 시뮬레이션 환경을 조성하여 데이터를 선별하고, 현실 세계의 특정 영역에 대해 세부적인 모델링을 시도하고 있습니다.

변환기 LLM의 평가

연구자들은 변환기 LLM이 실제 세계 규칙을 이해하는지 평가하기 위해 결정론적 유한 자동화를 활용한 실험을 진행했습니다.

  • 결정론적 유한 자동화는 규칙 기반의 시스템으로, 이 실험은 변환기 LLM이 고정된 규칙조차 잘 따르지 않는 경우가 많음을 밝혀냈습니다.
  • 이러한 결과는, 기존 모델의 확장으로도 충분히 해결되기 어렵고, 근본적인 알고리즘 개선 및 모델 구조 재설계가 필요함을 시사합니다.

변환기의 데이터 처리 방식 차이

두 가지 변환기 LLM을 테스트한 결과, 무작위 데이터를 처리한 모델이 더 정확한 세계 모델을 형성했다는 결론을 내렸습니다.

  • 무작위 데이터 기반 모델이 더 유연한 데이터 구조를 형성할 수 있어, 다양한 변수에 대한 적응도가 높다는 분석이 있습니다.
  • 추가 연구에 따르면, 특정한 데이터만을 학습한 모델보다 다양한 데이터 셋을 학습한 모델이 정보 일반화 및 추론 능력에서 인상적인 성과를 거둘 수 있다는 점이 강조되고 있습니다.

세계 모델 형성의 어려움

연구자들은 LLM이 새로운 환경에 적응할 수 있도록 하는 접근법이 필요하다고 강조하며, 변환기 LLM의 취약성을 지적했습니다.

  • 세계 모델의 형성은 단순히 데이터의 수집과 저장을 넘어, 그 데이터가 시사하는 현실적 맥락의 깊이 있는 이해를 포함해야 합니다.
  • 다양한 연구 기관은 지속적인 피드백 학습이나 동적 데이터 통합 시스템을 제안하며, 자가 학습 능력을 가진 모델 개발을 통해 이러한 문제를 해결하려고 노력하고 있습니다.

출처 : 원문 보러가기