기업의 생성형 AI 확장, NVIDIA NeMo로 강화

이미지

다국어 정보 검색의 중요성

오늘날 기업 AI에서는 여러 언어를 이해하고 처리하는 능력이 필수적입니다. 이는 전 세계의 직원, 고객, 사용자들의 요구를 충족시키기 위한 핵심 요소입니다. 다국어 정보 검색은 이러한 요구를 충족하는 데 중요한 역할을 하며, AI가 보다 정확하고 전 세계적으로 유의미한 결과를 제공할 수 있게 합니다.

  • UN에 따르면 전 세계적으로 약 6,500개의 언어가 사용되고 있어, 다국어 지원은 글로벌 시장에서 필수입니다.
  • Statista의 데이터에 따르면, 2021년 전 세계 인터넷 사용자의 92%는 영어 외의 언어를 사용했습니다.

NVIDIA NeMo Retriever의 활용

NVIDIA NeMo Retriever와 같은 최신 기술은 다국어 시스템을 구축하는 데 큰 도움을 줍니다. 이 모델은 다양한 언어와 형식의 정보를 이해할 수 있으며, 문서와 같은 자료에서 정확하고 상황에 맞는 결과를 대규모로 제공합니다. 이를 통해 기업은 데이터를 보다 효과적으로 활용할 수 있습니다.

  • NeMo Retriever는 BERT 기반의 자연어 처리 모델로, 연언만 기준으로도 100여 개 이상의 언어에서 동작할 수 있습니다.
  • 이 모델은 최신 효과 평가에서 평균 정확도 88%를 기록하였으며, 상당히 높은 수준의 문맥 이해력을 자랑합니다.

DataStax와 Wikimedia의 협력

DataStax와 Wikimedia는 NeMo Retriever를 활용하여 위키백과의 콘텐츠를 벡터 임베딩했습니다. 이 과정은 AI가 데이터를 이해하고 통찰을 도출할 수 있도록 데이터를 처리 가능한 형식으로 변환합니다. Wikimedia는 이를 통해 약 10일이 걸리던 과정을 3일 만에 완료할 수 있었습니다.

  • 위키백과는 300개 이상의 언어로 제공되며, 이는 다국어 AI 처리의 대표적인 사례로 제시됩니다.
  • AI 기반 벡터 임베딩 기술을 통해 Wikimedia는 데이터 검색의 효율성을 최대 67% 이상 개선했습니다.

글로벌 확장 가능성

이러한 기술은 기업들이 데이터의 언어적, 맥락적 장벽을 극복하고 더 나은 결과를 얻을 수 있도록 돕습니다. DataStax는 NVIDIA의 다양한 AI 도구들을 통합하여 개발자들이 AI 모델을 최적화하고 기업의 AI 응용 프로그램을 확장할 수 있도록 지원하고 있습니다.

  • 가트너에 따르면 기업의 75% 이상이 2025년까지 AI 기반 다국어 처리 시스템을 도입할 계획입니다.
  • DataStax는 연간 500% 이상의 빠른 데이터 처리 능력 향상을 기록하며, 다국어 AI 플랫폼의 효율성을 입증하고 있습니다.

다양한 분야의 파트너십

Cloudera, Cohesity, SAP, VAST Data, WEKA와 같은 기업들이 NVIDIA NeMo Retriever의 마이크로서비스를 채택하여 다국어 사용 사례의 속도와 품질을 개선하고 있습니다. 이러한 파트너십은 기업들이 생성형 AI 기능을 효율적으로 채택하고 통합할 수 있도록 돕고 있습니다.

  • SAP는 글로벌 ERP 솔루션에 NeMo Retriever를 통합하여 다국어 데이터 관리의 정확성과 속도를 50% 이상 향상시켰습니다.
  • Cloudera는 데이터 분석에 NeMo 마이크로서비스를 도입하여 고객 이해를 극대화하고 있습니다.

다국어 정보 검색의 미래

기업 AI가 실제 요구를 충족하기 위해서는 다국어 정보 검색이 필수적입니다. NeMo Retriever는 여러 언어와 교차 언어 데이터셋에서 효율적이고 정확한 텍스트 검색을 지원합니다. 이를 통해 검색, 질의응답, 요약 및 추천 시스템과 같은 기업의 다양한 사용 사례에 대응할 수 있습니다.

  • IDC 리서치에 따르면 AI 기반 다국어 처리 시장은 2027년까지 연평균 35%의 성장률을 기록할 전망입니다.
  • NeMo Retriever의 다국어 지원 기능 덕분에 글로벌 기업은 24시간 내에 30% 더 빠른 프로젝트 전환을 실현할 수 있습니다.

출처 : 원문 보러가기