알리바바 클라우드, 다중모달 AI 모델 Qwen2.5-Omni-7B 출시
알리바바 클라우드는 텍스트, 이미지, 오디오, 비디오 형태의 입력을 처리하고 실시간으로 텍스트 및 자연어 응답을 생성할 수 있는 다중모달 AI 모델인 Qwen2.5-Omni-7B를 선보였습니다. 이 모델은 모바일 폰과 노트북에 배포할 수 있는 소형 모델로, 경제적이며 유연한 AI 에이전트를 지원합니다.
- 최근 AI 기술 발전으로 인해 텍스트뿐만 아니라 다중 모달 입력을 처리할 수 있는 모델이 늘어나고 있습니다. 구글의 DeepMind가 개발한 Perceiver AI도 비슷한 다중모달 기능을 지원하며, 이를 통해 다양한 데이터 형태를 통합적으로 처리합니다. 이러한 모델들은 다양한 산업 분야에서 폭넓게 활용될 수 있습니다.
- 알리바바의 다중모달 AI는 특히 소형화와 경량화가 강조되었습니다. 이는 통신 인프라가 상대적으로 부족한 지역에서도 손쉽게 활용할 수 있도록 하며, 전력 효율성을 높여 모바일 기기 운영비용을 절감할 수 있습니다.
다양한 활용 가능성 제공
Qwen2.5-Omni-7B는 시각장애인을 위한 실시간 오디오 설명 제공, 영상 속 재료 분석을 통한 요리 안내, 고객의 요구를 이해하는 지능형 고객 서비스 대화 등 다양한 활용 사례를 지원합니다.
- 동일 기능의 AI 모델 사용은 의료 분야에서 특히 유망합니다. 예를 들어, 의료 영상 데이터를 분석해 질병을 사전에 진단하는 데 도움을 줄 수 있습니다. Stanford 대학의 연구에 따르면, AI는 방사선 영상 분석에서 방사선학자와 비슷한 수준의 정확성을 자랑합니다.
- 또한, 다중모달 AI는 법률 및 금융 상담 분야에서도 활용도가 높아지고 있습니다. 복잡한 문서를 처리하고 고객에게 간결한 정보를 제공하는 능력은 기업의 운영 효율성을 크게 향상시킬 수 있습니다.
오픈소스 커뮤니티에 공개
이 모델은 Hugging Face와 GitHub에서 오픈소스로 제공되며, 알리바바 클라우드의 오픈소스 커뮤니티인 Qwen Chat과 ModelScope를 통해 접근할 수 있습니다.
- 오픈소스로 제공됨에 따라 전 세계 개발자와 연구자들이 이 모델을 자유롭게 활용하고 개선할 수 있는 환경이 마련되었습니다. 오픈소스 AI 모델은 협업의 중요성을 증대시켰으며, 2023년 GitHub의 오픈소스 AI 프로젝트는 총 6천만 개 이상에 달합니다.
- 이러한 커뮤니티는 글로벌 개발자들이 혁신적인 솔루션을 개발하고 공유할 수 있는 장소를 제공합니다. 특히, 다양한 언어와 문화적 배경을 가진 개발자들이 참여하여 모델의 언어 및 문화적 편향을 줄이는 데 기여할 수 있습니다.
성능 및 혁신적 기준 설정
알리바바 클라우드가 오픈소스로 공개한 200여 개의 생성형 AI 모델 중 Qwen2.5-Omni-7B는 모든 모달리티에서 뛰어난 성능을 보여주며, 실시간 음성 상호작용과 자연스럽고 강력한 음성 생성, 종단 간 음성 지시 사항 이행에서 새로운 기준을 설정했습니다.
- Qwen2.5-Omni-7B는 CPU 및 메모리 사용 최적화가 이루어져, 제한된 하드웨어에서도 높은 성능을 발휘할 수 있습니다. 이는 데이터센터 운영 비용을 절감하고, 친환경적으로 운영할 수 있는 환경을 조성합니다.
- 또한, Microsoft의 DALL-E와 NVIDIA의 GauGAN과 같은 모델과 경쟁하며, 더 높은 품질의 생성 능력을 갖추고 있습니다. 각종 벤치마크 및 평가에서 경쟁 모델과 비교해 높은 점수를 기록하며, 시장에서 신뢰성을 인정받고 있습니다.
알리바바의 AI 연구 및 투자 계획
이번 발표는 약 두 달 전 Qwen2.5-Max 모델 출시 이후 이루어진 것입니다. 알리바바는 향후 3년간 AI 분야에 과거 10년간의 투자보다 더 많은 자금을 투입할 계획이라고 밝혔으며, AI의 지능 범위를 확장해 더 많은 기회를 창출하려고 합니다.
- 알리바바는 AI에 대한 집중적인 투자를 통해 중국을 넘어 세계적인 AI 리더로 자리매김하고 있습니다. 이는 글로벌 AI 시장이 2027년까지 1조 달러 규모로 성장할 것으로 예상되는 것에 맞춰, 성장 잠재력이 큰 시장에 집중하는 전략입니다.
- AI 연구 및 개발 투자는 새로운 비즈니스 모델 창출과 동시에, 다양한 산업의 디지털 전환 촉진을 목표로 하고 있습니다. 이는 특히 인공지능 기반 물류, 스마트 시티, 자율주행차 등 미래 기술을 선도하는 데 큰 힘을 실어줄 것으로 기대됩니다.
출처 : 원문 보러가기