인공지능 대규모 언어 모델의 다국어 지원
일부 인공지능 공급업체들은 대규모 언어 모델(LLM)을 다국어 환경에서 활용할 수 있도록 노력하고 있습니다. Writer라는 회사는 기업용 생성 AI 플랫폼을 제공하며, 이와 함께 Palmyra라는 LLM 시리즈를 개발했습니다. 이 모델들은 스페인어, 프랑스어, 힌디어, 러시아어 등 여러 언어의 텍스트 생성 및 번역을 지원합니다.
- 2021년 기준, 전 세계 인터넷 사용자의 74%가 비영어권 사용자입니다. 이는 다국어 AI 모델의 필요성을 증가시키고 있습니다.
- Google, Facebook 등 대형 IT 기업도 수많은 언어 지원을 목표로, 100개 이상의 언어로 훈련된 AI 모델을 개발 중입니다.
다국어 훈련 데이터의 중요성
Writer의 공동 창립자이자 CEO인 May Habib는 “다른 언어에서도 영어만큼 뛰어난 다국어 훈련 데이터와 모델을 만드는 것이 중요하다”고 강조했습니다. 이를 위해 Writer는 대량의 합성 데이터를 활용하여 생성 AI 기술의 법적 신뢰성을 구축하고 있습니다.
- Facebook의 2019 연구에 따르면, 다국어 모델은 단일 언어 모델보다 36% 더 정확한 언어 예측을 제공합니다.
- 합성 데이터는 실제 사용자 데이터와 함께 사용되어 모델의 성능을 개선할 수 있으며, 특히 드문 언어에 유용합니다.
편향성과 유해성 점수 공개
Writer는 모델의 편향성과 유해성 점수를 공개하며, 기업의 ESG(환경, 사회, 거버넌스) 가이드라인을 준수하려는 노력을 기울이고 있습니다. 이는 AI 기술이 사회적 책임을 다하도록 하는 중요한 단계입니다.
- AI Now Institute 보고서에 따르면, AI 시스템의 편향성은 고용, 법률, 헬스케어 등 다양한 분야에서 실질적인 문제를 일으킬 수 있습니다.
- 2020년 OpenAI의 GPT-3 모델은 편향성 문제로 지적받았으며, 이러한 문제를 해결하기 위한 투명한 점수 공개는 믿을 수 있는 AI 사용에 필수적입니다.
Writer의 최근 자금 조달
Writer는 최근 시리즈 C 펀딩 라운드에서 2억 달러를 조달하여 기업 가치가 19억 달러에 이르렀습니다. 이는 회사의 성장과 기술 발전 가능성을 보여주는 중요한 지표입니다.
- 2022년 AI 스타트업에 대한 전 세계 벤처 캐피털 투자는 약 130억 달러에 달했습니다.
- 창업 초기 단계에서 10억 달러 이상의 가치를 가진 회사는 ‘유니콘’이라 불리며, Writer는 기술 성장의 유망한 사례로 주목받고 있습니다.
데이터 시각화와 분석의 중요성
데이터 기반 의사 결정이 점차 중요해지는 가운데, 데이터 시각화 능력은 분석 결과를 효과적으로 전달하는 데 필수적입니다. 이러한 기술은 프로 축구와 같은 분야에서도 경쟁력을 제공하고 있습니다.
- Gartner에 따르면, 2025년에는 데이터 시각화 및 분석 도구 시장이 약 230억 달러 규모로 성장할 것으로 예상됩니다.
- 프로 스포츠 플랫폼에서 데이터 분석은 선수의 경기력 향상 및 전략 수립에 중추적인 역할을 하고 있으며, 2020년 LA 다저스의 우승 사례가 그 예입니다.
출처 : 원문 보러가기