구글 AI 엣지 갤러리 출시, 클라우드 없이 AI 실행

구글, 클라우드 없이 AI 실행 가능 앱 출시

구글이 인터넷 연결 없이 스마트폰에서 AI 모델을 직접 실행할 수 있는 ‘AI 엣지 갤러리’라는 실험적 안드로이드 애플리케이션을 조용히 출시했습니다. 이 앱은 엣지 컴퓨팅과 개인정보 보호를 중시하는 AI 배포 전략의 중요한 전환점으로 평가받고 있습니다.

엣지 컴퓨팅은 데이터의 수집, 처리 및 전송을 디바이스 가까이에서 수행합니다. 연구에 따르면 엣지 컴퓨팅은 클라우드 중심 네트워크에 비해 대기 시간이 최대 10배까지 감소할 수 있습니다.
AI 엣지 갤러리는 개인정보 보호를 강화하여 GDPR(General Data Protection Regulation)이나 CCPA(California Consumer Privacy Act)와 같은 규정을 준수할 수 있도록 설계되었습니다.

AI 모델을 스마트폰에서 직접 실행

‘AI 엣지 갤러리’는 Hugging Face 플랫폼에서 AI 모델을 다운로드하여 스마트폰에서 실행할 수 있게 해줍니다. 이를 통해 이미지 분석, 텍스트 생성, 코딩 지원 및 다중 회차 대화와 같은 작업을 로컬에서 처리하며, 모든 데이터 처리를 디바이스에서 직접 수행합니다.

Hugging Face는 다양한 자연어 처리 모델을 제공하며, 인기 있는 BERT와 GPT-2 모델도 포함되어 있습니다. 이는 연구자와 개발자들이 AI 모델을 쉽게 적용할 수 있게 합니다.
스마트폰의 로컬 처리 능력은 모바일 AP(Application Processor)의 성능에 크게 의존하며, 최신 칩셋은 수십억 개의 트랜지스터를 활용하여 고효율 연산을 지원합니다.

오픈 소스 및 확장 가능한 플랫폼 제공

이 앱은 오픈 소스 Apache 2.0 라이선스 하에 GitHub을 통해 제공되며, 구글은 이를 통해 고급 AI 기능에 대한 접근성을 넓히고 클라우드 기반 AI 서비스에 대한 프라이버시 우려를 해결하려고 합니다.

오픈 소스 소프트웨어는 개발자 커뮤니티의 참여를 활발하게 이끌어내며, 글로벌 협업을 통해 빠른 발전과 혁신을 촉진합니다. Standish Group의 보고서에 따르면 오픈 소스 개발로 최대 70%의 비용 절감이 가능하다고 합니다.
GitHub의 사용은 개발자들이 손쉽게 코드 수정 및 피드백을 제공할 수 있도록 하여, 소프트웨어의 보안성과 안정성을 더욱 강화합니다.

LiteRT와 MediaPipe 프레임워크 기반

구글의 LiteRT 플랫폼과 MediaPipe 프레임워크를 기반으로 한 이 앱은 JAX, Keras, PyTorch, TensorFlow 등 다양한 머신 러닝 프레임워크의 모델을 지원합니다. 이러한 플랫폼은 리소스가 제한된 모바일 기기에서 AI 모델을 실행할 수 있도록 최적화되어 있습니다.

MediaPipe는 실시간으로 멀티모달 데이터를 처리할 수 있는 맞춤형 그래프 기반 시스템입니다. 예를 들어, 실시간 얼굴 인식 응용 프로그램에서 매우 높은 정확도를 보장할 수 있습니다.
TensorFlow Lite는 구글의 모바일 및 임베디드 디바이스를 위한 가벼운 툴킷으로, 모바일 애플리케이션에서 ML 모델을 실행하는 데 자주 사용됩니다.

AI 성능 향상을 위한 최적화

구글의 Gemma 3 모델은 529MB 크기의 언어 모델로, 모바일 GPU에서 초당 2,585개의 토큰을 처리할 수 있는 성능을 제공합니다. 이로 인해 텍스트 생성 및 이미지 분석과 같은 작업에서 클라우드 기반 대안과 유사한 경험을 제공합니다.

최적화된 모바일 GPU는 에너지 효율성을 높이면서도 높은 처리량을 달성하는 데 중요한 역할을 합니다. 최신 Mali-G78 GPU는 성능과 전력 효율성 모두에서 상당히 향상된 결과를 보여줍니다.
최신 AI 모델은 양자화 및 압축 기술을 사용하여 모델의 경량화를 추진하며, 이는 디바이스의 배터리 수명을 연장하는 데 기여합니다.

로컬 데이터 처리로 개인정보 보호 강화

데이터를 디바이스에서 처리함으로써 개인정보 보호를 강화하고, 특히 민감한 정보를 다루는 산업에서 클라우드 AI 채택에 대한 제약을 극복할 수 있습니다. 이를 통해 조직은 강력한 AI와 데이터 보호를 동시에 실현할 수 있습니다.

데이터 로컬 처리의 이점은 샐프 드라이빙 자동차 산업에서 특히 유용합니다. 차량 내 데이터 처리로 라이브 피드의 지연을 줄이고 운전자의 개인 정보 보호를 강화할 수 있습니다.
최근 설문 조사에 따르면 소비자의 87%가 개인정보 보호를 중요한 요인으로 고려하며, 이는 로컬 데이터 처리 솔루션이 매우 매력적임을 시사합니다.

모바일 AI 경쟁에서의 차별화된 접근

구글은 플랫폼 인프라에 중점을 두어 모바일 AI 경쟁에서 차별화를 꾀하고 있습니다. 구글의 전략은 특정 AI 기능을 직접 경쟁하기보다는 모바일 AI 애플리케이션을 지원하는 기반을 구축하는 데 초점을 맞추고 있습니다.

모바일 AI 시장은 2027년까지 약 79,000억 달러 규모로 성장할 것으로 예상됩니다. 이는 모바일 디바이스를 통한 AI 솔루션의 확산을 더욱 가속화합니다.
모바일 AI 플랫폼은 제조사 간 상호운용성을 높임으로써, 다양한 기기에서 일관된 사용자 경험을 보장합니다.

다양한 기기에서의 성능 한계

현재 ‘AI 엣지 갤러리’는 실험적 특성으로 인해 기기 하드웨어에 따라 성능이 크게 다릅니다. 고급 기기에서는 매끄러운 작동이 가능하지만, 중간급 기기에서는 지연이 발생할 수 있습니다.

벤치마크 테스트에 따르면 고급 스마트폰들은 단순 벡터 연산에 있어서 수백 기가플롭스를 처리할 수 있습니다. 그러나 중저가형 기기의 경우 성능은 이보다 절반 이하일 수 있습니다.
하드웨어 제약은 지속적인 소프트웨어 최적화 및 가볍게 설계된 AI 모델을 통해 점차 극복되고 있으며, 향후 몇 년 내에 더 많은 기기들에서도 훌륭한 성능을 제공할 수 있을 것으로 기대됩니다.

구글의 미래 AI 전략

구글은 이번 앱 출시를 통해 중앙 집중식 AI 모델의 한계를 인식하고 있습니다. 구글의 목표는 모든 스마트폰을 분산된 AI 네트워크의 일부로 만드는 것이며, 이를 통해 현재의 데이터 센터 소유보다 미래의 AI 인프라 제어가 더 중요하다고 판단하고 있습니다.

연구에 따르면 분산 AI 네트워크는 전력 소비를 30% 이상 절감할 수 있으며, 이는 글로벌 지속 가능성을 향한 큰 진전을 의미합니다.
미래의 AI 인프라 전략은 IoT 기기와 같은 소형 디바이스가 네트워크의 일원이 되어 정보를 처리하고 분석하는 데 중점을 두고 있습니다. 이는 스마트 시티 개발에 필수적인 요소로 작용할 것입니다.

출처 : 원문 보러가기