제로샷 학습이란 무엇인가

제로샷 학습의 개념과 필요성

제로샷 학습(ZSL)은 AI 모델이 사전에 본 적 없는 객체나 개념을 인식하고 분류할 수 있도록 훈련하는 방법론입니다. 이는 많은 레이블 데이터를 요구하는 기존의 지도 학습과는 달리, 레이블 없이도 객체를 분류할 수 있다는 점에서 주목받고 있습니다.

제로샷 학습의 필요성은 늘어나는 데이터 양과 새롭게 등장하는 개념들에 대응하기 위함입니다. 예를 들어, 매년 수천 종의 새로운 생물이 발견되며 데이터베이스에 추가됩니다. 제로샷 학습을 활용하면 이러한 새로운 종을 빠르게 인식할 수 있습니다.
제로샷 학습은 IoT 기기처럼 자기 갱신이 필요한 시스템에도 적용할 수 있으며, 이러한 기기는 수시로 업데이트되는 현실 세계 데이터에 대해 즉시 반응할 수 있어 그 중요성이 더욱 커지고 있습니다.

전통적인 지도 학습의 한계

대부분의 딥러닝 모델은 지도 학습을 통해 훈련됩니다. 이 방식은 많은 양의 레이블이 붙은 데이터를 필요로 하며, 데이터 레이블은 모델이 학습할 수 있는 정답을 제공합니다. 그러나 데이터 레이블을 마련하는 과정은 시간과 비용이 많이 들며, 특히 희귀 질병이나 새로운 종과 같은 사례에서는 예제 자체가 부족할 수 있습니다.

2019년 AI 시장 조사에 따르면, 기업들이 AI 프로젝트를 진행할 때 직면하는 가장 큰 어려움 중 하나가 데이터 준비와 레이블링 문제였습니다. 이는 프로젝트의 80% 이상을 차지하는 작업 시간으로, 제로샷 학습의 가치가 강조됩니다.
희귀 질병 데이터베이스 Orphanet에 따르면, 10,000개 이상의 희귀 질병이 존재하지만, 그 중 80% 이상은 충분한 데이터가 없다고 보고되어, 제로샷 학습이 유효한 해결책으로 자리잡을 수 있습니다.

제로샷 학습의 접근 방식

제로샷 학습은 새로운 클래스에 대한 레이블 데이터 없이도 AI 모델이 일반화할 수 있는 능력을 요구합니다. 이는 텍스트 설명, 속성, 임베딩 등 보조 정보를 활용해 예측을 수행하는 방식으로 이루어집니다.

구글 리서치에서는 언어 임베딩을 사용하여 텍스트 기반 시맨틱 공간을 만들었으며, 이를 통해 다양한 언어간 번역을 레이블 없이 수행하는 데 성공했습니다. 이는 제로샷 학습의 또 다른 가능성을 보여줍니다.
현실 세계에서, 제로샷 학습은 이미지 데이터셋에서 미관 사용을 피하거나 잘못된 라벨링을 방지하는 데 유용합니다. 이는 특히 예방 및 방지에 대한 비용 절감 효과를 가져올 수 있습니다.

일반화된 제로샷 학습(GSZL)의 도전 과제

GSZL은 모델이 이미 학습한 클래스와 보지 못한 클래스를 구별해야 하는 추가적인 도전 과제를 안고 있습니다. 이를 위해 편향을 줄이기 위한 추가 기술이 필요합니다.

Stanford University의 연구에 따르면, 기존 ZSL 모델은 종종 보지 못한 클래스에 대해 높은 편향을 나타냅니다. 이를 해결하기 위해 다양한 핀셋 세분화 기법과 데이터 보강 방법이 개발되고 있습니다.
GSZL의 큰 과제 중 하나는 “하나의 큰 편향된 클래스” 문제를 해결하는 것입니다. 이는 모델이 일부 클래스에 대해서만 예측을 편중할 수 있다는 것을 의미하며, 이를 완화하기 위한 연구들이 활발히 진행 중에 있습니다.

임베딩 기반 제로샷 학습

많은 ZSL 방법론은 클래스와 샘플을 의미적 임베딩으로 표현합니다. 이러한 임베딩은 데이터 포인트의 특징이나 의미를 반영하며, K-최근접 이웃 알고리즘과 유사한 방식으로 분류가 결정됩니다.

2020년 Google Brain 연구에 따르면, 이미지 임베딩을 개선하여 얼굴 인식의 신뢰도를 30% 향상시킨 사례가 있습니다. 이는 ZSL의 임베딩 접근법의 강력함을 보여줍니다.
실제로, Amazon의 제품 추천 시스템은 임베딩 기술을 기반으로 설계되어 각 제품의 특징을 효과적으로 관리합니다. 이를 통해 새로운 제품이 추가되더라도 추천 시스템의 정확성을 유지할 수 있습니다.

전이 학습의 역할

ZSL에서는 전이 학습을 통해 이미 훈련된 모델을 새로운 과제에 맞게 활용하는 방식을 자주 사용합니다. 이는 특히 GSZL에서 중요하며, 학습된 클래스를 새로운 클래스에 대한 보조 정보로 활용할 수 있습니다.

전이 학습을 통해 모델이 새로운 데이터 세트에 적응했을 때, 제한된 새로운 레이블로도 높은 성능을 유지할 수 있다는 것이 입증되었습니다. 이 방식은 특히 데이터가 부족한 상황에서 유용합니다.
구체적으로, 전이 학습은 살충제 종류 분류와 같이 분류해야 할 클래스가 매우 많은 경우에 적용되기도 합니다. 이는 연결된 데이터나 정보를 활용해 새로운 살충제의 개념을 빠르게 학습하는 데 도움을 줍니다.

생성적 AI와 제로샷 학습

생성적 AI는 보조 정보를 활용하여 샘플 데이터를 생성하는 대안적인 솔루션을 제공합니다. 이는 특히 라벨링된 데이터가 부족한 상황에서 유용하며, 생성된 샘플을 통해 표준 지도 학습 문제로 전환할 수 있습니다.

NVIDIA의 GAN 기술을 활용해 5,000종 이상의 사이버 보안 위협을 모델링한 사례가 있으며, 이는 새로운 공격 벡터를 탐지하고 대응하는 데 도움을 주었습니다. 제로샷 학습의 유용성을 높이는 대표적인 예입니다.
생성적 AI는 패션 산업에서도 사용되며, AI가 생성한 트렌드 이미지를 통해 브랜드는 소비자 취향을 더욱 정확히 파악하고 이에 맞춘 마케팅 전략을 구축할 수 있습니다.

결론

제로샷 학습은 다양한 분야에서 AI 모델의 범용성을 높이는 데 중요한 역할을 합니다. 이는 특히 컴퓨터 비전과 자연어 처리 분야에서 활발히 연구되고 있으며, 앞으로 더욱 발전할 가능성이 큽니다.

최근 MIT의 연구에 따르면, 제로샷 학습을 통해 컴퓨터 비전 모델의 기존 성능을 최대 40%까지 향상시킬 수 있다는 결과가 나왔습니다. 이는 기술 발전에 따른 ZSL의 장래성을 뒷받침합니다.
또 다른 실용 사례로, 엔비디아는 제로샷 자연어 처리 모델을 통해 사용자 요청을 빠르게 분석하고 반응 시간 개선에 사용하고 있습니다. 이는 고객 환경에서 더욱 유연하고 신속한 대응을 가능하게 합니다.

출처 : 원문 보러가기