현대화된 BERT로 향상된 성능 제공

새로운 시대의 BERT, 'ModernBERT' 발표

'Hugging Face', 'Nvidia', 'Johns Hopkins University'는 협력하여 새로운 인코더 전용 트랜스포머 모델 'ModernBERT'를 발표했습니다. 이 모델은 이전의 BERT를 능가하며, 속도와 정확도 면에서 많은 발전을 이루었습니다.

ModernBERT는 문맥 길이를 기존 인코더 모델의 512 토큰에서 최대 8,000 토큰으로 확장하였습니다. 이는 다른 인코더 모델보다 16배나 큰 길이를 제공합니다. 또한 2조 개의 토큰으로 훈련되었습니다.

ModernBERT는 훈련 데이터에 대량의 코드를 포함한 최초의 인코더 전용 모델입니다. 이로 인해 대규모 코드 검색, 새 IDE 기능, 전체 문서 조회 기반으로 하는 새로운 검색 파이프라인 등 이전에는 접근할 수 없었던 응용 분야에 새로운 가능성을 열었습니다.

실험 결과에 따르면 ModernBERT는 여러 인코더 전용 모델을 능가하는 성능을 보여주었습니다. 특히, NVIDIA RTX 4090에서 높은 효율성을 나타내며 저렴한 소비자용 GPU의 효율성을 검토하고 있습니다.

BERT는 2018년 구글에 의해 개발된 언어 모델로, 전적으로 인코더 기반입니다. 최근 주목받는 GPT와 같은 디코더만을 사용하는 모델과 달리, BERT는 효율적이고 자원이 덜 소모되는 장점이 있습니다.

최근 대중적인 대형 언어 모델(LLM)들이 주목받고 있지만, 이것이 정보 검색(IR)에서 인코더 전용 모델에 대한 새로운 관심을 불러일으켰습니다. 이러한 모델들은 문서 검색과 같은 작업에 여전히 효과적으로 활용되고 있습니다.