Windows 98에서 실행되는 AI 모델의 혁신

EXO Labs는 엄청난 일을 해냈습니다. 26년 된 Windows 98 PC에서 AI 대형 언어 모델(LLM)을 구현한 것입니다. Pentium II 프로세서와 128MB RAM을 탑재한 이 오래된 PC는, 최근 소셜 미디어에 공개된 짧은 동영상에서 놀라움을 자아냈습니다. 그들은 Andrej Karpathy의 Llama2.c를 기반으로 한 순수 C 추론 엔진을 사용하여 'Sleepy Joe'에 대한 이야기를 생성하는 데 성공했습니다.

이 시연은 AI 기술의 접근성을 극대화하려는 시도로, 하드웨어의 시대적 한계를 뛰어넘었습니다.
해당 프로젝트는 경제적인 AI 구현 가능성을 제시하며, 구형 시스템에서의 현대 기술 활용 사례로 기록됩니다.

EXO Labs의 목표: AI 민주화

EXO Labs는 AI의 민주화를 염두에 두고 설립된 신생 조직입니다. 옥스퍼드 대학교 출신으로 구성된 연구원 및 엔지니어들이 주축이 되어, AI 모델의 교육과 실행을 누구나 가능하도록 하는 인프라 구축을 목표로 하고 있습니다. Windows 98 AI 모델 구현은 제한된 자원으로도 무엇이 가능한지를 보여주는 상징적인 시연입니다.

AI 민주화는 사회 전반의 기술 및 경제적 불균형을 줄이는 데 기여할 수 있습니다.
다양한 시스템 환경에서 AI 교육을 제공하여, 전 세계적으로 기술 격차를 줄이는 데 도움을 줍니다.

Windows 98 PC에서의 도전 과정

EXO Labs는 오래된 Windows 98 PC를 손에 넣는 것은 쉬운 일이었지만, 데이터 전송 등 많은 어려움을 겪었습니다. '좋은 옛 FTP'를 사용해 이 문제를 해결했다고 설명합니다. 더 큰 어려움은 현대 코드를 Windows 98에 맞게 컴파일하는 것이었습니다. Andrej Karpathy의 llama2.c 덕분에, 이 코드는 700줄의 순수 C로 이루어져 있으며 Llama 2 아키텍처 기반 모델에 대해 추론을 할 수 있도록 설계되었습니다.

Windows 98의 환경은 새로운 소프트웨어에서 사용되지 않는 기능을 요구할 수 있어 코드 변환이 필수적입니다.
FTP는 전통적인 데이터 전송 방법으로, 현대적인 대안 없이도 파일 관리 가능성을 제시했습니다.

LLM 성능 및 확장 가능성

Windows 98에서 실행된 LLM은 초당 35.9 토큰을 생성하는 성능을 보여주었습니다. 이는 260K 모델을 사용한 결과이며, EXO Labs는 더 큰 모델들도 시험해보았다고 설명합니다. 예를 들어, 15M 모델에서는 초당 1 토큰을 넘는 속도를 기록했습니다. Karpathy의 기여는 Tesla의 AI 디렉터이자 OpenAI의 설립 팀 일원이었던 그의 배경을 고려했을 때 더욱 의미가 있습니다.