추억의 윈도우98에서 AI 언어 모델 실행

2025년 01월 03일 by Aily

목차

26년 된 PC에서 AI 대형 언어 모델 실행

26년 된 Windows 98의 펜티엄 II PC에서 강력한 AI 대형 언어 모델 실행이 가능하다는 소식을 EXO Labs가 전했습니다. 소셜 미디어에 게시된 짧은 영상에서는 고대의 350MHz 엘로넥스 Pentium II가 윈도우 98을 부팅하고, 커스텀 C 기반 추론 엔진을 작동하는 모습이 소개되었습니다.

이러한 결합은 최신 하드웨어가 없어도 AI 기능을 활용할 수 있음을 보여줍니다.
펜티엄 II는 1997년에 처음 출시되었으며, 당시에는 혁신적이었지만 이제는 대개 노후화된 기술로 간주됩니다.

Llama2.c 기반 엔진 활용

EXO Labs는 Andrej Karpathy의 Llama2.c를 기반으로 한 전용 엔진을 활용했습니다. 이 엔진은 700줄의 C 코드로 이루어져 있으며 Llama 2 구조의 모델에서 추론을 수행할 수 있습니다. 덕분에 Windows 98 호환 실행 파일을 제작할 수 있었습니다.

이 코드는 간결하면서도 강력한 AI 모델을 구축할 수 있는 잠재력을 지니고 있습니다.
Llama2.c는 메모리 효율성을 중시하여 제한된 자원에서 구동이 가능하다는 장점이 있습니다.

EXO Labs의 민주화를 위한 비전

한편, EXO Labs는 AI 접근성을 민주화하겠다는 목표를 가지고 있습니다. 옥스퍼드 대학의 연구자들이 결성한 이 조직은 AI가 소수의 메가코프에 의존하는 것을 방지하고자 합니다.

EXO Labs는 더 많은 사람이 AI 기술에 접근할 수 있도록, 독립적인 연구를 장려하고 있습니다.
이러한 접근은 보다 포용적인 AI 생태계를 조성하는 데 중점을 두고 있습니다.

늘어나는 AI 모델과 속도

블로그에 따르면 260K LLM은 35.9 tok/sec로 실행되었으며, 15M LLM은 1 tok/sec를 넘었습니다. 그러나 Llama 3.2 1B 모델은 0.0093 tok/sec에 불과하여 성능 저하가 느껴졌습니다.

모델 크기와 복잡성에 따라 성능이 크게 달라질 수 있는 점을 강조합니다.
이는 AI 모델의 효율성 배양과 하드웨어 제약을 극복하기 위한 중요한 시사점을 제공합니다.

출처 : 원문 보러가기