최근 중국 AI 스타트업 딥시크가 저렴한 비용으로 AI 모델을 개발했다고 발표한 데 이어, 미국 스탠퍼드대와 워싱턴대 연구진이 단 50달러(한화 약 7만 3천 원)로 AI 추론 모델을 개발했다고 밝혀 AI 업계에 파장을 일으키고 있습니다. 연구진이 개발한 ‘s1’이라는 AI 모델은 오픈AI와 딥시크가 개발한 AI 모델과 유사한 성능을 보이며, 저비용 AI 개발 가능성을 시사하고 있습니다.
50달러로 AI 추론 모델 개발…기존 개발 비용의 엄청난 절감
스탠퍼드대와 워싱턴대 연구진은 최근 발표한 연구 논문에서 ‘s1’이라는 AI 모델을 클라우드 컴퓨팅 비용 50달러 이하로 훈련했다고 밝혔는데, 이 모델은 수학 및 코딩 능력 테스트에서 오픈AI의 ‘o1’과 딥시크의 ‘R1’과 필적하는 성능을 보였습니다.
o1은 오픈AI가 2023년 처음 출시한 AI 추론 모델이며, R1은 지난 1월 딥시크가 발표한 모델입니다. 두 모델의 성능은 비슷한 것으로 평가받고 있으며, s1이 이들과 대등한 성능을 보였다는 점에서 연구진의 개발 방식이 상당한 의미를 가집니다.
AI 모델 ‘증류’ 기법 활용해 개발
연구진은 ‘s1’ 개발 과정에서 ‘증류(distillation)’라는 기술적 접근 방식을 활용했다고 설명했습니다. 증류는 기존 AI 모델이 생성한 출력을 학습 데이터로 사용하여 새로운 모델을 훈련하는 방법으로, 성능을 유지하면서도 비용을 절감할 수 있는 기술입니다. 연구진은 s1을 구글의 최신 AI 모델인 ‘제미나이 2.0 플래시 싱킹 익스퍼리멘털(Gemini 2.0 Flash Thinking Experimental)’을 증류하여 개발했습니다.
이는 앞서 딥시크가 AI 모델을 개발할 때 오픈AI의 모델을 증류한 방식과 유사합니다. 딥시크는 이 방법을 통해 오픈AI 챗GPT 개발 비용의 5.6% 수준인 557만 6천 달러(약 80억 원)로 AI 모델을 개발한 것으로 알려졌습니다.
AI 성능 향상을 위한 ‘기다리기’ 전략 적용
연구진은 AI 모델의 성능을 높이기 위해 ‘기다리기(waiting)’ 전략을 적용했다고 밝혔습니다. 이는 AI에게 답변을 생성하기 전 일정한 사고 시간을 부여하는 방식으로, 이를 통해 모델의 응답 정확도를 높일 수 있습니다. 이는 인간이 복잡한 질문에 대해 즉각적으로 답변하기보다 잠시 생각한 후 더 정교한 대답을 내놓는 과정과 유사합니다.
엔비디아 H100 GPU 활용하여 30분만에 훈련
연구진에 따르면 s1의 훈련에는 엔비디아의 첨단 AI 칩인 H100 그래픽처리장치(GPU)가 사용되었으며, 전체 훈련 과정은 30분도 걸리지 않았습니다. 일반적으로 AI 모델을 훈련하는 데 수십억 달러의 비용과 몇 주에서 몇 달이 소요되는 것과 비교하면, s1의 개발 과정은 획기적인 비용 절감과 시간 단축을 이뤘다고 할 수 있습니다.
AI 개발 비용 논란과 빅테크 기업의 전략 변화 필요성 대두
s1과 딥시크의 R1이 저비용으로 개발되면서, 구글, 마이크로소프트(MS), 메타 등 대형 IT 기업들이 AI 인프라 구축에 투자하는 막대한 비용에 대한 회의적인 시각도 등장하고 있습니다. 현재 글로벌 빅테크 기업들은 AI 모델을 개발하기 위해 수십억 달러를 투자하고 있지만, 연구진이 증명한 바와 같이 증류 기법을 활용하면 비용을 획기적으로 절감할 수 있기 때문입니다.
그러나 어ᄄᅠᆫ 전문가들은 증류 방식을 통해 개발된 AI 모델이 기존 모델을 복제하는 데 그칠 뿐, 혁신적인 발전을 이루기는 어렵다고 평가하고 있기도 합니다. 즉, 증류 방식은 원본 AI 모델의 성능을 일부 재현할 수 있지만, 완전히 새로운 개념을 창출하거나 AI의 근본적인 성능을 개선하는 데는 한계가 있다는 것입니다.
구글 AI 서비스 약관 위반 가능성 논란
한편, 연구진이 s1 개발을 위해 구글의 제미나이 2.0을 증류했다는 점에서 구글의 서비스 약관을 위반했을 가능성이 제기되고 있습니다. 구글은 경쟁 서비스 개발을 목적으로 자사의 AI 모델을 사용하는 것을 금지하고 있어, 연구진의 접근 방식이 논란의 중심에 서 있습니다.
결론적으로, s1의 개발은 AI 연구 및 개발 비용 절감 가능성을 실증한 사례로 평가되지만, 증류 방식의 한계와 윤리적 문제도 함께 논의되고 있습니다. 앞으로 AI 업계가 이러한 개발 방식을 어떻게 받아들이고 규제할 것인지가 중요한 논점으로 떠오를 전망입니다.