본문 바로가기
오늘의 이슈

중국의 DeepSeek, 글로벌 기술을 뒤흔든 후 주장에 대한 의문 제기

by 오늘은 무슨 일이 일어나고 있나요? 2025. 1. 29.
반응형

 

 

딥시크

 

딥시크

 

 

 

딥시크딥시크 딥시크

 

Elon Musk 와 Palmer Luckey는  중국 스타트업이 주장하는 예산과 칩 사용에 의문을 제기하였습니다.

 

딥시크
중국의 DeepSeek는 대담한 주장이 조사에 맞설 수 있는지에 대한 의문에 직면해 있습니다 [그렉 베이커/AFP]

 

DeepSeek에 대한 의문

구글과 OpenAI의 창작물에 필적하는 기능을 갖춘 AI 모델로 충격파를 일으킨 중국의 DeepSeek는 여러가지 의문에 직면해 있습니다.

 
 
 
 
 
 
 
 

 
 
딥시크
Elon Musk가 2025년 1월 20일 워싱턴 DC에서 열린 대통령 취임식 퍼레이드 행사에서 연설하고 있습니다 [맷 루크/AP]

 

도널드 트럼프 미국 대통령의 최측근 중 한 명인 기술 억만장자 엘론 머스크는 왕의 주장에 대한 게시물 아래 X에 "분명히"라는 글을 올리며 딥시크의 회의론자들을 지지했습니다.

딥시크는 논평 요청에 응답하지 않았습니다.

하지만 이전 딥시크 모델을 개발한 박사 과정 지원자 왕지한은 "대화는 저렴하다"며 스타트업의 비평가들에게 반격했습니다

왕은 딥시크의 주장을 액면 그대로 받아들여서는 안 된다는 알자지라의 질문에 대해 X에 대해 "비판하기 쉽습니다."라고 답했습니다.

왕은 유휴 대화에 참여하는 사람들에 대한 중국어 관용구를 영어로 번역하여 "코드 작업에 더 많은 시간을 할애하고 딥시크 아이디어를 직접 재현한다면 종이 위에서 이야기하는 것보다 더 나을 것"이라고 덧붙였습니다.

 

그는 딥시크가 600만 달러 미만을 지출하고 R1의 기본 모델을 훈련하는 데 덜 발전된 칩을 사용했다고 생각하는지에 대한 질문에는 직접 답변하지 않았습니다.

2023년 중국 매체 웨이브와의 인터뷰에서 량(Liang)은 당시 조 바이든 미국 대통령 행정부가 수출을 금지하기 전에 회사가 H800보다 오래된 엔비디아의 A100 칩 10,000개를 비축했다고 말했습니다.

 

R1의 한계

R1 사용자들은 또한 1989년 천안문 광장 학살과 대만의 지위 등 중국에서 발생한 R1의 기원으로 인해 직면한 한계를 지적합니다.

딥시크가 미국 기술 섹터에 미칠 수 있는 잠재적 영향에 대한 초기 공포가 사라지기 시작했다는 신호로 화요일 엔비디아의 주가는 9% 가까이 회복했습니다.

기술주 중심의 나스닥 100 지수는 전날 3% 이상 하락한 후 1.59% 상승했습니다.

 

퀸즐랜드 대학교의 AI 전문 교수인 팀 밀러는 딥시크의 주장에 얼마나 많은 주식을 투자해야 하는지 말하기 어렵다고 말했습니다.

밀러는 알자지라와의 인터뷰에서 "모델 자체는 작동 방식에 대한 몇 가지 세부 사항을 제공하지만, 그들이 주장하는 주요 변경 사항의 비용이 -제가 이해하기로는- 모델 자체에 '등장'하는 것은 아닙니다."라고 말했습니다.

밀러는 "경종"을 본 적이 없다고 말했지만, 연구 논문을 신뢰하는 것에 대해서는 찬성과 반대 모두 합리적인 논거가 있다고 말했습니다.

"이 돌파구는 놀랍습니다. 거의 '사실이라고 하기에는 너무 좋은' 스타일입니다. 비용 분석은 불분명합니다."라고 Miller는 말합니다.

 

반면에 그는 컴퓨터 과학에서 돌파구가 가끔 발생한다고 말했습니다.

밀러는 "이러한 대규모 모델은 매우 최근의 현상이기 때문에 효율성을 찾을 수밖에 없습니다."라고 말했습니다.

"다른 사람들이 복제하기에 비교적 간단할 것이라는 것을 알고 있었다면, 만약 그들이 모두 b**********라면 어리석게 보일 것이라는 것을 알았을 것입니다. 이미 작품을 복제하기 위해 노력하는 팀이 있습니다."

 

비용 하락

 

비영리 단체인 CivAI의 공동 창립자 루카스 한센은 딥시크가 미국의 수출 통제를 우회했는지 여부는 알기 어려웠지만, 이 스타트업이 주장한 교육 예산은 R1 자체가 아닌 OpenAI의 GPT-4와 거의 동등한 수준인 V3를 언급했다고 말했습니다.

"GPT-4는 2022년 말에 훈련을 마쳤습니다. 2022년 이후 알고리즘과 하드웨어가 많이 개선되어 GPT-4 클래스 모델 훈련 비용이 감소했습니다. GPT-2도 비슷한 상황이 발생했습니다. 당시에는 훈련이 심각한 작업이었지만 이제는 90분 만에 20달러에 훈련할 수 있습니다."라고 한센은 알 자지라와의 인터뷰에서 말했습니다.

한센은 "딥시크는 기본 모델인 V3를 사용하여 그 기본 모델이 더 신중하게 생각할 수 있도록 몇 가지 영리한 방법을 적용하여 R1을 만들었습니다."라고 덧붙였습니다.

"이 교육 과정은 기본 모델을 교육하는 비용에 비해 상대적으로 저렴합니다. 이제 DeepSeek이 기본 모델을 사고 모델로 부트스트랩하는 방법에 대한 세부 정보를 발표했으니, 수많은 새로운 사고 모델을 보게 될 것입니다."

 

☞ 딥시크 이용자에 대한 개인정보 주의보

딥시크 이용자의 개인정보를 딥시크가 과도하게 요구하고 있으며 이것은 그대로 딥시크 개발사에서 관리하는 것으로 알려져 있어 이용자들의 주의가 필요하다고 합니다.

 

 

 

 

 

반응형