![메이저카지노(deepseek) [사진: 셔터스톡]](https://cdn.digitaltoday.co.kr/news/photo/202501/551271_515500_2133.jpg)
[디지털투데이 황치규 기자] 중국 메이저카지노 기업 딥시크가 오픈메이저카지노와 맞먹는 성능을 제공하는 메이저카지노 모델을 아주 저렴하게 개발하며 글로벌 생성형 메이저카지노판에서 단숨에 유력 플레이어로 부상했다.
딥시크 모바일앱은 미국 애플 앱스토어 다운로드 랭킹에서 1위에 올랐고 저렴한 가격에 매력을 느껴 오픈메이저카지노 대신 딥시크 메이저카지노 모델을 쓰려는 회사들이 늘고 있다. 유력 메이저카지노 기업들들도 딥시크를 예의주시하는 모습이다.
딥시크가 최근 오픈메이저카지노 추론 모델 o1과 경쟁할 만한 R1까지 내놓자 비용의 비밀에 대한 관심이더욱 커지는 모양새다.
오픈메이저카지노 o1과 딥시크 R1 모두 비즈니스 계획 작성이나 십자말풀이 퀴즈 등과 같은 추론 기반 작업들을 수행할 수 있다.
추론 모델은 기존 거대언어모델(LLM) 대비 컴퓨팅 파워를 더 많이 쓰는 것으로 알려져 있는데, 딥시크는 그렇게 하지 않고도 나름 괜찮은 성능을 구현했다.
월스트리트저널(WSJ), 뉴욕타임스 등 외신들에 따르면 딥시크는 이를 위해 모델 학습에 들어가는 데이터 처리를 줄여 비용과 컴퓨팅 파워를 크게 줄였다. 여기에 더해 전문가 혼합(mixture of experts, MoE) 모델도 적극 활용했다.
MoE는 모델 하나가 모든 작업을 처리하는 대신 사용자 프롬프트(지시문구)를 특정 분야 전문가 모델들에 연결하는 방식이다. 전문가 모델의 경우 학습을 덜 필요로 하는 만큼 상대적으로 적은 메이저카지노 칩으로 구현이 가능하다.
MoE는 메이저카지노 세계에서 새로운 개념은 아니다. 딥시크 외에 이미 여러 회사들이 MoE 기법을 활용 중이다. 그럼에도 딥시크는 대규모로 MoE를 구현했다는 점에서 주목할 만 하다는 평가다.
뉴욕타임스는 미국 메이저카지노 엔지니어들을 인용해 "딥시크 연구 논문이 더 적은 칩으로 인공지능 기술을 구축하는 인상적인 방법을 제시했다. 메이저카지노 칩으로 데이터를 보다 효율적으로 분석하는 방법을 보여줬다"면서 "MoE의 경우 모델들 간 정보가 이동하는 과정에서 효율성이 떨어질 수 있는데, 컴퓨팅 파워를 덜 사용하는 방식으로 이를 구현했다"고 전했다.
딥시크는 첨단 엔비디아 GPU칩을 쓰지 않고 저렴한 비용으로 오픈메이저카지노와 동급 메이저카지노 모델을 개발했다는 점을 강조한다.
딥시크 엔지니어들은 R1에 앞서 선보인 오픈소스 LLM인 V3 구축에 들어간 순수 컴퓨팅 파워는 600만달러 정도였다고 하는데, 이는 연구 및 실험에 들어간 비용은 무시한 것이라고 번스타인 리서치의 스테이시 라스콘 애널리스트는 지적했다.
딥시크가 R1 모델에 컴퓨팅 파워를 얼마나 썼는지는 분명치 않다. 반면 오픈메이저카지노는 GPT-4 학습에 1억달러 이상, 차세대 메이저카지노 모델에는 10억달러 이상을 투입할 것으로 전망된다. 과장돼 있는 측면이 어느정도 있음을 감안하더라도 딥시크가 매우 적은 비용으로 메이저카지노 모델을 개발한 것은 분명해 보인다.
디인포메이션에 따르면 비용을 이유로 R1를 사용하는 기업들이 적지 않다. 기업 데이터 제공 업체 줌인포는 오픈메이저카지노 o1에서 R1으로 바꿨는데, 이미 특정 메이저카지노 비용을 3분의 2 수준까지 줄일 수 있다고 보고 있다.
메이저카지노 검색엔진 퍼플렉시티도 사용자들에게 RI을 사용할 수 있는 옵션을 제공하고 있다. 생산성 소프트웨어 기업 노션의 이반 자오 CEO도 이메일을 통해 새로운 기능들에 딥시크 모델들을 앤트로픽이나 오픈메이저카지노 등과 함께 쓸 것인지 검토하고 있다고 밝혔다고 디인포메이션은 전했다.
효율적으로 개발했음에도 성능 측면에서 R1은 오픈메이저카지노 모델에 뒤지지 않는다는 평가다. 딥시크 측은 오픈메이저카지노 상위 메이저카지노 모델들을 상대로 R1에 대한 테스트를 진행했는데, R1은 오픈메이저카지노 o1과 비교해 대등한 성능을 보였고 좀더 먼저 나온 o1 미니 모델은 능가했다는입장이다.
이와 관련해 WSJ은 일부 사용자들을 인용해 R1과 글쓰기와 문제 해결 스킬이 인상적이지만 특정 유형 문제 해결에선 오픈메이저카지노 o1 같은 경쟁 모델들에 비해 성능이 떨어진다고 전했다.
R1의 경우 추론으로 내놓은 결과물을 소형 메이저카지노 모델 학습에도 활용할 수 있다. 오픈소스 커뮤니티는 이미 스마트폰과 태블릿에서도 쓸 수 있을 만큼, 크기를 줄인 R1 모델을 선보이고 있다고 WSJ이 메이저카지노 스타트업 린 퀴아오 파이어웍스메이저카지노 CEO를 인용해 전했다.
하지만 딥시크가 오픈메이저카지노와 계속 비슷한 급으로남아 있을지는 미지수다. 오픈메이저카지노는차세대 추론 모델인 o3를 선보였다. 일반에는 아직 출시되지 않은 o3는 수학, 과학, 컴퓨터 프로그래밍과 관련된 문제들을 추론하도록 설계됐다. 표준 벤치마크 테스트들에서 o3 시중에 나와 있는 다른 모델들보다 우수한 성능을 보였다.
딥시크가 오픈소스 전략을 취하고 있다는 점도 주목된다.
딥시크는 자사 메이저카지노 모델을 오픈소스로 제공한다. 딥시크는 R1 모델 가중치(weights)나 수치적인 매개변수(numerical parameters)를 공개해 누구나 다운로드해 수정할 수 있도록 했지만 학습 데이터는 공개하지 않았다. 때문에 완전한 오픈소스로 보기는 어렵다.
대신 딥시크는 모델을 어떻게 학습했는지 설명하는 보고서를 발표했는데, 메이저카지노 전문가들은 개발자들이 딥시크가 어떻게 혁신을 이뤘는지 이해하는데 유용하다고 말하고 있다고 WSJ은 전했다. 뉴욕타임스도 전문가들을 인용해 중국이 오픈소스 메이저카지노 분야에서 앞서 나가고 있다는 점을 우려하고 있다고 전했다.