[사진: 온라인 카지노 사이트]
[사진: 딥시크]

[디지털투데이 온라인 카지노 사이트리포터] 중국 온라인 카지노 사이트 스타트업 딥시크가 추론 작업에 최적화된 새로운 대규모언어모델(LLM) 제품군인 R1 시리즈를 공개했다.

20일(현지시간) 실리콘앵글에 따르면 이 LLM 라인업의 주력 모델은 R1과 R1-제로로, 전자는 여러 추론 벤치마크에서 오픈온라인 카지노 사이트의 o1을 능가한다고 한다. R1-제로는 덜 강력하지만, 기계학습 연구에서 잠재적인 중요한 발전을 나타낸다.

두 모델 모두 전문가 혼합(MoE) 아키텍처를 사용하며, 각각 6710억 개의 파라미터를 갖추고 있다. MoE 모델은 여러 신경망으로 구성되어 있어, 각기 다른 작업에 최적화되어 있다. 사용자가 프롬프트를 입력하면, 쿼리를 처리할 수 있는 최적의 신경망에 전송하는 라우터라는 메커니즘이 작동한다.

MoE 아키텍처의 가장 큰 장점은 추론 비용을 절감할 수 있다는 점이다. 사용자가 프롬프트를 입력하면, R1과 R1-제로는 6710억 개의 파라미터 중 일부만 활성화해응답을 생성한다.

아울러 R1은 R1-제로의 수정된 학습 워크플로를 사용해 개발된 향상된 버전으로, 감독된 미세 조정을 포함하여 출력 품질을 크게 향상시켰다. 딥시크는 R1을 여러 인기 있는 LLM과 비교한 결과, 여러 벤치마크에서 오픈온라인 카지노 사이트의 o1 모델을 능가했다고 밝혔다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련온라인 카지노 사이트