-
딥시크 R1 리포트 번역 정리(DeepSeek-R1: 강화 학습을 통한 대규모 언어 모델의 추론 능력 유도)정보교육 2025. 1. 28. 22:52
https://docs.google.com/document/d/1drd1KUzpATFZKhT4Rabj84oK2-i3y_2IrnubOx4KQNU/edit?usp=sharing
DeepSeek-R1: 강화 학습을 통한 대규모 언어 모델의 추론 능력 유도
DeepSeek-R1: 강화 학습을 통한 대규모 언어 모델의 추론 능력 유도 요약 우리는 첫 번째 세대의 추론 모델인 DeepSeek-R1-Zero와 DeepSeek-R1을 소개합니다. 사전 단계로 감독된 세밀 조정(SFT) 없이 대규모
docs.google.com
'정보교육' 카테고리의 다른 글
딥시크(DeepSeek) r1 내 컴퓨터에 설치하기 (0) 2025.01.27 ChatGPT 4o with canvas (0) 2024.11.09