DeepSeek論文和模型資源
發(fā)布日期:2025/1/30 10:03:57 瀏覽量:
DeepSeek論文和模型資源
DeepSeek將 DeepSeek-R1 訓(xùn)練技術(shù)全部公開,以期促進(jìn)技術(shù)社區(qū)的充分交流與創(chuàng)新協(xié)作。
論文鏈接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
模型鏈接:https://modelscope.cn/collections/DeepSeek-R1-c8e86ac66ed943
DeepSeek在開源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個 660B 模型的同時,通過 DeepSeek-R1 的輸出,蒸餾了 6 個小模型開源給社區(qū),其中 7B 和 14B 模型在多項(xiàng)能力上實(shí)現(xiàn)了對標(biāo) OpenAI o1-mini 效果、展現(xiàn)了較高的生產(chǎn)環(huán)境部署性價比。
DeepSeek-R1-Distill-Qwen 的不同參數(shù)模型模型鏈接
1.5B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
7B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
14B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
32B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
馬上咨詢: 如果您有業(yè)務(wù)方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗(yàn)積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生
點(diǎn)擊在線閱讀