最近,一家名叫DeepSeek的初創公司經由技術迭代與升級,發佈了全新一代大模型,“DeepSeek-V3”。由於這款大模型太過好用,DeepSeek R1 更是直接免費開源,在AI發燒友圈子傳播後,傳到了海外社交平台、技術論壇,引發了海外網友的連連稱讚。
各項效能指標更是和OpenAI-o1 模型不相上下,甚至做到了小部分的超越,關鍵是開源的,我們可以本地部署使用
1、本地部署,我們可以通過LM Studio 來進行安裝
LM Studio官方版下載:
https://lmstudio.ai/
DeepSeek-R1-Distill 模型下載:
顯示卡12GB:
https://www.modelscope.cn/models/lmstudio-community/DeepSeek-R1-Distill-Qwen-14B-GGUF/resolve/master/DeepSeek-R1-Distill-Qwen-14B-Q4_K_M.gguf
DeepSeek-R1-Zero 和 DeepSeek-R1 基於 DeepSeek-V3-Base 進行訓練。
有關模型架構的更多詳細訊息,請參閱DeepSeek-V3存儲庫。