400-638-8808
|
微信公眾號





穩(wěn)定可靠 永不間斷

海外收發(fā) 暢通無阻

協(xié)同辦公 資源管理

超大郵件 超級功能

智能反垃圾郵件技術(shù)
易管理 免維護(hù)

DeepSeek-R1 大模型憑借其強(qiáng)大的推理與深度思考能力,在數(shù)學(xué)計(jì)算、編程及自然語言推理等任務(wù)上表現(xiàn)卓越。然而,在線服務(wù)存在不穩(wěn)定性,同時(shí)數(shù)據(jù)隱私問題也是許多個(gè)人和企業(yè)關(guān)注的焦點(diǎn)。因此,選擇本地部署 DeepSeek-R1 開源模型不僅可以提高穩(wěn)定性,還能保障數(shù)據(jù)安全。
DeepSeek-R1 模型的最大參數(shù)規(guī)模為 671B(6710 億參數(shù)),同時(shí)官方提供 1.5B ~ 70B 版本的蒸餾模型,用戶可根據(jù) 顯存 和 計(jì)算資源 選擇合適的版本:
蒸餾模型介紹:
DeepSeek 提供的 1.5B ~ 70B 小參數(shù)模型是通過 知識蒸餾 生成的,即使用 DeepSeek-R1 大模型 訓(xùn)練較小參數(shù)的模型,使其在大幅降低計(jì)算需求的同時(shí),仍能保留部分推理能力。
量化與存儲需求:
本教程采用 Ollama 作為模型管理框架,該工具可 下載、運(yùn)行、管理 大模型,是目前最便捷的本地推理工具。
本次部署以 8 塊 A800 GPU 為例,配置如下:
成本預(yù)估:
- A100/A800 單張顯卡 價(jià)格約 10 萬元
- 租賃價(jià)格 約 5 元/小時(shí)/卡
- 高端配置可選 H100/H800、H20 等顯卡
檢查顯卡狀態(tài)(Linux 終端命令):
nvidia-smi
Ollama 支持 Windows、MacOS、Linux,安裝步驟如下:
curl -fsSL https://ollama.com/install.sh | sh
安裝成功后,運(yùn)行:
ollama -v
如能正確顯示版本號,則說明安裝成功。
在運(yùn)行 DeepSeek-R1 671B 前,需要調(diào)整 Ollama 運(yùn)行參數(shù) 以優(yōu)化性能:
export OLLAMA_MODELS=/datadisk # 更改模型存儲路徑(默認(rèn) ~/.ollama/models) export OLLAMA_DEBUG=1 # 開啟 debug 日志 export OLLAMA_LOAD_TIMEOUT=120m # 設(shè)置模型加載超時(shí)時(shí)間(默認(rèn) 5 分鐘) export OLLAMA_KEEP_ALIVE=-1 # 讓模型常駐顯存,防止自動卸載 export OLLAMA_SCHED_SPREAD=1 # 多 GPU 均衡調(diào)度 export OLLAMA_NUM_PARALLEL=8 # 允許并發(fā)請求(根據(jù)顯存調(diào)整)
注意事項(xiàng):
- 并發(fā)配置 OLLAMA_NUM_PARALLEL 需根據(jù)顯存情況合理調(diào)整,每增加 1 并發(fā)請求,額外占用 10~15GB 顯存。
- OLLAMA_KEEP_ALIVE=-1 可防止模型 長時(shí)間無訪問 后被卸載。
nohup ollama serve & # 在后臺運(yùn)行 Ollama
tail -f nohup.out
ps -ef | grep ollama
kill -9 <進(jìn)程 ID>
ollama pull deepseek-r1:671b
注意:
nohup ollama run deepseek-r1:671b > run.out 2>&1 < /dev/null &
tail -f run.out
nvidia-smi
加載時(shí)間:
model load progress 1.00 llama runner started in 3770.15 seconds
ollama run deepseek-r1:671b
輸入問題,即可與模型對話。
Ollama 兼容 OpenAI API,本地服務(wù)器監(jiān)聽 0.0.0.0:11434,可用 curl 訪問:
curl --request POST --url http://127.0.0.1:11434/v1/chat/completions --header "Content-Type: application/json;charset=utf-8" \
--data "{
"model": "deepseek-r1:671b", "messages": [ { "role": "user", "content": "你是什么模型" } ] }"
DeepSeek-R1-671B 的 推理速度 取決于 token 長度 與 并發(fā)量。評估方式:
python3 model_stress_test.py
部分測試結(jié)果(tokens/s/req):
| 并發(fā)數(shù) | 速率 |
|---|---|
| 1 | 17.05 |
| 16 | 3.13 |
| 64 | 0.93 |
| 128 | 0.85 |
優(yōu)化方向:
本教程詳細(xì)介紹了 DeepSeek-R1-671B 的本地部署,包括 環(huán)境搭建、下載運(yùn)行、API 調(diào)用及性能優(yōu)化。如果你希望在本地體驗(yàn) 大模型推理,按本教程操作即可快速上手!DeepSeek大模型一體機(jī)部署方案找天下數(shù)據(jù)專注于IDC行業(yè)20多年,經(jīng)驗(yàn)豐富,咨詢電話4--0-0-6-3--8-8-8-0-8 !
產(chǎn)品與服務(wù)
香港服務(wù)器 香港高防服務(wù)器 美國服務(wù)器 韓國服務(wù)器 新加坡服務(wù)器 日本服務(wù)器 臺灣服務(wù)器云服務(wù)器
香港云主機(jī) 美國云主機(jī) 韓國云主機(jī) 新加坡云主機(jī) 臺灣云主機(jī) 日本云主機(jī) 德國云主機(jī) 全球云主機(jī)高防專線
海外高防IP 海外無限防御 SSL證書 高防CDN套餐 全球節(jié)點(diǎn)定制 全球?qū)>GPLC關(guān)于我們
關(guān)于天下數(shù)據(jù) 數(shù)據(jù)招商加盟 天下數(shù)據(jù)合作伙伴 天下數(shù)據(jù)團(tuán)隊(duì)建設(shè) 加入天下數(shù)據(jù) 媒體報(bào)道 榮譽(yù)資質(zhì) 付款方式關(guān)注我們
微信公眾賬號
新浪微博
天下數(shù)據(jù)手機(jī)站 關(guān)于天下數(shù)據(jù) 聯(lián)系我們 誠聘英才 付款方式 幫助中心 網(wǎng)站備案 解決方案 域名注冊 網(wǎng)站地圖
天下數(shù)據(jù)18年專注海外香港服務(wù)器、美國服務(wù)器、海外云主機(jī)、海外vps主機(jī)租用托管以及服務(wù)器解決方案-做天下最好的IDC服務(wù)商
《中華人民共和國增值電信業(yè)務(wù)經(jīng)營許可證》 ISP證:粵ICP備07026347號
朗信天下發(fā)展有限公司(控股)深圳市朗玥科技有限公司(運(yùn)營)聯(lián)合版權(quán)
深圳總部:中國.深圳市南山區(qū)深圳國際創(chuàng)新谷6棟B座10層 香港總部:香港上環(huán)蘇杭街49-51號建安商業(yè)大廈7樓
7×24小時(shí)服務(wù)熱線:4006388808香港服務(wù)電話:+852 67031102
本網(wǎng)站的域名注冊業(yè)務(wù)代理北京新網(wǎng)數(shù)碼信息技術(shù)有限公司的產(chǎn)品