av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<track id="8hrjw"></track>

<tt id="8hrjw"></tt>

<em id="8hrjw"><th id="8hrjw"></th></em>

首頁
對(duì)話創(chuàng)新
對(duì)話科技行者
機(jī)器人新紀(jì)元
AI論文解讀
聯(lián)系我們

微信掃一掃，關(guān)注公眾號(hào)

科技行者
算力行者

見證連接與計(jì)算的「力量」

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

英特爾DeepSeek大模型

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

作者：科技行者

2025-03-04 15:50

分享至：

本文將在DeepSeek-R1- Distill-Qwen-32B推理場(chǎng)景下，以面向企業(yè)級(jí)應(yīng)用且成本最低可控制在5-6萬元人民幣的4路英特爾銳炫(TM)A770顯卡 + 至強(qiáng)(R)W處理器的解決方案為例，詳細(xì)闡述搭建硬件環(huán)境、配置驅(qū)動(dòng)與軟件、優(yōu)化參數(shù)設(shè)置等步驟，手把手教大家部署和配置這一方案。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-03-04 15:50 ? 科技行者

憑借卓越性能表現(xiàn)與先天開源優(yōu)勢(shì)，DeepSeek正迅速成為全球擴(kuò)展大模型應(yīng)用實(shí)踐的一大“圓心”。作為英特爾在GPU領(lǐng)域的重要布局，英特爾銳炫™顯卡既是游戲黨與視頻生產(chǎn)力工作者的新歡，也可用作計(jì)算卡，對(duì)DeepSeek提供加速支持，為企業(yè)用戶部署相關(guān)AI應(yīng)用提供一條全新的高價(jià)性比實(shí)現(xiàn)路徑。具體來說，就是與英特爾®至強(qiáng)®可擴(kuò)展處理器或英特爾®至強(qiáng)®W處理器搭配，以多卡配置的型態(tài)來運(yùn)行和加速DeepSeek推理任務(wù)。

本文將在DeepSeek-R1- Distill-Qwen-32B推理場(chǎng)景下，以面向企業(yè)級(jí)應(yīng)用且成本最低可控制在5-6萬元人民幣的4路英特爾銳炫™A770顯卡 + 至強(qiáng)®W處理器的解決方案為例，詳細(xì)闡述搭建硬件環(huán)境、配置驅(qū)動(dòng)與軟件、優(yōu)化參數(shù)設(shè)置等步驟，手把手教大家部署和配置這一方案。

1、軟硬件安裝配置與初始化

1.1 硬件安裝配置

圖. 安裝4路英特爾銳炫™ A770顯卡的AI工作站

在BIOS設(shè)置中，將Re-Size BAR Support設(shè)為[Enabled]

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

1.2 軟件安裝配置

安裝操作系統(tǒng)04.1 LTS（鏡像文件可訪問https://old-releases.ubuntu.com/releases/22.04.1/ubuntu-22.04.1-desktop-amd64.iso獲?。?/p>

進(jìn)行硬件驗(yàn)證，你要為每塊 GPU 顯卡都配備足額功耗來保證其工作正常。安裝完操作系統(tǒng)后，可通過以下命令檢查英特爾銳炫™A770顯卡是否正常加載：

~$ lspci | grep 56a0

18:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

36:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

54:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

cc:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

在確保 APT 網(wǎng)絡(luò)已連接，且你的賬號(hào)已具有 sudo 權(quán)限的情況下，需嚴(yán)格按以下步驟安裝驅(qū)動(dòng)程序：

~$ wget -qO - https://repositories.intel.com/gpu/intel-graphics.key | sudo gpg --yes --dearmor --output /usr/share/keyrings/intel-graphics.gpg

~$ echo "deb [arch=amd64,i386 signed-by=/usr/share/keyrings/intel-graphics.gpg] https://repositories.intel.com/gpu/ubuntu jammy/lts/2350 unified" | sudo tee /etc/apt/sources.list.d/intel-gpu-jammy.list

~$ sudo apt update

如果內(nèi)核版本不是5.0-35，則通過以下命令安裝6.5.0-35版本：

~$ sudo apt-get install -y linux-image-6.5.0-35-generic linux-headers-6.5.0-35-generic linux-modules-6.5.0-35-generic linux-modules-extra-6.5.0-35-generic

~$ sudo apt install intel-i915-dkms

~$ sudo vim /etc/default/grub

GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.5.0-35-generic"

~$ sudo update-grub

~$ sudo reboot

然后通過以下命令安裝計(jì)算、媒體和顯示運(yùn)行時(shí)庫(kù)：

~$ sudo apt install -y intel-opencl-icd intel-level-zero-gpu level-zero intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo

通過以下命令將當(dāng)前用戶添加到 render 組：

~$ sudo gpasswd -a $(USER) render

~$ sudo newgrp render

驅(qū)動(dòng)程序安裝完成后，建議使用以下命令進(jìn)行驗(yàn)證：

~$ clinfo | grep "Driver Version"

Driver Version 23.43.27642.67

1.3 在英特爾® 至強(qiáng)® W平臺(tái)上設(shè)置

首先禁用 ast 卡：

~$ sudo vim /etc/modprobe.d/blacklist.conf

在文件底部添加“blacklist ast”：

~$ sudo update-initramfs -u

然后將窗口系統(tǒng)配置為wayland模式：

~$ sudo vim /etc/gdm3/custom.conf

將WaylandEnable設(shè)置為true：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

完成后更新初始RAM文件系統(tǒng)（initramfs）并重啟系統(tǒng)，然后將HDMI線插入第一塊英特爾銳炫™ A770顯卡即可完成顯示終端設(shè)置。

]# sudo update-initramfs -u

~$ sudo reboot

1.4 監(jiān)控工具xpu-smi安裝

可根據(jù)xpumanager repo安裝用于監(jiān)控和管理 XPU設(shè)備狀態(tài)信息的xpu-smi 工具。下載xpumanager并執(zhí)行以下命令：

~$ wget https://github.com/intel/xpumanager/releases/download/V1.2.27/xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb --no-check-certificate

~$ sudo apt install ./xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb

~$ xpu-smi discovery

結(jié)果顯示如下：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

2、大模型服務(wù)與聊天機(jī)器人演示

2.1 容器（Docker）安裝及服務(wù)設(shè)置

用戶可通過 Docker，在英特爾銳炫™ A770顯卡上使用 IPEX-LLM開展 vLLM 服務(wù)。Docker的安裝可參考：https://docs.docker.com/engine/install/ubuntu/
通過以下命令，設(shè)置CPU主頻至最大睿頻，并將顯卡鎖頻至4GHz：

~$ apt-get install linux-tools-6.5.0-35-generic linux-cloud-tools-6.5.0-35-generic

# Query max turbo frequency, like W3445, Max Turbo Frequency is 4.8GHz:

~$ sudo cpupower frequency-set -d 4.8GHz

~$ sudo xpu-smi config -d 0 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 1 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 2 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 3 -t 0 --frequencyrange 2400,2400

2.2 安裝并啟動(dòng)vLLM服務(wù)

下載并安裝以下vllm版本：

~$ docker pull intelanalytics/ipex-llm-serving-xpu:2.2.0-b11

從https://hf-mirror.com下載LLM模型到本地文件夾中（例如：/home/worker/LLM）。
從https://hf-mirror.com/collections/deepseek-ai/deepseek-r1-678e1e131c0169c0bc89728d下載蒸餾版模型。

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

將以下腳本放入/home/intel/Demo-4xArc中的 bachkend-ipex-docker.sh文件（以下操作都以DeepSeek-R1-Distill-Qwen-32B版為例）：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

將以下腳本放入vllm-deepseek-r1-distill-qwen-32b-openaikey.sh文件:

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

然后啟動(dòng)容器和vLLM 服務(wù)：

~$ sudo bash backend-ipex-docker.sh

~$ docker exec -it ipex-llm-b11 bash

~$ cd workspace & bash vllm-deepseek-r1-distill-qwen-32b-openaikey.sh

如下日志表明DeepSeek推理服務(wù)已啟動(dòng)成功：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

2.3 使用Chatbox AI進(jìn)行性能測(cè)試

開發(fā)者可以在本地使用Chatbox AI進(jìn)行LLM推理性能測(cè)試。如為168.10.110，在Windows PowerShell中執(zhí)行以下命令并輸入密碼，將遠(yuǎn)程服務(wù)端口映射到本地：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

User> ssh -L 8001:localhost:8001 worker@192.168.10.110

打開Chatbox AI的Url（https://web.chatboxai.app/）

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

選擇 “User My Own API Key / Local Model”，點(diǎn)擊 “Add Custom Provider”，并根據(jù)下圖所示進(jìn)行配置，手動(dòng)輸入DeepSeek整流的模型名稱等信息：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

由此，使用者可以在Chatbox AI中向大語言模型提問，測(cè)試其推理性能：

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

vllm服務(wù)日志能夠顯示當(dāng)前的性能狀況，如圖中所示，基于多路英特爾銳炫™ A770顯卡的推理服務(wù)一直有著30+ tokens/s的性能表現(xiàn)。

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

創(chuàng)新不止步：全新24GB銳炫™ 顯卡與滿血版DeepSeek R1方案正在路上

本部署指南雖然是圍繞4路英特爾銳炫™ A770顯卡的方案展開，且以DeepSeek-R1-Distill-Qwen-32B版為例，但我們的實(shí)踐探索并未局限于此。

一方面，該解決方案可對(duì)DeepSeek各個(gè)蒸餾版提供同樣靈活的支持。使用者可通過調(diào)整輸入模型名稱，以及設(shè)定并行使用的顯卡數(shù)量來進(jìn)行調(diào)整（使用--tensor-parallel-size參數(shù)來控制）。

成本打到6萬以下，手把手教你用4路銳炫顯卡+至強(qiáng)W跑DeepSeek

另一方面，多路英特爾銳炫™顯卡 + 英特爾®至強(qiáng)®可擴(kuò)展處理器 /至強(qiáng)®W處理器方案的關(guān)鍵目標(biāo)，還是鎖定在DeepSeek- R1-671B這一性能巔峰版本上，其配置與優(yōu)化方法很快就會(huì)與大家見面。預(yù)計(jì)其技術(shù)路徑會(huì)同時(shí)覆蓋基于KTransformer，能更充分發(fā)揮至強(qiáng)® 處理器內(nèi)置AI加速技術(shù)AMX潛能的方案，以及GPU配置密度更高的單機(jī)16路英特爾銳炫™ 顯卡的方案。

另一個(gè)值得期待的進(jìn)展，就是專為生產(chǎn)力應(yīng)用打造的新一代英特爾銳炫™顯卡 B580 24G顯存版本也正向我們走來，其4張卡即可提供96GB的顯存容量，意味著用戶可在單機(jī)中更輕松地部署更大參數(shù)量的DeepSeek服務(wù)（例如DeepSeek- R1-671B版本），進(jìn)而能在實(shí)戰(zhàn)中以較低的成本和較為便捷的部署方式，開啟不縮水的DeepSeek服務(wù)。

英特爾DeepSeek大模型

分享至

0贊

好文章，需要你的鼓勵(lì)

推薦文章

人工智能
動(dòng)態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動(dòng)態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法，讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率，且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置，為AI推理優(yōu)化開辟新路徑。
人工智能
強(qiáng)化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會(huì)"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法，通過"壓縮-擴(kuò)張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示，該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí)，輸出長(zhǎng)度減少46.9%，真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實(shí)時(shí)流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù)，實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新，解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn)，通過讓AI模型學(xué)習(xí)解決幾何問題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集，使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示，幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來顯著提升，其中最佳模型達(dá)到49.6%準(zhǔn)確率，超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動(dòng)態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動(dòng)態(tài)組隊(duì)"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會(huì)"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)新突破：AI模型居然能學(xué)會(huì)"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號(hào) 京ICP備15039648號(hào)-9 京公網(wǎng)安備 11010802021500號(hào)

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn

<thead id="inahg"></thead>

<tt id="inahg"></tt>

<nav id="inahg"><strong id="inahg"></strong></nav>

<table id="inahg"></table>