英偉達掌舵人黃仁勛,在GTC2017上再掀京城“AI風(fēng)云”。
▲ NVIDIA CEO 黃仁勛
上場后“老黃”直接開懟,終于說出了人們憋在心中許久的結(jié)論——摩爾定律已終結(jié)。
▲ 兩股力量推動計算領(lǐng)域的未來
但,NVIDIA的GPU計算為整個行業(yè)指出了前進的道路。
他指出,設(shè)計人員無法再創(chuàng)造出可以實現(xiàn)更高之靈系并行性的CPU架構(gòu);晶體管數(shù)每年增長50%,但CPU的性能每年僅增長10%。而NVIDIA的GPU彌補CPU的不足,加速處理高強度計算負載。
深度學(xué)習(xí)另一大“殺傷性武器”:CUDA
CUDA是一種革命性的計算架構(gòu),它將專用功能ASIC的性能與通用編程模型相結(jié)合,使開發(fā)人員實現(xiàn)多種算法。目前CUDA開發(fā)人員的數(shù)量在5年里增長了14倍超過60萬,下載量達到180萬。
▲ 適用于全球開發(fā)人員的NVIDIA AI
AI是NVIDIA CUDA GPU的“殺手級應(yīng)用”,AI取得驚人進步。
阿里巴巴、百度和騰訊已在各自的云服務(wù)中采用NVIDIA Volta GPU。
華為、浪潮和聯(lián)想已采用NVIDIA基于HGX的GPU服務(wù)器。
此外,NVIDIA還在為全球開發(fā)員人配置強大AI工具,全力推進“統(tǒng)一架構(gòu)”CUDA GPU計算。
AI推理是下一個巨大挑戰(zhàn),重磅發(fā)布 TensorRT 3
AI推理平臺必須具備可編程性,高性能,且支持龐大和復(fù)雜的網(wǎng)絡(luò)。
隨著智能機器的爆發(fā)性增長,AI會將智能注入到2000萬臺云服務(wù)器、上億臺汽車和制造機器人中。所以,AI推理平臺必須可擴展,以解決海量計算的性能、功耗和成本需求。
▲ 宣布NVIDIA TensorRT 3
于是,老黃又來搞事了。
宣布NVIDIA TensorRT 3,全球首款可編程AI推理加速器。
TensorRT是一款適用于CUDA GPU的優(yōu)化神經(jīng)網(wǎng)絡(luò)編譯器,它可利用CUDA深度學(xué)習(xí)指令集創(chuàng)建運行時。從云、數(shù)據(jù)中心、PC、汽車到機器人,TensorRT皆能在NVIDIA全系列平臺便宜出最優(yōu)運行時。
▲ 運行在 V100上的 TensorRT在處理圖像時可實現(xiàn)7ms的延時
運行的Volta上的TensorRT3在圖像分類方面,比最快的CPU還要快40倍,在語言翻譯方面則要快140倍。
搭配 Tesla V100 GPU 加速器的 TensorRT 每秒能夠識別多達 5700 張圖片,而如今所用的 CPU 則每秒僅能識別 140 張圖片。
AI城市是一個巨大的AI推理挑戰(zhàn),它可能需要使用大約1000萬個Tesla V100 GPUs來監(jiān)控10億臺攝像頭。
▲ NVIDIA AI城市-助力中國建設(shè)更智慧、更安全的城市
NVIDIA將攜手??低暪步ˋI城市。此外,大華、華為和阿里巴巴都提供基于NVIDIA平臺的AI視頻解決方案。
AI另一重頭戲:自動駕駛汽車
NVIDIA DRIVE是一個為自動駕駛行業(yè)帶來變革的端到端平臺。NV自動駕駛計算機可以支持L3、L4和L5級。開放軟件棧包含從ASIL-D OS、深度學(xué)習(xí)、計算機視覺 SDK 到自動駕駛應(yīng)用。
▲ 開放的自動駕駛計算平臺
DRIVE AV是NVIDIA開發(fā)的自動駕駛應(yīng)用,環(huán)繞攝像頭、雷達和激光雷達的傳感數(shù)據(jù)融合。多種深度學(xué)習(xí)和計算機視覺將為L4和L5級別自動回家是技術(shù)提供所需的多樣性和冗余性。
目前,145家初創(chuàng)公司正在研制基于NVIDIA DRIVE的自動駕駛汽車、卡車、高清制圖及服務(wù)。
推全球首款自主機器處理器 Xavier
NVIDIA設(shè)計了全球首款自主機器的處理器,命名Xavier。
▲ 全球首款自主機器處理器
它是迄今為止最為復(fù)雜的片上系統(tǒng),將于18年第一季度早期接觸合作伙伴提供,在第四季度全面推出。
京東X選擇 NVIDIA實現(xiàn)其自主機器,采用Jetson平臺。而Xavier將成為下一代Jetson的片上系統(tǒng)(SOC)。
▲ 最后,謝謝各位合作伙伴AND老板們的支持!
老黃Keynote總結(jié):計算新紀元,就是要省錢!
NVIDIA Tesla V100AI平臺已經(jīng)被中國領(lǐng)軍的IT公司采用,包括阿里巴巴、百度、騰訊、華為、浪潮和聯(lián)想。
業(yè)內(nèi)首創(chuàng)的NVIDIA可編程推理加速平臺已被阿里巴巴、百度、騰訊、科大訊飛和京東采用。
NVIDIA AI城市平臺已被阿里巴巴、??低暋⒋笕A和華為采用,以解決最大規(guī)模的AI和推理難題之一。
NVIDIA DRIVE——引領(lǐng)自動駕駛變革的開放平臺,已被145家自動駕駛初創(chuàng)公司采用。
NVIDIA“Xavier”——全球首款自主機器處理器將在第一季度發(fā)布樣片,并將揭開人工智能時代的新篇章。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。