CNET科技資訊網(wǎng) 5月25日 北京消息(文/齊豐潤(rùn)): 隨著信息技術(shù)的發(fā)展,如今,信息爆炸已成為常態(tài),對(duì)于所有企業(yè)來(lái)說(shuō),數(shù)據(jù)的管理和維護(hù)都已經(jīng)成為了一項(xiàng)十分重要且關(guān)系到企業(yè)健康發(fā)展的工作。近日,Veritas發(fā)布了《數(shù)據(jù)冰山報(bào)告》,根據(jù)報(bào)告顯示,當(dāng)前全球企業(yè)存儲(chǔ)的數(shù)據(jù)中,52%的數(shù)據(jù)為價(jià)值尚不明確的暗數(shù)據(jù),33%的數(shù)據(jù)屬于對(duì)企業(yè)沒(méi)有價(jià)值的冗余、過(guò)期或不重要的陳舊數(shù)據(jù)。每年,企業(yè)都會(huì)在數(shù)據(jù)管理上投入大量的財(cái)力和精力,而這85%的數(shù)據(jù)對(duì)這些投入都造成了極大的浪費(fèi)。
同時(shí),報(bào)告還指出對(duì)于那些擁有1,000TB數(shù)據(jù)的普通中型企業(yè)來(lái)講,企業(yè)每年存儲(chǔ)非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的成本將超過(guò)400萬(wàn)元人民幣。
據(jù)悉,Veritas發(fā)布的全球《數(shù)據(jù)冰山報(bào)告》基于對(duì)22個(gè)國(guó)家、地區(qū)中的2500多名IT專(zhuān)業(yè)人士進(jìn)行調(diào)研而成。在此之前,Veritas就在之前發(fā)布的《數(shù)據(jù)基因指數(shù)》報(bào)告中指出,40%以上的企業(yè)存儲(chǔ)數(shù)據(jù)在三年內(nèi)未曾修改,屬于“過(guò)期”數(shù)據(jù)。本次發(fā)布的《數(shù)據(jù)冰山報(bào)告》也證實(shí),企業(yè)IT領(lǐng)導(dǎo)層已經(jīng)認(rèn)識(shí)到數(shù)據(jù)囤積的問(wèn)題。這兩份業(yè)內(nèi)領(lǐng)先的調(diào)研報(bào)告從員工角度和文件系統(tǒng)現(xiàn)狀出發(fā),希望能夠同時(shí)幫助企業(yè)應(yīng)對(duì)當(dāng)前嚴(yán)峻的數(shù)據(jù)增長(zhǎng)態(tài)勢(shì),促使他們采取行動(dòng)。
報(bào)告中提及,全球約52%的企業(yè)存儲(chǔ)數(shù)據(jù)為暗數(shù)據(jù)(Dark Data)或陳舊數(shù)據(jù) (ROT Data)。中國(guó)位居世界第10名,暗數(shù)據(jù)比例為54.5%,比全球平均水平高2.5%。在純凈數(shù)據(jù)和已標(biāo)記為關(guān)鍵業(yè)務(wù)數(shù)據(jù)方面,與15%的全球平均水平相比,排名前三的國(guó)家分別為中國(guó) (25%)、以色列 (24%) 以及巴西 (22%)。由此可以看出,超過(guò)75%的中國(guó)企業(yè)數(shù)據(jù)為暗數(shù)據(jù)或?qū)I(yè)務(wù)而言毫無(wú)價(jià)值的陳舊數(shù)據(jù)。
細(xì)分原因,造成大量暗數(shù)據(jù)與陳舊數(shù)據(jù)出現(xiàn)的原因除了數(shù)據(jù)的量級(jí)越來(lái)越大之外,數(shù)據(jù)囤積文化以及員工對(duì)待數(shù)據(jù)冷漠的態(tài)度也成為了十分重要的原因。
在全球企業(yè)中,平均有26.5%的員工會(huì)在工作設(shè)備中存儲(chǔ)個(gè)人數(shù)據(jù)。從員工遵從企業(yè)數(shù)據(jù)策略方面看,中國(guó)排名居中,員工在工作設(shè)備上存儲(chǔ)個(gè)人數(shù)據(jù)的比例為26%。由于企業(yè)中存儲(chǔ)的大部分?jǐn)?shù)據(jù)是暗數(shù)據(jù),IT人員無(wú)法分辨出哪些數(shù)據(jù)擁有業(yè)務(wù)價(jià)值。
在中國(guó),員工將企業(yè)網(wǎng)絡(luò)用于個(gè)人的情況越發(fā)普遍,這導(dǎo)致企業(yè)存儲(chǔ)資源中,個(gè)人法律和ID文檔比率占68%、照片文件占64%,而未經(jīng)批準(zhǔn)的軟件則占32%。雖然這些內(nèi)容看上去無(wú)關(guān)緊要,但部分文件也許會(huì)觸犯數(shù)據(jù)隱私或造成潛在版權(quán)隱患。
Veritas公司大中華區(qū)總裁蕭建生表示:“企業(yè)解決‘數(shù)據(jù)冰山’現(xiàn)狀的首要舉措是去認(rèn)識(shí)并了解所存在的數(shù)據(jù)囤積文化。當(dāng)下,中國(guó)企業(yè)迫切需要掌控他們的‘數(shù)據(jù)冰山’,并發(fā)現(xiàn)數(shù)據(jù)中的業(yè)務(wù)價(jià)值和風(fēng)險(xiǎn)。企業(yè)應(yīng)該根據(jù)數(shù)據(jù)保留策略對(duì)數(shù)據(jù)進(jìn)行分類(lèi),目前,中國(guó)僅有19%的企業(yè)采用基于數(shù)據(jù)保留策略進(jìn)行數(shù)據(jù)分類(lèi)這樣的舉措。我們可以看到,企業(yè)對(duì)實(shí)施有效的暗數(shù)據(jù)信息治理的需求呈現(xiàn)出上升的態(tài)勢(shì)。”
隨著云服務(wù)產(chǎn)品的興起,許多企業(yè)都選擇將自己的數(shù)據(jù)向云上遷移,而這也加劇了“數(shù)據(jù)冰山”現(xiàn)象的產(chǎn)生。2016年,云服務(wù)和云技術(shù)的利用率將從33%增長(zhǎng)至46%,Veritas預(yù)計(jì)到2016年底,中國(guó)將有約47%的數(shù)據(jù)遷移至云。Veritas認(rèn)為,數(shù)據(jù)的云遷移只是將問(wèn)題越推越遠(yuǎn),為企業(yè)增加更多未經(jīng)分類(lèi)的暗數(shù)據(jù)。
而針對(duì)這些潛在的威脅,企業(yè)們應(yīng)當(dāng)如何做好對(duì)策和防范也成為了一個(gè)相當(dāng)重要的課題。首先是觀念上的改變,并不是越多的數(shù)據(jù)就會(huì)帶來(lái)越多的價(jià)值,通過(guò)技術(shù)手段發(fā)現(xiàn)并整理暗數(shù)據(jù)以及陳舊數(shù)據(jù)才會(huì)為企業(yè)保持健康,創(chuàng)造更多價(jià)值。
除此之外,制定最適合企業(yè)自身的數(shù)據(jù)規(guī)范,有公司高層制定可行的信息策略,也是消除數(shù)據(jù)冰山現(xiàn)象的可行之路。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。