CNET科技資訊網(wǎng) 5月25日 北京消息(文/齊豐潤): 隨著信息技術(shù)的發(fā)展,如今,信息爆炸已成為常態(tài),對于所有企業(yè)來說,數(shù)據(jù)的管理和維護都已經(jīng)成為了一項十分重要且關(guān)系到企業(yè)健康發(fā)展的工作。近日,Veritas發(fā)布了《數(shù)據(jù)冰山報告》,根據(jù)報告顯示,當前全球企業(yè)存儲的數(shù)據(jù)中,52%的數(shù)據(jù)為價值尚不明確的暗數(shù)據(jù),33%的數(shù)據(jù)屬于對企業(yè)沒有價值的冗余、過期或不重要的陳舊數(shù)據(jù)。每年,企業(yè)都會在數(shù)據(jù)管理上投入大量的財力和精力,而這85%的數(shù)據(jù)對這些投入都造成了極大的浪費。
同時,報告還指出對于那些擁有1,000TB數(shù)據(jù)的普通中型企業(yè)來講,企業(yè)每年存儲非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的成本將超過400萬元人民幣。
據(jù)悉,Veritas發(fā)布的全球《數(shù)據(jù)冰山報告》基于對22個國家、地區(qū)中的2500多名IT專業(yè)人士進行調(diào)研而成。在此之前,Veritas就在之前發(fā)布的《數(shù)據(jù)基因指數(shù)》報告中指出,40%以上的企業(yè)存儲數(shù)據(jù)在三年內(nèi)未曾修改,屬于“過期”數(shù)據(jù)。本次發(fā)布的《數(shù)據(jù)冰山報告》也證實,企業(yè)IT領(lǐng)導(dǎo)層已經(jīng)認識到數(shù)據(jù)囤積的問題。這兩份業(yè)內(nèi)領(lǐng)先的調(diào)研報告從員工角度和文件系統(tǒng)現(xiàn)狀出發(fā),希望能夠同時幫助企業(yè)應(yīng)對當前嚴峻的數(shù)據(jù)增長態(tài)勢,促使他們采取行動。
報告中提及,全球約52%的企業(yè)存儲數(shù)據(jù)為暗數(shù)據(jù)(Dark Data)或陳舊數(shù)據(jù) (ROT Data)。中國位居世界第10名,暗數(shù)據(jù)比例為54.5%,比全球平均水平高2.5%。在純凈數(shù)據(jù)和已標記為關(guān)鍵業(yè)務(wù)數(shù)據(jù)方面,與15%的全球平均水平相比,排名前三的國家分別為中國 (25%)、以色列 (24%) 以及巴西 (22%)。由此可以看出,超過75%的中國企業(yè)數(shù)據(jù)為暗數(shù)據(jù)或?qū)I(yè)務(wù)而言毫無價值的陳舊數(shù)據(jù)。
細分原因,造成大量暗數(shù)據(jù)與陳舊數(shù)據(jù)出現(xiàn)的原因除了數(shù)據(jù)的量級越來越大之外,數(shù)據(jù)囤積文化以及員工對待數(shù)據(jù)冷漠的態(tài)度也成為了十分重要的原因。
在全球企業(yè)中,平均有26.5%的員工會在工作設(shè)備中存儲個人數(shù)據(jù)。從員工遵從企業(yè)數(shù)據(jù)策略方面看,中國排名居中,員工在工作設(shè)備上存儲個人數(shù)據(jù)的比例為26%。由于企業(yè)中存儲的大部分數(shù)據(jù)是暗數(shù)據(jù),IT人員無法分辨出哪些數(shù)據(jù)擁有業(yè)務(wù)價值。
在中國,員工將企業(yè)網(wǎng)絡(luò)用于個人的情況越發(fā)普遍,這導(dǎo)致企業(yè)存儲資源中,個人法律和ID文檔比率占68%、照片文件占64%,而未經(jīng)批準的軟件則占32%。雖然這些內(nèi)容看上去無關(guān)緊要,但部分文件也許會觸犯數(shù)據(jù)隱私或造成潛在版權(quán)隱患。
Veritas公司大中華區(qū)總裁蕭建生表示:“企業(yè)解決‘數(shù)據(jù)冰山’現(xiàn)狀的首要舉措是去認識并了解所存在的數(shù)據(jù)囤積文化。當下,中國企業(yè)迫切需要掌控他們的‘數(shù)據(jù)冰山’,并發(fā)現(xiàn)數(shù)據(jù)中的業(yè)務(wù)價值和風險。企業(yè)應(yīng)該根據(jù)數(shù)據(jù)保留策略對數(shù)據(jù)進行分類,目前,中國僅有19%的企業(yè)采用基于數(shù)據(jù)保留策略進行數(shù)據(jù)分類這樣的舉措。我們可以看到,企業(yè)對實施有效的暗數(shù)據(jù)信息治理的需求呈現(xiàn)出上升的態(tài)勢。”
隨著云服務(wù)產(chǎn)品的興起,許多企業(yè)都選擇將自己的數(shù)據(jù)向云上遷移,而這也加劇了“數(shù)據(jù)冰山”現(xiàn)象的產(chǎn)生。2016年,云服務(wù)和云技術(shù)的利用率將從33%增長至46%,Veritas預(yù)計到2016年底,中國將有約47%的數(shù)據(jù)遷移至云。Veritas認為,數(shù)據(jù)的云遷移只是將問題越推越遠,為企業(yè)增加更多未經(jīng)分類的暗數(shù)據(jù)。
而針對這些潛在的威脅,企業(yè)們應(yīng)當如何做好對策和防范也成為了一個相當重要的課題。首先是觀念上的改變,并不是越多的數(shù)據(jù)就會帶來越多的價值,通過技術(shù)手段發(fā)現(xiàn)并整理暗數(shù)據(jù)以及陳舊數(shù)據(jù)才會為企業(yè)保持健康,創(chuàng)造更多價值。
除此之外,制定最適合企業(yè)自身的數(shù)據(jù)規(guī)范,有公司高層制定可行的信息策略,也是消除數(shù)據(jù)冰山現(xiàn)象的可行之路。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學和政治爭議提供更全面客觀的分析,已在生物醫(yī)學和國際關(guān)系領(lǐng)域驗證有效性。
清華大學研究團隊首次提出情感認知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學研究團隊通過創(chuàng)新的多智能體強化學習方法,讓AI在戰(zhàn)略游戲中學會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學習過程培養(yǎng)真正智能AI的新路徑。