在當今時代,企業(yè)數(shù)據(jù)增長速度之快毋庸置疑,大數(shù)據(jù)時代可謂真正的來臨。當大家都在絞盡腦汁考慮如何通過對現(xiàn)有數(shù)據(jù)的分析、挖掘來指導企業(yè)決策和創(chuàng)新時,可能忽略了一些事實:企業(yè)的數(shù)據(jù)存在哪里了?管理起來方便嗎?想找數(shù)據(jù)容易嗎?這些數(shù)據(jù)都被很好的保護了嗎?
這讓筆者想起一個形象的比喻,如果把數(shù)據(jù)存儲的各種設備比喻為一間屋子,你是愿意走進來發(fā)現(xiàn)從地板到天花板堆滿了雜亂無章的數(shù)據(jù),還是愿意走近屋子發(fā)現(xiàn)有一個個文件柜,每個文件柜都把數(shù)據(jù)分門別類的放好了?
對于很多企業(yè)來說,不僅對數(shù)據(jù)的管理缺乏章法和有效手段,而且對待數(shù)據(jù)就像“守財奴”一樣,舍不得扔。對于這點,CommVault公司產(chǎn)品管理總監(jiān)Don Foster深有感觸:“幾乎沒有人在管理數(shù)據(jù)的時候愿意點擊刪除鍵,因為他們不知道這個數(shù)據(jù)應該保存多長時間?它是否還有殘余的業(yè)務價值?”他把企業(yè)一股腦地把數(shù)據(jù)存起來的做法稱為“放進了數(shù)據(jù)保險柜”,看上去數(shù)據(jù)放在保險柜里邊很安全,但是這些數(shù)據(jù)沒法被尋找。
CommVault公司產(chǎn)品管理總監(jiān)Don Foster
面對以上這些企業(yè)在進行數(shù)據(jù)管理時面臨的挑戰(zhàn),CommVault所提供的數(shù)據(jù)管理平臺,可以做到對數(shù)據(jù)的感知,細化來看,包括內(nèi)容感知、應用感知、計算感知、存儲感知。也就是可以知道數(shù)據(jù)由誰編制、創(chuàng)造;這個數(shù)據(jù)處于自身生命周期哪個部分;這個數(shù)據(jù)的年齡;這個數(shù)據(jù)存儲在什么地方;應該以什么方式進行訪問;還可以確定數(shù)據(jù)是云端數(shù)據(jù)、駐地數(shù)據(jù)或還是是虛機上的數(shù)據(jù)。
這一數(shù)據(jù)感知特征可以做到對數(shù)據(jù)的360度捕捉,從而為分門別類的管理數(shù)據(jù)奠定基礎。而且這一數(shù)據(jù)感知特征是可以跨平臺進行的,這也就規(guī)避了數(shù)據(jù)各自為政、信息孤島的風險。
CommVault不久前委托IDC對亞太地區(qū)500多位IT高管進行了一項關(guān)于數(shù)據(jù)管理的調(diào)查,結(jié)果顯示,50%以上的企業(yè)沒有對數(shù)據(jù)進行有效的保護。造成這一結(jié)果的原因,除了以上提及的因素之外,企業(yè)面臨著復雜的數(shù)據(jù)存儲環(huán)境也是一個不爭的實時。這一復雜性,不僅包括移動設備的快速增長、BYOD的普及,也包括企業(yè)存儲介質(zhì)從本地逐漸向虛擬環(huán)境、云端遷移。這種種的紛繁復雜,讓企業(yè)面對數(shù)據(jù)管理問題一籌莫展。
對于這些困擾,CommVault中國區(qū)技術(shù)總監(jiān)蔡報永告訴記者:“無論亞太還是中國的企業(yè)客戶,大家都希望打破原來傳統(tǒng)的分離獨立式的管理模式,采用單一的平臺。對所有的數(shù)據(jù)類型,無論對結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)或者半結(jié)構(gòu)化數(shù)據(jù),從單一的平臺入手進行管理,不僅讓管理數(shù)據(jù)更加容易,也讓企業(yè)可以更好地進行數(shù)據(jù)管理發(fā)展趨勢的預測,也可以方便地訪問到想要的訪問數(shù)據(jù)。”
左:中國區(qū)技術(shù)總監(jiān)蔡報永 右:亞太區(qū)高級市場營銷總監(jiān)Daniel CF Ng
這時候CommVault的Simpana就體現(xiàn)出優(yōu)勢了,它借助一個模塊化的通用代碼平臺,提供數(shù)據(jù)的備份、恢復、歸檔、復制、報告和搜索功能。
統(tǒng)一平臺的好處在于:第一防止數(shù)據(jù)丟失,原來分離的系統(tǒng)很難界定哪些數(shù)據(jù)可以被保護;另外當有災難出現(xiàn)的時候,可以把結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)快速恢復;當然對于存儲節(jié)約、網(wǎng)絡優(yōu)化也很重要,因為采用單一結(jié)構(gòu)節(jié)約物理成本、人員成本和管理成本。
針對企業(yè)不同規(guī)模,無論大型企業(yè)還是中小型企業(yè);針對企業(yè)數(shù)據(jù)存儲現(xiàn)狀,無論結(jié)構(gòu)化數(shù)據(jù)占據(jù)主要還是非結(jié)構(gòu)化數(shù)據(jù)占據(jù)主要;抑或是企業(yè)數(shù)據(jù)主要存在PC中、本地數(shù)據(jù)中心或云端,CommVault Simpana的統(tǒng)一平臺的功能都是通用的、標準化的,使用起來沒有任何不同。而蔡報永表示:“其差別可能就在于定價方式和價格策略,比如你可以選擇不同的價格套餐,所享用的服務的時間長短不同。”
他特別強調(diào):對于中小企業(yè)或者當前數(shù)據(jù)量還不大的企業(yè)來說,其實他們同樣需要一個好的數(shù)據(jù)管理解決方案,這就像蓋房子打地基的道理一樣,是確保房屋質(zhì)量的關(guān)鍵。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。