AI初創(chuàng)企業(yè)主要分為兩種風格,我們將在今天的文章中,對二者做出分析與展望。
當下,AI初創(chuàng)企業(yè)正在快速涌現。根據斯坦福大學AI指數報告數據,自2014年以來,已經有超過15798家AI初創(chuàng)拿到超過40萬美元的投資。正如CB Insights公布的結果,AI初創(chuàng)企業(yè)在2019年吸引到創(chuàng)紀錄的266億美元投資。鑒于統(tǒng)計數據的指數級增長,投資者與企業(yè)家都迫切希望借AI的東風扶搖直上。
▲ 圖片來源/斯坦福大學AI指數報告,88頁
然而,AI初創(chuàng)企業(yè)擁有自己的分類方式。本文將主要研究垂直與橫向AI初創(chuàng)企業(yè)之間的區(qū)別與共性。以下提出的見解,基于一家硅谷風險投資商、一家柏林AI風投工作室以及一位AI創(chuàng)業(yè)者的共同討論。
要理解垂直與橫向AI產品,我們首先需要明確AI產品的開發(fā)主題。
每一款基于AI技術的產品,都擁有大致相同的工作流程。在各個機器學習項目中,團隊都需要收集及準備數據、開發(fā)模型、部署模型、監(jiān)控模型性能等。以下列出的CRISP-DM模型描述了機器學習的一般工作流程。
▲ 圖片來源/Uni Dresden
要辨別垂直與橫向AI初創(chuàng)企業(yè)的區(qū)別,首先要對數據科學工作流擁有清晰的了解。垂直AI初創(chuàng)企業(yè)需要擁有「完整的工作流」以交付最終產品,橫向AI初創(chuàng)企業(yè)則專注于打造「通用的數據科學工作流」中的特定環(huán)節(jié)。
“垂直AI初創(chuàng)企業(yè)”提供基于AI的產品,其擁有完整的工作流,以解決針對性較強的客戶需求。這些初創(chuàng)企業(yè)以端到端方式開發(fā)完整產品,業(yè)務鏈貫穿從「商業(yè)案例」到「產品性能監(jiān)控」等各個步驟。
以Vara公司為例,這是一家典型的垂直AI初創(chuàng)企業(yè),使用AI技術,通過X光片識別乳腺癌癥狀。Vara是第一家獲得美國聯(lián)邦政府批準,可利用其AI解決方案協(xié)助放射科醫(yī)師處理日常診斷的企業(yè)。該公司擁有自己完整的數據科學工作流,并以此為基礎提供基于AI的創(chuàng)新產品。
AI是一種強大的工具,能夠幫助企業(yè)在特定應用場景當中,實現超越人類的效能水平。AI也為交付新產品、改進現有產品或自動執(zhí)行任務,開辟了新的可能性。垂直AI初創(chuàng)企業(yè)能夠針對特定用例優(yōu)化預測結果,而一旦獲得成功,他們在對應用例中的表現將遠超人類或者其他AI競爭對手。
“垂直AI初創(chuàng)企業(yè)中聚集著來自各個領域的專家,他們這里出任關鍵職位(例如產品角色)。例如,一家制造自動癌癥檢測產品的企業(yè),可能會聘用放射科醫(yī)師及/或腫瘤科醫(yī)師。” ——創(chuàng)業(yè)企業(yè)家Sahar Mor
但是,垂直AI初創(chuàng)企業(yè)往往難以通過調整,讓產品在其他類似用例中發(fā)揮同樣的效果。對于擅長識別乳腺癌特征的Vara公司來說,他們的解決方案,就很難在診斷腦癌方面發(fā)揮作用。AI模型往往在少數特定任務中表現良好。Vara當然可以復用現有模型開發(fā)流程,但AI模型的訓練工作必須從頭再來,即利用新的數據集學習腦癌檢測。
“在未來十年內,垂直AI初創(chuàng)企業(yè)將極大改變某些行業(yè)的具體運作方式。”——Merantix公司CTO兼聯(lián)合創(chuàng)始人Rasmus Rothe
其他垂直AI初創(chuàng)企業(yè),還包括自動駕駛汽車公司Waymo,以及金融犯罪預防企業(yè)hawk.ai。總而言之,對垂直AI初創(chuàng)企業(yè)來說,最重要的就是保證把少數特定問題解決掉、解決好,并以此為基礎建立起穩(wěn)定的商業(yè)模式。由于新模型的訓練往往需要大量時間與數據,因此,其初始用例必須具備充分的說服力,支持公司一路發(fā)展至盈利階段。
“橫向AI企業(yè)“的目標,在于幫助數據科學家們更高效地完成數據科學工作流。為此,橫向AI初創(chuàng)企業(yè)面向的客戶,往往是數據科學家或者開發(fā)團隊。
橫向AI企業(yè)往往會從數據科學工作流中,選擇特定的一個或者多個環(huán)節(jié)加以改進。例如,橫向AI企業(yè)可以專注于幫助數據科學家們監(jiān)控其模型。總之,橫向AI產品與特定用例無關,其開發(fā)成果可服務于任何基于AI的產品。
Saturn Cloud就是一家橫向AI初創(chuàng)企業(yè),旨在提高數據科學家們的工作效率。他們提供一項全托管服務,幫助數據科學家們使用自己最熟悉的工具(Python、Jupyter及Dask等)進行大規(guī)模工作。這是一款通用型工具,適用于一切基于AI技術的產品。
“跨越幾乎各個行業(yè),自動化數據科學工作流,能夠為最終用戶帶來更高效的團隊協(xié)作與工作體驗。與此同時,Python的使用量開始一路猛增,并迅速獲得數據科學從業(yè)者們的青睞。因此,對大多數數據團隊而言,使用一套Python原生工具來分析并自動化處理日常工作,將極具現實意義。” ——Anaconda公司前創(chuàng)始人、Saturn Cloud公司聯(lián)合創(chuàng)始人Hugo Shi
根據IDC發(fā)布的預測結果,隨著數據總量呈指數級增長,橫向AI解決方案也將在未來發(fā)揮越來越重要的作用。數據是AI類產品的核心驅動力,因此可用數據量的增加,也將意味著,有價值數據產品的發(fā)展?jié)摿⒉讲教嵘A硗猓瑪祿茖W家人才市場也保持著穩(wěn)定增長。根據IBM開展的一項研究,到2020年,美國對于數據科學家的需求將增長28%,達到270萬。很明顯,橫向AI解決方案的目標客戶群體仍在發(fā)展壯大。
▲ 圖片來源/IDC
但是,橫向AI產品也面臨著自己的發(fā)展難題。它們必須能夠無縫集成至目標數據科學工作流及軟件堆棧中。
此外,Rasmus Rothe表示,“在開發(fā)橫向AI產品時,奪取市場領導地位將變得至關重要。”橫向AI初創(chuàng)企業(yè)往往很難收集到專有數據,并據此建立起排他性的商業(yè)優(yōu)勢。再有,在選擇將數據科學工作流中的哪個或哪些環(huán)節(jié)作為業(yè)務重點時,大家還需要牢記,針對不同AI模型的不同具體要求。只有始終高度關注對目標受眾最具價值的功能,橫向AI初創(chuàng)企業(yè)才能從同儕中脫穎而出,闖出一片屬于自己的天地。
“雖然橫向AI企業(yè)往往面臨更激烈的競爭態(tài)勢,但其產品的使用門檻一般更低,相關技術可以輕松融入采購方的技術棧當中。”——投資人Jason Risch
橫向AI初創(chuàng)企業(yè)中的典型案例,包括數據標記廠商understand.ai,以及數據科學工作流管理初創(chuàng)企業(yè)neptune.ai。在橫向AI市場上,超越一眾競爭對手并獲得市場領導地位往往非常困難,但只要我們能夠為眾多數據科學家提供實際價值,商業(yè)成功也將水到渠成。
AI初創(chuàng)企業(yè)各有特色,只有了解其中的獨特價值主張,我們才有可能建立起一家成功的AI企業(yè)。垂直AI初創(chuàng)企業(yè)交付產品,橫向AI初創(chuàng)企業(yè)則交付數據科學工作流中的組件。當然,也有不少將這兩類業(yè)務集合于一身的復合型AI初創(chuàng)企業(yè),受篇幅所限本文就不多做介紹了。
最后,在投身于創(chuàng)業(yè)大潮之前,請務必明確理想的AI初創(chuàng)企業(yè)類型,這也將給產品路線圖帶來直接影響。
垂直AI初創(chuàng)企業(yè),需要專注于建立一個足以維持起成長型公司的核心用例。
橫向AI初創(chuàng)企業(yè),需要在選定的市場區(qū)間內占得領導地位,為眾多數據科學家提供實際價值。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據不同問題靈活調整內部專家配置。該方法在數學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現,通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數據集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。