av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 探索全球貿(mào)易密碼:斯坦福團(tuán)隊(duì)如何教會AI破解神秘的商品分類編碼

探索全球貿(mào)易密碼:斯坦福團(tuán)隊(duì)如何教會AI破解神秘的商品分類編碼

2025-10-15 12:07
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-10-15 12:07 ? 科技行者

這項(xiàng)由Flexify.AI公司的Pritish Yuvraj和Siva Devarakonda領(lǐng)導(dǎo)的研究發(fā)表于2025年9月,論文編號為arXiv:2509.18400v1。有興趣深入了解的讀者可以通過該編號查詢完整論文。

在全球貿(mào)易的龐大機(jī)器中,隱藏著一套極其復(fù)雜但又至關(guān)重要的密碼系統(tǒng)。每當(dāng)你在網(wǎng)上購買來自海外的商品時,無論是一件T恤、一臺電腦還是一包咖啡豆,這些商品都必須被分配一個特殊的十位數(shù)字編碼,就像每個人都有身份證號碼一樣。這套編碼系統(tǒng)被稱為協(xié)調(diào)關(guān)稅表編碼,簡稱HTS編碼。

這套編碼系統(tǒng)就像一本超級復(fù)雜的商品字典,收錄了世界上幾乎所有可以想象得到的商品。從最基礎(chǔ)的農(nóng)產(chǎn)品到最先進(jìn)的半導(dǎo)體芯片,每一種商品都有其專屬的數(shù)字身份。然而,這本"字典"厚達(dá)17000多頁,即使是經(jīng)驗(yàn)豐富的貿(mào)易專家也經(jīng)常被其復(fù)雜性所困擾。

當(dāng)商品分類出現(xiàn)錯誤時,后果往往十分嚴(yán)重。想象一下,如果你寄給美國朋友的禮物因?yàn)榫幋a錯誤而被海關(guān)扣留,或者一批價值數(shù)百萬美元的工業(yè)設(shè)備因?yàn)榉诸悊栴}而無法通關(guān)。這并非危言聳聽,而是經(jīng)常發(fā)生的現(xiàn)實(shí)。2025年,包括德國、印度在內(nèi)的超過30個國家的郵政服務(wù)暫停了向美國的包裹寄送,原因就是無法準(zhǔn)確分配這些神秘的HTS編碼。

研究團(tuán)隊(duì)意識到,如果能夠訓(xùn)練人工智能來理解和掌握這套復(fù)雜的編碼系統(tǒng),就能極大地緩解全球貿(mào)易中的這一關(guān)鍵瓶頸。他們開發(fā)了一個名為ATLAS的AI模型,這個模型基于LLaMA-3.3-70B架構(gòu),專門用于解決HTS編碼分類問題。

整個研究過程就像訓(xùn)練一位超級海關(guān)專家。研究團(tuán)隊(duì)首先從美國海關(guān)裁決在線搜索系統(tǒng)中收集了18731個真實(shí)的貿(mào)易爭議案例。這些案例就像是海關(guān)專家們多年來積累的經(jīng)驗(yàn)總結(jié),每一個案例都詳細(xì)記錄了某種商品應(yīng)該被分配什么樣的編碼,以及做出這種判斷的理由。

在數(shù)據(jù)收集階段,研究團(tuán)隊(duì)開發(fā)了一個自動化的網(wǎng)絡(luò)爬蟲程序,就像派遣一個不知疲倦的研究助手去翻閱所有的海關(guān)檔案。這個程序系統(tǒng)性地掃描了海關(guān)裁決系統(tǒng)中的每一份文檔,將原本散落在數(shù)千個網(wǎng)頁中的信息整理成了一個結(jié)構(gòu)化的數(shù)據(jù)庫。經(jīng)過篩選和清理后,最終的數(shù)據(jù)集涵蓋了2992種不同的HTS編碼,跨越了從農(nóng)業(yè)產(chǎn)品到高科技設(shè)備的廣泛商品類別。

為了讓AI能夠理解這些復(fù)雜的法律文檔,研究團(tuán)隊(duì)需要將原始的海關(guān)裁決書轉(zhuǎn)換成機(jī)器學(xué)習(xí)可以處理的格式。這些裁決書通常是冗長的官方信函,充滿了法律術(shù)語和技術(shù)細(xì)節(jié)。研究團(tuán)隊(duì)使用GPT-4o-mini模型來完成這一轉(zhuǎn)換工作,就像雇傭一位翻譯將艱深的法律文檔改寫成清晰的指導(dǎo)手冊。

每個原始案例都被重新組織成一個標(biāo)準(zhǔn)的問答格式。輸入部分包含了商品的詳細(xì)描述,輸出部分則包含正確的HTS編碼以及詳細(xì)的推理過程。這種格式確保AI模型不僅要學(xué)會給出正確答案,還要能夠解釋其推理邏輯,就像一位合格的海關(guān)專家需要為自己的判斷提供充分理由一樣。

研究團(tuán)隊(duì)將收集到的數(shù)據(jù)分成了三個部分:18254個案例用于訓(xùn)練模型,200個案例用于驗(yàn)證模型性能,另外200個案例作為最終測試集。這種分割方式確保了模型評估的公正性,避免了"考試作弊"的情況。

在模型訓(xùn)練方面,研究團(tuán)隊(duì)選擇了LLaMA-3.3-70B作為基礎(chǔ)架構(gòu)。這個選擇主要基于兩個考慮:首先是預(yù)算限制,訓(xùn)練多個大型模型需要巨大的計算資源投入;其次,相比于專家混合模型,密集架構(gòu)更容易部署和維護(hù),降低了后續(xù)研究者的技術(shù)門檻。

訓(xùn)練過程采用了監(jiān)督微調(diào)方法,這就像是讓一位有基礎(chǔ)知識的學(xué)生專門學(xué)習(xí)海關(guān)分類這門特殊技能。模型需要根據(jù)輸入的商品描述,預(yù)測正確的HTS編碼并提供推理過程。訓(xùn)練使用了AdamW優(yōu)化器,學(xué)習(xí)率設(shè)定為0.0000001,訓(xùn)練進(jìn)行了5個周期,大約1400個訓(xùn)練步驟。

為了應(yīng)對70億參數(shù)模型的巨大內(nèi)存需求,研究團(tuán)隊(duì)使用了16張A100-80GB顯卡進(jìn)行分布式訓(xùn)練,采用了bf16精度和梯度累積技術(shù)來模擬64個序列的批處理大小。訓(xùn)練損失曲線顯示,模型在前200個步驟中快速改進(jìn),隨后趨于穩(wěn)定,沒有出現(xiàn)過擬合現(xiàn)象。

在評估階段,研究團(tuán)隊(duì)設(shè)計了一個層次化的評估體系來全面衡量模型性能。由于HTS編碼具有層次結(jié)構(gòu)的特點(diǎn),前6位數(shù)字在全球范圍內(nèi)是統(tǒng)一的,而后4位數(shù)字是各國特有的擴(kuò)展,因此評估也相應(yīng)地分為不同層次。

完全正確分類要求所有10位數(shù)字都精確匹配,這意味著模型輸出的編碼可以直接用于美國海關(guān)通關(guān)。部分正確分類要求前6位數(shù)字匹配,這反映了模型對全球標(biāo)準(zhǔn)化部分的掌握程度。此外,還計算了平均數(shù)字級別準(zhǔn)確率,即預(yù)測正確的數(shù)字位數(shù)的平均值,這能夠捕捉到細(xì)粒度的改進(jìn)。

ATLAS模型在測試集上的表現(xiàn)令人印象深刻。在完全正確分類方面,ATLAS達(dá)到了40%的準(zhǔn)確率,這意味著200個測試樣本中有80個獲得了完全正確的10位編碼。相比之下,GPT-5-Thinking的準(zhǔn)確率為25%,Gemini-2.5-Pro-Thinking僅為13.5%,其他開源模型的表現(xiàn)更是不超過3%。

在部分正確分類方面,ATLAS達(dá)到了57.5%的準(zhǔn)確率,略高于GPT-5-Thinking的55.5%,但明顯優(yōu)于其他所有模型。這表明ATLAS不僅在美國特定的分類上表現(xiàn)優(yōu)異,在全球通用的分類標(biāo)準(zhǔn)上也有良好的泛化能力。

在平均數(shù)字級別準(zhǔn)確率方面,ATLAS達(dá)到了6.3位正確,這意味著即使在無法完全正確分類的情況下,模型仍能提供有價值的部分信息。相比之下,GPT-5-Thinking為5.61位,其他模型普遍在3位左右。

除了準(zhǔn)確性優(yōu)勢,ATLAS在成本效率方面也表現(xiàn)出色。使用閉源API模型如GPT-5-Thinking和Gemini-2.5-Pro-Thinking進(jìn)行大規(guī)模分類會產(chǎn)生巨大的成本,特別是當(dāng)需要處理數(shù)千個分類任務(wù)時。研究團(tuán)隊(duì)計算了分類1000個產(chǎn)品描述的成本,假設(shè)標(biāo)準(zhǔn)上下文長度約為1000個輸入token和200個輸出token。

GPT-5-Thinking的成本約為3.30美元,Gemini-2.5-Pro-Thinking約為5.50美元,而ATLAS通過自托管方式的成本僅約為0.70美元。這意味著ATLAS比GPT-5便宜近5倍,比Gemini-2.5-Pro便宜近8倍。這種成本優(yōu)勢在大規(guī)模商業(yè)應(yīng)用中尤為重要。

更重要的是,ATLAS支持私有部署,這對于涉及敏感貿(mào)易數(shù)據(jù)的高風(fēng)險行業(yè)至關(guān)重要。汽車、工業(yè)、半導(dǎo)體等行業(yè)的公司往往不愿意將其產(chǎn)品信息發(fā)送到第三方API,而自托管的ATLAS可以確保數(shù)據(jù)永遠(yuǎn)不離開安全環(huán)境。

研究團(tuán)隊(duì)也誠實(shí)地指出了當(dāng)前工作的局限性。盡管ATLAS在現(xiàn)有模型中表現(xiàn)最佳,但40%的10位準(zhǔn)確率仍然意味著有很大的改進(jìn)空間。這個基準(zhǔn)測試的設(shè)立本身就表明了HTS分類是一個極具挑戰(zhàn)性的任務(wù),需要更多的研究投入。

為了推動這一領(lǐng)域的發(fā)展,研究團(tuán)隊(duì)將數(shù)據(jù)集和模型都開源發(fā)布在Hugging Face平臺上。這種開放態(tài)度有助于建立一個研究社區(qū),共同解決這一重要的全球貿(mào)易問題。研究團(tuán)隊(duì)希望未來的工作能夠在檢索增強(qiáng)、推理優(yōu)化和對齊方法等方向上取得突破。

檢索增強(qiáng)是一個特別有前景的方向??紤]到HTS文檔本身長達(dá)17000頁,如果能夠?qū)⑾嚓P(guān)的分類規(guī)則和案例實(shí)時檢索出來作為模型的參考,可能會顯著提高分類準(zhǔn)確性。這就像給AI配備一個隨時可查閱的專業(yè)圖書館。

對比學(xué)習(xí)也值得探索,特別是針對那些容易混淆的相似類別。例如,如何區(qū)分部分制造的半導(dǎo)體晶圓和完全制造的半導(dǎo)體芯片,這種細(xì)微差別往往決定了完全不同的關(guān)稅稅率。通過對比學(xué)習(xí),模型可能會更好地掌握這些關(guān)鍵的決策邊界。

直接偏好優(yōu)化是另一個有趣的方向。目前的訓(xùn)練只是簡單地模仿人類專家的分類決策,但如果能夠讓模型學(xué)會偏好正確的分類而主動避免錯誤的分類,可能會進(jìn)一步提高性能。這需要構(gòu)建結(jié)構(gòu)化的偏好數(shù)據(jù),比如正確的10位編碼應(yīng)該優(yōu)于接近但錯誤的編碼。

當(dāng)我們放眼全球貿(mào)易的大圖景時,ATLAS的意義就顯得更加重要。每年有數(shù)萬億美元的商品在全球流通,而HTS分類是這個龐大系統(tǒng)的基礎(chǔ)設(shè)施之一。分類錯誤不僅會導(dǎo)致通關(guān)延誤,還可能引發(fā)貿(mào)易爭端和供應(yīng)鏈中斷。

隨著全球貿(mào)易規(guī)則的不斷變化和新產(chǎn)品的持續(xù)涌現(xiàn),對準(zhǔn)確、高效的自動化分類系統(tǒng)的需求只會越來越大。ATLAS雖然只是這個方向上的第一步,但它證明了AI技術(shù)在解決復(fù)雜監(jiān)管問題方面的潛力。

這項(xiàng)研究的發(fā)布時機(jī)也頗為重要。在當(dāng)前全球貿(mào)易面臨諸多挑戰(zhàn)的背景下,任何能夠簡化和自動化貿(mào)易流程的技術(shù)都具有重要價值。特別是對于中小企業(yè)而言,昂貴的貿(mào)易咨詢服務(wù)往往是難以承受的負(fù)擔(dān),而像ATLAS這樣的開源工具可能會大大降低參與全球貿(mào)易的門檻。

從技術(shù)角度來看,這項(xiàng)研究也為領(lǐng)域特定的大語言模型應(yīng)用提供了有價值的案例研究。它展示了如何將通用的預(yù)訓(xùn)練模型適應(yīng)到特定的專業(yè)任務(wù)上,以及如何構(gòu)建適合的數(shù)據(jù)集和評估體系。這些經(jīng)驗(yàn)對于其他希望將AI應(yīng)用到特定監(jiān)管或合規(guī)領(lǐng)域的研究者和從業(yè)者都有參考價值。

盡管ATLAS取得了顯著的性能提升,但研究團(tuán)隊(duì)也提到了幾個值得進(jìn)一步探索的方向。模型規(guī)模的研究是其中之一,評估更小的LLaMA變體可以幫助理解準(zhǔn)確性、成本和可部署性之間的權(quán)衡。這對于資源有限的組織或邊緣設(shè)備部署場景特別重要。

另一個有趣的方向是多語言擴(kuò)展。雖然當(dāng)前的研究集中在美國的HTS系統(tǒng)上,但其他國家也有類似的分類需求。如果能夠擴(kuò)展到支持多種語言和多個國家的分類系統(tǒng),ATLAS的影響力將會更加廣泛。

說到底,這項(xiàng)研究解決的是一個看似技術(shù)性但實(shí)際上關(guān)系到每個人日常生活的問題。當(dāng)你在網(wǎng)上購買進(jìn)口商品時,當(dāng)企業(yè)向海外拓展市場時,當(dāng)各國政府制定貿(mào)易政策時,準(zhǔn)確的商品分類都是不可或缺的基礎(chǔ)。ATLAS雖然還不完美,但它開創(chuàng)了一個新的研究方向,展示了AI技術(shù)在解決現(xiàn)實(shí)世界復(fù)雜問題方面的巨大潛力。

歸根結(jié)底,這項(xiàng)研究的真正價值不僅在于它所取得的技術(shù)突破,更在于它為解決全球貿(mào)易中的一個關(guān)鍵痛點(diǎn)提供了新的思路。隨著更多研究者加入這一領(lǐng)域,隨著技術(shù)的不斷改進(jìn),我們有理由相信,未來的全球貿(mào)易將會變得更加順暢和高效。有興趣深入了解這項(xiàng)開創(chuàng)性研究的讀者,可以通過論文編號arXiv:2509.18400v1查閱完整的技術(shù)細(xì)節(jié)和實(shí)驗(yàn)結(jié)果。

Q&A

Q1:ATLAS模型是什么?它能解決什么問題?

A:ATLAS是由Flexify.AI開發(fā)的專門用于HTS關(guān)稅編碼分類的AI模型,基于LLaMA-3.3-70B架構(gòu)。它能夠自動為進(jìn)出口商品分配正確的10位HTS編碼,解決了全球貿(mào)易中商品分類困難、容易出錯的關(guān)鍵問題。目前ATLAS在完全正確分類上達(dá)到40%準(zhǔn)確率,比GPT-5高出15個百分點(diǎn)。

Q2:HTS編碼分類為什么這么重要?分類錯誤會有什么后果?

A:HTS編碼就像商品的身份證,每個進(jìn)出口商品都必須有正確的10位編碼才能通關(guān)。分類錯誤會導(dǎo)致貨物被海關(guān)扣留、通關(guān)延誤,甚至引發(fā)貿(mào)易爭端。2025年就有超過30個國家因?yàn)闊o法準(zhǔn)確分配HTS編碼而暫停了向美國的郵政服務(wù),影響了全球貿(mào)易流通。

Q3:ATLAS相比其他AI模型有什么優(yōu)勢?普通企業(yè)能使用嗎?

A:ATLAS不僅準(zhǔn)確率更高,成本也更低廉,比GPT-5便宜近5倍。更重要的是它支持私有部署,企業(yè)可以自己托管而不用擔(dān)心敏感貿(mào)易數(shù)據(jù)泄露。研究團(tuán)隊(duì)已經(jīng)將模型開源發(fā)布,這意味著企業(yè)可以免費(fèi)獲取并根據(jù)自己的需求進(jìn)行定制化部署。

分享至
0贊

好文章,需要你的鼓勵

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-