騰訊與福佑卡車聯手!打造首個數字貨運大模型,OCR識別準確率提升超20%

智東西(公眾號:zhidxcom)
作者?|?程茜
編輯?| 心緣

智東西10月25日報道,本周一,騰訊與福佑卡車宣布將聯合打造行業首個數字貨運大模型。

目前,騰訊與福佑卡車從智能化OCR物流證件識別方向切入,目前已形成了端到端的OCR智能識別大模型能力,并針對物流證件識別、各類回單識別等場景實現了智能識別與自動處理,基于大模型OCR準確率相比福佑卡車傳統模型提升20%以上。

下一步,騰訊與福佑卡車將在智能客服外呼、智能分析、智能分單系統等場景逐步展開合作。

福佑卡車技術合伙人陳冠嶺告訴智東西,從福佑卡車內部來講,現在的階段智能客服是優先智能數據分析,因為傳統的智能客服需要維護數據庫、標準答案,但其實由于公司業務變化很快,維護成本很高,他們希望能看大模型能不能做到端到端的智能客服的解決方案,降低維護成本。他希望明年Q1、Q2具體的東西跑起來,真實檢驗一下智能客服的效果。

他補充說,相比于智能客服,大模型應用于智能分析領域的挑戰會更大。原因在于這一領域對數據的要求更高。因此,福佑卡車要根據具體方案才能決定內部上線產品節奏,他們希望下半年看到一些場景應用。

一、OCR準確率總體提升超20%,復雜三方打卡圖識別率達95%

福佑卡車通過全鏈路數字化推動其業務降本增效已經有一定成果,貨運準時率達到95.2%,貨運服務事故率降至0.02%,車輛空駛率由行業平均值45%下降到6.6%,車輛空置率由行業平均值40%下降到24.8%,司機收入提高33%。

基于大模型技術,福佑卡車聯合騰訊將實現物流貨運行業的數字化智能化創新,從而實現運營效率和客戶體驗的全面提升。貨運領域應用AI的門檻將會被降低,數字貨運將進一步提升為智能貨運。

騰訊與福佑卡車聯手!打造首個數字貨運大模型,OCR識別準確率提升超20%

騰訊智慧交流積累了物流行業解決方案的經驗,今年6月,騰訊云發布行業大模型解決方案,通過騰訊云TI平臺提供MaaS一站式服務;福佑卡車作為貨運場景方,積累了大量的行業數據,深切知道行業痛點是什么。

因此,福佑卡車和騰訊將智能化OCR物流證件識別作為切入點,進一步延續到貨運領域的關鍵崗位上,可能打造智能助手提升工作的效率,最后探索對整個行業進行賦能,實現上下游拓展。

第一階段,福佑卡車和騰訊的智能化OCR物流證件識別已經落地,基于大模型OCR準確率相比傳統模型提升20%以上。其中,圖片信息匹配綜合識別準確率達到95%以上、圖片字段識別準確率達到99%,圖片字段識別召回率為98%。

騰訊與福佑卡車聯手!打造首個數字貨運大模型,OCR識別準確率提升超20%

主要提升在于工程化提效,福佑卡車新增需要識別的證件圖片時,只需要小樣本量的訓練機就可以達到傳統OCR數千樣本量以上的訓練效果。

準確率也有所提升,物流貨運行業特有的復雜三方打卡圖片識別,準確率從90%提升到了95%以上。

自動化程度提升,省略了人工驗證環節,基于智能化檢測驗證,能進一步降低人工成本。

下一步,騰訊和福佑卡車將在智能客服外呼、智能分析、智能分單系統方面進行深入合作和拓展。

二、基于高質量垂直語料,打造OCR、智能客服大模型

AI進入大模型時代,泛化性、通用性、實用性大大增強。

物流行業中企業積累了大量的場景化數據,依托于騰訊行業大模型方案在技術、平臺、應用層面的構建能滿足福佑卡車這類行業用戶的場景化訴求。

騰訊與福佑卡車聯手!打造首個數字貨運大模型,OCR識別準確率提升超20%

傳統OCR模型往往基于小模型做,識別過程包括檢測、識別文字內容,智能結構化提取,然后通過小模型做堆積,每個環節都有一定折損,會導致OCR效果不佳。

并且其不具備閱讀理解和推理能力,模型的復用性也不強。

騰訊OCR大模型可以做到端對端識別,整個模型的效果會比傳統OCR模型有提升,即使企業不做精調,也能達到更好效果,還能實現單模型多任務處理,具備一定的閱讀理解和推理能力。

這一大模型基于原生大模型,不經過訓練可以直接支持常規下游任務,Zeroshot學習泛化字段召回率可達93%以上;企業落地時通過Prompt設計,可以不經過訓練支持復雜的下游任務,Few-shot泛化字段召回率可達到95%以上;騰訊OCR大模型通過多模態技術,通過小樣本精調解決傳統OCR難題,比傳統模型召回率提高3%-20%。

為了企業實現更低成本的落地,騰訊OCR大模型功能設計采用數據分組、字段描述子、標注檢查、Badcase智能分析等。

并且,騰訊內部在TI-OCR上進行日常標注和建模,平均一個季度完成70000次標注任務,完成超100次模型訓練任務。

OCR大模型精調能使其基于特定場景感知文字信息,核心的提升點在于訓練樣本更少、訓練時長更高,對于復雜的場景和訓練,迭代一個模型的時長在小時、分鐘級。

對于物流行業的智能客服,其痛點在于對話效果不夠智能、人工坐席服務效率不高、傳統知識庫整理及運營依賴人工,投入大、效率低。

因此,底層基于物流行業客服大模型,加上福佑卡車內部數據進行精調,智能客服的能力升級。

大模型在泛化性、理解性方面的能力提升,能解決復雜問題,并且基于知識庫文檔快速學習,知識點快速提煉,掌握知識的時間從月級升級到分鐘級。

騰訊與福佑卡車聯手!打造首個數字貨運大模型,OCR識別準確率提升超20%

騰訊客服大模型能實現低成本訓練和推理,將百億大模型訓練成本從64卡降低到8卡,千億大模型從從128卡降到了32卡。并且,智能客服還能通過搜索引擎獲取網絡知識,提高回答的多樣性和相關性。

大模型能建立實時更新的大模型向量數據庫,將閱讀理解的長度從2k提升到8k,上下文挖掘觀點的能力也有大幅提升。

除了知識問答外,智能客服還需要完成任務型辦理,如查訂單、狀態獲取等,基于客服大模型就可以通過API調用完成任務構建。

結語:生成式AI席卷貨運物流全鏈路變革

陳冠嶺談道,目前我國公路貨運行業市場規模達到了5萬億元,但數字貨運滲透率只有15%,市場規模為7000億元。物流貨運具有體系完善、環節眾多、數據復雜、場景豐富等特性,一直以來都是前沿技術落地應用的重要領域。

大模型技術正在席卷各行各業,同樣將為貨運物流全鏈路運營效率、服務體驗和業務創新帶來巨大變革。