人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

(頭圖由AI工具生成)

智東西(公眾號:zhidxcom)
作者 | 三北
編輯 | 漠影

智東西12月27日報道,今年9月,國外一名身患怪病的男孩三年求醫17名醫生無果,卻因被ChatGPT正確診出“脊髓栓系綜合征”而成功獲救。這讓人們第一次直觀感受到大模型在健康信息服務領域的巨大潛力。

現在,這種潛力正在被科技公司們轉化為端到端的閉環產品。一些科技公司面向醫療機構客戶開放了大模型服務,也有團隊開源了醫療大模型群,但要說廣大用戶最直接可感的,還是智能搜索引擎夸克App近期悄然上線了一款“夸克健康助手”。

日前,夸克進行了健康搜索的全面升級,用戶在部分搜索結果中會得到由“夸克健康助手”提供的AIGC內容。據悉,在夸克搜索健康信息的正確率超過90%,處在行業第一梯隊。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

▲在夸克App調用夸克AI健康助手

首次體驗后,用戶便可將夸克健康助手添加到App首頁,以便隨時調用。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

▲將夸克AI健康助手添加到夸克App首頁

據夸克相關負責人稱,夸克自研大模型已經憑486分的高分通過了臨床執業醫師資格考試,同時在健康內容上的幻覺率已經降低至5%以內,達到遠優于同行的水平。

自年初ChatGPT爆火以來,微軟、谷歌等科技巨頭紛紛推了出AI版搜索引擎,但面對專業知識要求更高的健康信息服務領域,各路玩家或保持觀望或小范圍試水。作為2018年就明確了智能搜索引擎定位的新銳選手,夸克率先在健康領域邁出了革新搜索的第一步。

夸克自研大模型在搜索的實際落地效果如何?背后有什么樣的技術挑戰和行業真相?通過深扒夸克健康大模型應用,本文對此進行了深入探討。

一、實測AI健康助手:簡單對話,多維診斷

打開夸克App,雖然首頁沒有發生明顯變化,但搜索結果呈現已經被夸克大模型悄然改變。

如下圖所示,當智東西輸入“咳嗽檢查”這一問題,搜索結果中出現了AIGC內容和夸克健康助手的入口。用戶可以先簡單的了解病癥信息,然后在根據自己的身體情況進行選擇和對話。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

點擊進入夸克健康助手,頁面變成一個對話框形式。當智東西換一個問題:“經??谇粷兪鞘裁丛颉?,夸克健康助手從非病理因素和病理因素給出了問題的答復?;蛟S是考慮到回答較含糊,夸克健康助手進一步給出了一個卡片選項,使我可以補充癥狀,從而獲取更精準的答案。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

在我提供了補充癥狀之后,夸克健康助手果然給出了更聚焦的治療建議,并給出主要原因分析、科室就醫建議、如何進一步確診等一系列問題的答案。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

當智東西問到“家里老人剛做完宮頸手術,有什么吃食建議?”時,夸克健康助手給出了針對性的飲食建議。當涉及偏門的問題,比如“有人說魚是發物,也是可以吃的嗎?”,夸克健康助手也能根據跨中西醫的知識,給出明確的分析判斷:“可以適量食用”。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

夸克健康助手的一大特點是病情病例描述具體,而不是泛泛而談,因此具有更強的參考性。

比如當智東西問到“我胳膊肘處有小塊紅色點群狀胎記,不太光滑,有一些充血,可能是什么疾???”,夸克健康助手立馬給出了血管瘤、鮮紅斑痣、草莓狀毛細血管瘤等幾種可能。

通過“質軟可被壓縮、“菜花狀”等描述,加上超鏈接中的圖片,血管瘤的可能性看起來更大。通過夸克健康助手,我進一步了解到這是一種大概率不會給身體帶來危險的良性腫瘤。實際上,這是我家人的真實病例,夸克給出的判斷與此前在醫院檢查所得的結果一致。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

再來看看智能篩查功能,比如智東西在搜索引擎中輸入“55歲男士經常胳膊麻是怎么回事”,智能篩查卡片彈出并給出了持續時長、發病部位、行為誘因等多個選項。

當選擇持續數月、單側選項之后,夸克則提示我這可能與頸椎病、腦出血、腦血管病有關。點擊可能的病狀,如點擊腦出血板塊進入解答鏈接,只見有首都醫科大學的主任醫師來為我解答背后的原因。

實際上,這一病例的患者確實在出現手麻癥狀之后的幾個月后突然腦出血,可見這個智能篩查的功能還是比較具有參考性的。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

經過試用智東西發現,夸克健康助手在健康問題咨詢上基本上沒出現答非所問、胡編亂造、上下文不流暢的情形,甚至還比較準確地給出了初診結果。雖然這種建議不能替代醫療診斷,但有助于幫患者在就醫前進行初步自查。

必須承認,夸克健康助手在一些問題回答上偏保守,比如在多則建議后都指出“以上建議僅供參考”,但它作為一款輔助性的健康助手,已經比傳統搜索引擎好用了不少。

二、大模型進入專業領域,安全準確是第一道關口

體驗完產品應用,我們將目光轉向產業和技術。

從通用搜索到健康等專業搜索領域,大模型正在徹底改變搜索引擎的玩法,背后的關鍵因素是知識準確度的提升。

回顧年初ChatGPT爆火全球以來,先是微軟率先將ChatGPT接入了Bing搜索,而后谷歌以及國內的百度、夸克等紛紛將搜索引擎接入大模型,短視頻平臺抖音近期也傳出正在內測AI視頻搜索……互聯網大廠紛紛搶灘AI搜索賽道。

背后,大模型正在打破傳統搜索引擎的技術瓶頸:傳統搜索引擎依賴關鍵詞匹配,難以理解上下文;僅調取網上已有內容,內容相關度和質量不足;難以區分真假信息,誤導用戶等。大模型對搜索的變革在行業已有共識,基于理解、知識、創作、對話、推理等多重能力,將帶來更準確、更全面、更交互的信息服務體驗。

但與此同時,大模型在知識準確度上表現不足,阻礙其進入更專業的信息服務領域。

以健康領域為例,這是很多人使用搜索引擎的典型場景,卻是大模型久攻不下的一座城池。

究其背后原因,還是“幻覺”問題。由于醫生無法給患者詳細解釋每一個醫療健康知識,患者很多知識需求是通過網絡獲取的。但由于大模型存在幻覺,會捏造信息,很可能給出錯誤的疾病判斷、用藥建議,使得患者貽誤病情,后果不堪設想。

安全準確是健康信息服務的第一道關口,夸克專門對此進行了攻關。夸克相關負責人稱,夸克做了很多健康行業數據建設和知識建設,從而使其知識錯誤率能降到了5%以下,這才具備了產品推向廣大C端市場的底氣。

解決大模型應用的問題,首先要先解決知識正確性的問題。為此,夸克建設了大量的醫典百科、醫典問答的C端用戶數據,整理了大量的指南、標準、書籍等一系列數據,并建設了完整的醫療知識圖譜,由此大大降低了大模型的幻覺。

值得一提的是,為了確保內容的專業性、正確性和科學性,夸克還成立了健康專家團。一方面其與200多位權威醫學專家、60多家全國知名公立三甲醫院和40多家醫學機構合作,共建大模型內容生態;另一方面,夸克招募了健康大模型精調師,結合用戶需求和熱門病癥,提供最新健康知識。

由此形成的千億參數級別的夸克自研大模型,助其跨越安全準確第一道關口,進入專業搜索領域。

三、千億級參數大模型,四個大招變革搜索

根據知名行研機構IDC今年8月發布的報告,在大模型的推動下,2027年全球人工智能IT總投資預計增至4236億美元,約合3.1萬億元人民幣。在這一新藍海前景下,互聯網巨頭、科技行業龍頭和AI創企幾路玩家掀起了聲勢浩大的「百模大戰」。

而隨著「百模大戰」的焦點演變為大模型產業化落地,夸克這樣交叉領域玩家快速走到了聚光燈下。

夸克于11月22日正式公布了全棧自研、千億級參數的夸克大模型。同時,夸克大模型已登頂C-Eval和CMMLU兩大權威榜單,多項性能優于GPT-4,亦在法律、醫療、問答等領域的性能評測中奪冠。

人手一個AI健康助手!大模型時代的搜索引擎「蛻變」

要達成這樣的成績,并非沒有挑戰。

據夸克相關負責人稱,對于前文提到的幻覺問題,夸克在千億級的網頁里選擇了幾億級的高質量網頁。這一篩選過程極其復雜,獲取海量中文數據和知識難度大,網頁里垃圾數據極多,對非搜索引擎廠家來說成本代價會非常高,但夸克卻設法高效解決了這些問題。

同時,國內外的大模型玩家都遇到的另一大挑戰是人類知識對齊和SFT(監督微調)精標數據對齊問題。由于有用SFT樣本數據很稀缺,夸克專門建立了專業團隊,囊括了醫生等行業的資深從業人員,通過跨領域作戰攻克難關。

最終,基于搜索業務基礎與智能技術積累,夸克大模型試圖從以下四大方面建立護城河:

1、最全面的通用知識數據和行業知識數據,以及知識理解和評估體系;

2、基于搜索技術體系的積累,打造了千億級參數平臺的模型訓練能力;

3、擁有長期智能化產品經驗的智能技術產運團隊,覆蓋搜索、智能化及行業等多維領域。

4、擁有全行業的知識增強技術體系及能力,助大模型減少幻覺,增強可用性。

當下大模型的爆發,源頭要追溯到2017年谷歌提出的Transformer模型。當時剛誕生一年的夸克也關注到AI發展趨勢,隨即在2018年就提出了AI為基礎的智能搜索引擎,并確立“基于AI技術做前沿、無畏的創新探索”的研發方向。

如今,隨著圍繞Transformer展開的大模型技術體系逐漸成熟壯大,夸克在智能信息服務這一領地亮出四把利劍,向傳統搜索行業吹響了變革的號角。

結語:大模型帶來信息搜索新玩法

大模型將帶來全新的搜索引擎玩法。正如清華大學新聞學院教授、博士生導師沈陽所說,搜索引擎天然具有各種網絡公開數據,在內容安全上經歷了長時間的考驗,且用戶提供了大量的查詢需求交互,因此搜索引擎跟大模型的結合是天然之配。

相比于微軟、谷歌等傳統搜索引擎巨頭,智能搜索引擎新銳玩家夸克選擇從健康這一專業化要求極高的場景突破AIGC應用。直擊行業痛點,背后是其在數據、搜索技術、知識增強技術及團隊方面的差異化打法。不過,AI搜索的搶灘大戰仍處于早期階段,誰會在產品的角逐中贏得更多用戶的心,還要等時間來驗證最終答案。