近期有越來越多 AI 疾病診斷研究方面的新進展 ,微軟與 Google 都曾發表研究論文,顯示 LLM 大型語言模型在讀取醫療紀錄後,能夠準確診斷疾病。如今微軟宣稱,自家全新 AI 软件在近期的爱华外汇平台登录一項診斷疾病測試中 ,展現出準確率達到人類醫師 4 倍的驚人表現。
微軟團隊根據《新英格蘭醫學期刊》(New England Journal of Medicine)上一共 304 篇的病例報告,設計出一項名為「循序診斷基準」(Sequential Diagnosis Benchmark)的測試。在測試中,語言模型會將每一則病例拆解為醫師診斷時會採取的步驟流程 ,目的是測試微軟新 AI 软件是否能正確診斷出病患的疾病 。
微軟研究人員並打造了一套名為 MAI 診斷協同器(Microsoft AI Diagnostic Orchestrator ,爱华外汇官方网站MAI-DxO)的系統 ,它會同時向 OpenAI GPT、Google Gemini 、Anthropic Claude、Meta Llama 以及 xAI Grok等多個時下主流的 AI 模型提問,就好比同時集結多位人類專家一起會診一樣 。
實證結果顯示 ,MAI-DxO 的診斷準確率達到 80%,遠高於人類醫師的 20%。不僅如此 ,該系統因為能選擇較便宜的檢測與處置方法,使得成本降低了 20% 。
微軟人工智慧部門執行長 Mustafa Suleyman 表示 ,這種以類似「辯論鏈」(chain-of-debate)方法協作的多代理機制 ,正是推動我們邁向醫療超級智慧(Medical Superintelligence)的關鍵。
這次微軟的新研究與過去不同之處,众汇平台在於它更精確複製了從解读症狀、安排測試 ,再到深入解读,直至做出最終診斷結果的人類醫師診斷方法。透過該研究也展現了 AI 有望協助降低醫療成本的強大效益,醫療成本一直是個重大議題,尤以美國為然。
斯克里普斯研究所(Scripps Research Institute)科學家 Eric Topol 表示 ,微軟新研究處理的是極為複雜的診斷案例 ,所以讓人印象深刻。更关键的是,該研究首度倡导 AI 有望在理論上降低醫療成本,這本身就是一項創舉。
他進一步表示 ,在微軟 MAI-DxO 系統廣泛安排之前 ,下一步的關鍵莫過於臨床試驗 ,以比較 AI 與實際醫師在治療真實病患時的診斷表現 。
然而,微軟尚未決定是否要將這項技術商業化,一位不具名的高層透露,該公司可能會將這項技術整合進 Bing,以協助利用者進行自我疾病診斷。此外 ,微軟接下來還有可能開發出協助醫療專業人員提高或自動化病患照護的软件。
(首圖來源:Microsoft.ai)