科技【洪存正專欄】人工智能在醫...

【洪存正專欄】人工智能在醫學史上的幾次革命

Date:

Charlotte J. Haug, M.D., Ph.D., and Jeffrey M. Drazen, M.D.共同執筆,發表在《新英格蘭醫學期刊》(NEJM)的<臨床醫學中的人工智能和機器學習,2023 年>(Artificial Intelligence and Machine Learning in Clinical Medicine, 2023) 敘述了人工智能在醫學史上的幾次革命。

文 / 洪存正 導讀

由於計算機和人工智能 (AI) 的概念幾乎是在 20 世紀 40 年代和 50 年代同時發展起來的,醫學領域很快就看到了它們潛在的相關性和好處。1959 年,基夫·布羅德曼 (Keeve Brodman) 及其同事聲稱,「對症狀做出正確的診斷解釋可以是一個在所有方面都是合乎邏輯的過程,而且定義如此完整,以至於可以由機器執行。」十一年後,William B. Schwartz 在期刊中寫道,「計算機科學可能會通過增強並在某些情況下在很大程度上取代醫生的智力功能來發揮其主要作用。」他預測,到 2000 年,計算機將在醫學中扮演全新的角色,成為醫生智力的強大延伸。

為什麼革命沒有發生?

然而,到 70 年代後期,令人失望的是,醫學統計的兩種主要方法——基於規則的系統和匹配或模式識別系統——在實踐中並沒有像人們希望的那樣成功。基於規則的系統建立在這樣的假設之上,即專家知識由許多獨立的、針對特定情況的規則組成,並且計算機可以通過將這些規則以演繹鏈的形式串在一起來模擬專家推理。匹配策略試圖將患者的臨床特徵與一組「存儲的配置文件」相匹配,我們現在將其稱為「疾病腳本」,是特定疾病的發現。更多的努力被投入到理解臨床決策過程本身。很明顯,大多數先前計劃的主要缺陷源於他們缺乏病理生理學知識。結合這些知識後,性能會大大提高。

然而,在 20 世紀 80 年代,計算機無法勝任這項任務。到 1987 年,基於規則的系統已被證明可用於各種商業任務,但尚未在臨床醫學中發揮作用。事實上,Schwartz 及其同事指出,「這個過程非常緩慢,即使使用現代高速計算機也不切實際。」他們繼續說道:「幾十年來一直聽說計算機將很快能夠協助進行疑難診斷,但執業醫師很可能想知道為什麼革命沒有發生。」

50 多年來計算機存儲和處理數據能力的改進

在 20 世紀 50 年代,計算機又大又慢。第一個硬盤驅動器是 IBM 350 型磁盤文件,於 1956 年推出。它的總存儲容量為 500 萬個字符(不到 5 MB)。第一個容量超過 1 GB 的硬盤驅動器是 IBM 3380,於 1980 年推出。它有冰箱那麼大,重 550 磅(250 千克);價格是100,000美元。但是集成電路技術正在改進。1965 年,Fairchild Semiconductor 和 Intel 的聯合創始人戈登摩爾預測,集成電路中的晶體管數量及其潛在計算能力每 2 年翻一番。他的預測是正確的;半導體密度的這種變化被稱為摩爾定律。然而,摩爾定律告訴我們的不僅僅是每平方厘米的晶體管數量,因為技術進步的其他方面,例如電子產品的處理速度和價格,都與摩爾定律密切相關。隨著更密集的電路、計算機內存和計算速度的提高,如今,比 1980 年代佔據整個房間的超級計算機更強大的袖珍設備很常見,而且價格只是其中的一小部分。

幫助找到特定信息需要第二次革命

數據科學的進步不僅僅是提高性能、速度和存儲的問題。除了圖書館中發現的信息類型、組織中生成的數據以及旨在收集和編碼數據的已建立系統之外,新形式的技術還可以使用人生成和機器生成的數據。這些數據通常是混亂和非結構化的。數據現在來自許多其他來源,包括社交網絡、博客、聊天室、產品評論網站、社區、網站頁面、電子郵件、文檔、圖像、視頻和音樂,以及可穿戴和環境傳感器。許多人公開他們的醫療記錄和個人基因數據的某些方面,以供任何人在線訪問。存儲容量如此之大,以至於可以存儲和輕鬆訪問記錄的人類知識和活動的大部分語料庫。

一旦我們有了數據,我們需要的不僅僅是數據;我們需要識別和處理數據的方法。谷歌通過利用其他人執行的搜索來確定人們想知道的內容,從而成為在線搜索領域的領導者。這需要第二次革命,數學算法可以快速且可靠地跟踪此行為並幫助最終用戶找到特定信息。更密集的信息存儲和更快的計算使得數學表達式的實用、實時解決方案成為可能,這些數學表達式可用於查找數據中以前不可知的關係。結果,數據科學可以以一種以前不可能的方式蓬勃發展並發揮作用。

一個不可能的夢想變成了現實

我們現在能夠使用非結構化數據來識別數據中元素之間不為人知的關係,允許使用動態數據和具有多種上下文的數據,當以非傳統方式處理和分析這些數據時,可以提供對人類行為的可操作見解。隨著計算能力允許功能實時輸出到數據查詢,神經網絡變得更加複雜。Transformers(即對輸入數據的每個部分的重要性進行不同權衡的深度學習模型)使自然語言處理成為可能。通過這種方法,底層計算機模型的複雜性以及這些模型可以從中提取的數據集變得越來越強大。可以模擬人類交互的某些方面的計算機的目標從一個不可能的夢想變成了現實。

數據科學所允許的連通性正在推動一種新的發現。人們正在使用社交網絡在朋友、事物、事件、喜歡、不喜歡、地點、想法和情感之間建立自己的聯繫。各國政府正在分析社交網絡以阻止恐怖主義行為。企業正在挖掘社交和交易信息以建立聯繫,這將有助於他們發現新的機會。科學家們正在構建龐大的互聯數據網格,以利用人工智能和機器學習來梳理新發現。如下文更詳細所述,這些進步使得計算機的出現可以幫助您執行以前單調乏味的任務。星球大戰角色 C-3PO 是基於 AI 的虛擬助手的粗略版本(例如,Apple 的 Siri,Google 的 Assistant,和亞馬遜的 Alexa)已經成為我們日常生活的一部分,可以幫助我們執行規定的任務。任何使用過其中一種設備的人都體驗過它們的便利(例如,指示虛擬助手「將烤箱定時器設置為 20 分鐘」以便正確烹飪食物),但也體驗過讓助手打斷與某些人的對話的煩惱不相關的事實。人工智能和機器學習構成了這些設備背後的驅動力。

醫學中的人工智能和機器學習

在 1990 年代和 2000 年代初期,即使計算機速度較慢且內存有限,讓機器成功執行某些重複性且因此容易出現人為錯誤的醫療任務的問題正在得到解決。通過大量的資金和智力投入,心電圖 (ECG) 和白細胞分類計數的計算機讀取、視網膜照片和皮膚病變的分析以及其他圖像處理任務已成為現實。許多這些機器學習輔助任務已被廣泛接受並納入日常醫學實踐。這些機器任務的性能並不完美,通常需要熟練的人員來監督過程,但在許多情況下,這已經足夠好了,

醫學中的人工智能 (AI) 譜。

然而,人工智能和機器學習在醫學中的應用已經超出了醫學圖像的閱讀範圍。人工智能和機器學習程序以多種方式進入醫學領域,包括但不限於幫助識別可能對公共衛生產生影響的傳染病爆發;結合臨床、遺傳和許多其他實驗室輸出,以識別可能無法檢測到的罕見和常見病症;協助醫院業務運營(圖 2)。在接下來的幾個月裡,《華爾街日報》將在 2023 年發表其他評論文章,選擇性地審視醫學中的人工智能和機器學習。但在第一篇文章出現之前,大約一個月的時間,重要的是要考慮我們學習時需要考慮的壓倒一切的問題與機器攜手工作。

人工智能和醫學機器學習中未解決的問題

如上所述,在解釋某些類型的醫學圖像時,人工智能和機器學習的使用已經成為公認的醫學實踐,例如心電圖、平片、計算機斷層掃描 (CT) 和磁共振成像 (MRI) 掃描、皮膚圖像和視網膜照片。對於這些應用程序,人工智能和機器學習已被證明可以通過標記圖像中偏離規範的方面來幫助醫療保健提供者。

這提出了一個關鍵問題:什麼是常態?這個簡單的問題顯示了當今廣泛應用的人工智能和機器學習在醫學中的使用的弱點之一。「教授」人工智能和機器學習算法的方式中的偏見如何影響它們在現實世界中應用時的運作方式?我們如何將人類價值觀融入人工智能和機器學習算法中,以便獲得的結果反映衛生專業人員面臨的實際問題?監管機構必須解決哪些問題才能確保 AI 和機器學習應用程序在多用途環境中的表現與宣傳的一樣?對於依賴人工智能和機器學習的干預措施,應該如何修改統計推斷中的經典方法(如果有的話)?這些只是我們面臨的一些問題;「AI in Medicine」系列將解決其中的一些問題。

人工智能和機器學習在臨床實踐中的作用

除了陷阱,還有很多希望。如果人工智能和機器學習算法可以簡化為臨床上有用的「應用程序」,它們是否能夠從堆積如山的臨床、基因組學、代謝組學和環境數據中脫穎而出,以幫助進行精確診斷?AI 和機器學習驅動的應用程序能否成為您的個人抄寫員並騰出您花在文檔上的時間,以便您可以將更多時間花在患者身上?這些應用程序能否提示您提出有助於鑑別診斷的關鍵問題?他們能否戰勝保險公司使用的 AI 和機器學習算法,使您難以訂購正電子發射斷層掃描-CT 掃描或為您與患者和患者家人共度的時間收取報銷?在每個領域,都取得了進展。夠好了嗎?

人工智能和機器學習應用的臨床研究

對進展的評估有其自身的一系列問題。在傳統的臨床研究中,當進展以針對可定義條件的新藥的形式出現時,測試和接受該藥物作為進步的標準已經確立。當乾預是人工智能和機器學習算法而不是藥物時,醫學界期望獲得相同水平的保證,但描述和測試人工智能和機器學習干預的標準還遠未明確。

如果一個應用程序要被接受為塑造、改革和改進臨床實踐的標準,那麼基於人工智能和機器學習的介入研究應該遵循什麼標準?該研究包含三個組成部分。首先,研究的結構必須能夠以能夠影響衛生專業人員行為並改善患者預後的方式回答具有臨床意義的問題。其次,干預必須是可定義的、可擴展的,並且適用於手頭的問題。它不得受到問題領域以外因素的影響,並且必須產生可應用於廣泛人群和疾病流行的類似臨床問題的結果。人工智能和機器學習驅動的護理能否滿足這些標準——我們對新型治療干預或基於實驗室的診斷測試的要求——或者我們是否需要為此類干預制定一套獨特的標準?第三,當研究結果以影響實踐的方式應用時,結果必須對所考慮的所有患者都有好處,而不僅僅是那些與訓練算法所依據的特徵和發現相似的患者。這就提出了這樣一個問題,即在製定診斷或治療建議時,此類算法是否應考慮公共衛生(即稀缺資源的使用),以及此類考慮在多大程度上是算法決策過程的一部分。

在進行臨床研究中使用 AI 和機器學習應用程序

人工智能和機器學習有可能通過更有效地招募和匹配研究參與者以及更全面的數據分析來改進並可能簡化和加速臨床試驗。此外,還可以通過將歷史數據與目標試驗註冊標準相匹配來創建綜合對照組。人工智能和機器學習也可用於更好地預測和理解可能的不良事件和患者亞群。AI 似乎有可能生成「合成患者」以模擬診斷或治療結果。但是人工智能和機器學習應用程序和乾預措施的使用帶來了一系列不確定性,這些不確定性必須在協議和臨床試驗報告中加以處理。

在這個 AI in Medicine 系列中,我們計劃涵蓋 AI 和醫學接口的進展、陷阱、承諾和發布。重要的是要了解這是一個快速發展的領域,因此在某種程度上,我們發布的內容可能具有從子彈頭列車拍攝的景觀快照的分辨率。具體來說,在發佈時間附近發生的事情可能會變得模糊,因為它們變化很快,但遠處的背景將處於相當好的焦點上。人工智能和機器學習取得實質性進展的一個領域(即,在我們的快照類比中,在前景中)是可供公眾使用的複雜聊天機器人的出現。儘管聊天機器人最近才以可能對日常醫療實踐產生影響的複雜程度被引入。

聊天機器人將成為醫學實踐中的重要工具

在本期《新英格蘭醫學期刊》中, Lee 等人的一篇文章。介紹了 GPT-4 聊天機器人及其醫療應用。這篇文章是由一組研究人員撰寫的,他們為創建 GPT-4 的實體工作,GPT-4 是一個受過包括醫學知識在內的廣泛教育的聊天機器人。在我們看到未來之前,快速回顧一下過去會有所幫助。聊天機器人是一種計算機程序,它使用人工智能和自然語言處理來理解問題並自動回答問題,模擬人類對話。麻省理工學院人工智能實驗室的 Joseph Weizenbaum 於 1964 年至 1966 年間開發了一個非常早期的醫療聊天機器人 ELIZA。

如上所述,聊天機器人技術現在幾乎無處不在,從客戶服務到個人虛擬助理。借助當今可用的強大計算機,語言模型擁有數千億個參數,可用於生成新文本。這種能力與用於訓練網絡的幾乎無限量的可用(互聯網)數據相結合,意味著語言模型可以做越來越多的事情,如 Chat Generative Pre-trained Transformer 或 ChatGPT 所示。

ChatGPT 是 OpenAI 訓練的語言模型。它於 2022 年 11 月公開介紹(https://openai.com/blog/chatgpt. 在新標籤頁中打開) 並展示了人工智能驅動的機器與人互動的新方式。新一代聊天機器人有望成為抄寫員和教練,但有一些關鍵的警告。ChatGPT 的開發人員在發佈時描述了其中的許多注意事項,但如 Lee 等人所詳述,在用於醫學時需要特別考慮。如上所述,在當前的迭代中,新一代聊天機器人可以幫助解決醫療文檔問題並回答有助於鑑別診斷的關鍵問題。但很難知道所提供的答案是否基於適當的事實。臨床醫生有責任校對聊天機器人的工作,就像臨床醫生需要校對他們口授的臨床筆記一樣。困難在於這種校對可能超出了用戶的專業知識。校對患者就診記錄可能完全在提供者的專業知識範圍內,但如果聊天機器人被問到「路邊諮詢」的問題,則答案的準確性可能更難確定。

最具潛力和最受關注的應用是使用聊天機器人進行診斷或推薦治療。沒有臨床經驗的用戶可能難以區分事實與虛構。這兩個問題都在 Lee 及其同事的文章中得到了解決,他們指出了在醫學中使用聊天機器人的優點和缺點。由於作者創建了一個這樣的實體,因此很可能存在偏見。

儘管如此,我們認為聊天機器人將成為醫學實踐中的重要工具。就像任何好的工具一樣,它們可以幫助我們更好地完成工作,但如果使用不當,它們就有可能造成損害。由於這些工具是新的並且很難使用上述傳統方法進行測試,因此醫學界將學習如何使用它們,但我們必須學習。毫無疑問,聊天機器人也會向用戶學習。因此,我們預計用戶和工具都會有一段適應期。

人工智能和機器學習不會讓醫學專業人員失業

我們堅信,在醫學中引入人工智能和機器學習已經幫助衛生專業人員提高了他們可以提供的護理質量,並有望在不久的將來和以後進一步提高。就像計算機獲取射線照相圖像消除了 X 射線檔案室和丟失的圖像一樣,人工智能和機器學習可以改變醫學。隨著我們與技術一起成長,衛生專業人員將弄清楚如何使用人工智能和機器學習。人工智能和機器學習不會讓衛生專業人員失業;相反,它們將使衛生專業人員能夠更好地完成工作,並為人與人之間的互動留出時間,這使醫學成為我們都重視的有價值的職業。

本文僅代表作者立場,不代表本平台立場

分享文章

Facebook Comments 文章留言

特別報導
特別報導
銳傳媒資料中心

專欄

推薦閱讀