popEVE:利用演化資料學習的人工智慧革新罕見疾病診斷 | 準確率高達 98%,超越 AlphaMissense。 popEVE:利用演化資料學習的人工智慧革新罕見疾病診斷 | 準確率高達 98%,超越 AlphaMissense。

popEVE:利用演化資料學習的人工智慧革新罕見疾病診斷 | 準確率高達 98%,超越 AlphaMissense。


哈佛醫學院和巴塞隆納基因組調控中心 (CRG) 的一個研究團隊開發了一種名為「popEVE」的人工智慧模型,用於輔助診斷罕見疾病,並在《自然遺傳學》雜誌上發表了他們的研究成果。

popEVE結合了數十萬個物種的進化數據以及來自英國生物銀行和gnomAD的基因數據,對約2萬種人類蛋白質的突變嚴重程度進行排序。研究團隊使用超過3.1萬個家庭的基因數據驗證了該模型,發現popEVE在98%的病例中正確識別出了致病突變,優於DeepMind的AlphaMissense。

popEVE發現了123個先前未與發育障礙相關的全新基因,其中104個基因僅在一到兩名患者中觀察到。該模型僅利用患者的基因資訊即可進行診斷,即使在醫療資源有限的系統中也能實現快速且低成本的診斷。

從: 文献リンク人工智慧從生命之樹中學習,以輔助罕見疾病診斷。

【社論】

這款名為 popEVE 的人工智慧模型之所以備受關注,是因為它有望解決罕見疾病診斷中的一個根本性難題。目前,約有 50% 的罕見疾病患者無法明確診斷,迫使他們經歷漫長的診斷過程,即所謂的「診斷之旅」。 popEVE採用獨特的進化方法來解決這個問題。

popEVE 與傳統 AI 診斷工具的關鍵區別在於它能夠比較不同基因突變的「嚴重程度」。例如,現有的預測模型(如 AlphaMissense)可以判斷基因 A 中的突變是否有害,但它們無法在同一尺度上比較基因 A 和基因 B 的突變。這項限制在臨床應用中構成重大難題,因為醫生需要識別患者整個基因組中最有害的突變。

popEVE 利用數十億年的進化歷史作為訓練資料。地球上的生命已經進行了無數次實驗,測試蛋白質能夠耐受哪些變化,哪些變化是致命的。透過將這龐大的「自然實驗」數據與來自英國生物銀行和gnomAD的健康人群的基因數據相結合,我們可以建立反映人類獨特限制的預測模型。

popEVE在臨床實務上的實用性也備受讚譽。在一項納入超過31,000個家庭的驗證研究中,在已確定致病原因的病例中,popEVE在98%的病例中正確地將突變列為最有害的突變。更重要的是,它能夠僅基於患者自身的基因資訊進行診斷。傳統的診斷方法需要進行“三聯體分析”,即與父母雙方的DNA進行比對,而popEVE則無需這一步驟。這使得即使在醫療資源匱乏或無法取得父母DNA的情況下,也能進行診斷。

研究團隊發現了123個先前未與發育障礙相關的全新基因,其中104個基因與僅在一兩名患者中觀察到的「獨特」罕見疾病相關。在論文審查期間,其中25個基因在獨立研究中被證實為疾病相關基因,顯示popEVE具有很高的預測準確性。

另一個重要特點是解決基因資料庫中的種族偏見問題。現有的基因資料庫有偏向歐洲血統族群的問題,其他一些工具也存在著將從未出現過的突變誤判為致病突變的問題。 popEVE旨在平等對待所有人類種族的突變,從而減少假陽性結果,實現更公平的診斷。

popEVE未來潛在的應用之一是識別新藥研發標靶。高精度識別致病基因突變將有助於我們了解這些突變如何破壞蛋白質功能,從而加速標靶療法的研發。它還可應用於產前診斷和新生兒篩檢。

然而,popEVE也存在著限制。此模型僅能解讀改變蛋白質結構的錯義突變,而無法涵蓋其他類型的突變(例如無義突變或缺失)。此外,此人工智慧模型僅是臨床決策輔助工具,並非旨在取代醫師的專業知識和病史分析。

隨著基因組醫學的日益普及,對popEVE這類解讀工具的需求可能會增加。尤其值得一提的是,它為診斷全球僅有一例的罕見疾病開闢了道路,這對於醫學民主化而言是一項極其重要的進展。

[術語]

popEVE(人口感知型 EVE)
該突變預測人工智慧模型結合了演化和人口統計數據,是第一個能夠對大約 20,000 種人類蛋白質的突變嚴重程度進行一致排名的工具。

錯義突變
DNA突變是指DNA序列中單一鹼基發生改變,導致構成蛋白質的胺基酸被另一種胺基酸取代。 DNA突變既有致病性的,也有無害的,區分二者是診斷上的一大挑戰。

蛋白質體<br>指生物體內所有蛋白質的完整圖譜。在人類中,基因組編碼約20,000種蛋白質,popEVE評估的是整個人群的突變情況。

三聯體分析<br>一種基因診斷方法,透過比較患者及其父母的基因資訊來進行診斷。 popEVE 僅使用患者的數據即可進行診斷,因此無需進行三聯體分析。

診斷之旅:醫學術語,指的是患有罕見疾病的患者可能需要數年時間,輾轉於多家醫療機構,才能獲得準確的診斷。

[參考連結]

基因組調控中心(CRG) (外部)
一家總部位於巴塞隆納的國際基因組研究機構。它與哈佛大學合作開發了popEVE。

哈佛醫學院(外部)
一所著名的美國醫學院,領導 popEVE 計畫的 Debora Marks 博士就職於此。

自然遺傳學(外部)
這是一份國際遺傳學期刊,發表popEVE的研究成果。該期刊發表的論文均經過高度可靠的同儕審查。

英國生物銀行(外部)
作為全球最大的生物樣本庫之一,它收集了約 50 萬英國公民的基因和健康數據。

[參考文章]

新型人工智慧模型或可加快罕見疾病診斷速度(外部連結)
哈佛醫學院官方宣布,popEVE 的準確率達到了 98%。

人類疾病遺傳學的蛋白質體學模型(外部連結)
《自然遺傳學》上的原始論文提供了 popEVE 的技術細節,並將其與 AlphaMissense 進行了性能比較。

人工智慧從生命之樹中學習,以輔助罕見疾病診斷(外部連結)
我們解釋了 popEVE 如何利用演化數據工作,以及它如何發現了 123 個新的疾病基因。

[編者註]

基因組醫學的發展速度遠超過我們的想像。像popEVE這樣能夠從進化記錄中學習的人工智慧的出現,正開始為以前無法診斷的罕見疾病患者帶來新的希望。

如果您身邊有人出現不明原因的症狀,了解基因組檢測也是一種選擇或許對您有幫助。我們生活在一個科技進步能夠改變每個人生活的時代。您如何看待醫療人工智慧的發展?我很樂意與您探討這個問題,包括您的期望和擔憂。