Nature子刊:AI檢測毒品準確率達86%,沒見過的也能測
本週一,據外媒NewScientist報導,加拿大哥倫比亞大學研究小組創造了一種機器學習工具——DarkNPS,可以用AI快速篩選新精神活性物質(new psychoactive substance,NPS),這是與可卡因和海洛因類似的興奮劑藥物。
由於NPS的化學多樣性及其在非法市場上的存在時間短等性質,目前該藥物的檢測措施面臨重大挑戰。DarkNPS可以大大縮短新出現的NPS識別時間,並有效縮短對其化學結構的搜索範圍。
該論文發表於Nature子刊Nature Machine Intelligence。
鏈接:https://www.nature.com/articles/s42256-021-00407-x

一、AI查毒只需幾小時,準確率達86%
新精神活性物質又稱“策劃藥”或“實驗室毒品”,是不法分子為逃避打擊而對管制毒品進行化學處理所得到的毒品類似物,具有與管制毒品相似或更強的興奮、致幻、麻醉等效果。
加拿大不列顛哥倫比亞大學研究小組成員Michael Skinnider和他的同事創造了一種名為DarkNPS的機器學習工具,通過AI工具進行簡單的分析,快速提取出精神活性“新型藥物”化學結構的可能分子結構。
該工具可以快速開發實驗室測試服務,以篩選與可卡因和海洛因等毒品具有類似效果的、且無法在當前測試中檢測到的藥物使用情況。
研究小組從世界各地的法醫實驗室收集了大約1700種已知新型設計藥物的化學結構,對其進行訓練。訓練集包括每種藥物的串聯質譜結果,也就是翻譯並分析其部分重組蛋白數據,可以提供有關分子質量及其包含的元素的信息。這使得AI能夠識別串聯質譜數據和化學結構之間的模式。
Skinnider表示:“我們的方法可以將識別NPS所需的時間從幾週或幾個月縮短到幾個小時。”
給定一種以前未知的NPS的串聯質譜數據,DarkNPS可以猜測其分子結構。該過程準確度約為51%。如果AI能夠對其分子結構的前10項進行預測,其準確度將增加到86%,這意味著該工具能有效縮小對分子結構的搜索範圍。
Skinnider說:“這不僅節省了大量時間,還能更快識別新上市的新精神活性物質。”
二、1700個實例生成穩健AI模型
研究小組在論文中表示,DarkNPS可以僅使用質譜數據自動闡明未知NPS的化學結構,並基於化學結構的深層生成模型。
該研究小組的模型橫跨化學和深度學習領域,因為它們有可能根據需要生成具有任意物理化學或生物性質的分子,從而解決所謂的“逆向設計”問題。
這項工作的大部分集中在分析具有活性的特定藥物對策分子結構可能性上。
研究小組表示,他們在研究過程中尋求生成與一個或多個分析測量特性相匹配的類NPS分子,並使用適用於處理低級數據存儲區的策略來實現這一目標。
從約1700個實例中學習設計藥物的穩健生成模型,並從這個模型中取樣,隨機產生與現有的NPS存儲空間類似的新的分子結構。
研究過程顯示,從模型中取樣新分子的頻率可以用來表明最有可能解釋觀測到的精確質量的化學結構。將生成的結構與串聯質譜數據相結合,進一步提高了結構解析的準確性。
DarkNPS最先闡明了2021年2月首次出現在歐洲的NPS的分子結構。
該模型的最終結果是建立新型精神活性物質的深層生成模型。
三、AI生成數據,為模型提供數據庫
許多計算工具已經開發出來,能夠在質譜數據中自動識別藥物及其代謝產物。然而,所有這些工具都需要一個已知化學結構的數據庫,可以將觀察到的質譜數據與之進行比較。因此,這些工具無法用於識別現有數據庫中未發現的新合成設計藥物。
該研究小組推斷,通過生成一個新的、類似核動力源的化學結構數據庫,就可以自動識別完全未知的核動力源。因此,研究人員著手學習核動力源化學結構的深層生成模型,從中隨機取樣新的核動力源結構(圖1a-b)。
目前包含NPS結構最新、最全面的資源數據庫是用於NPS篩選的數據庫HighResNPS,來自世界各地數十家法醫實驗室的貢獻者在生物樣本或執法部門緝獲的物品中檢測到新物質時,會向HighResNPS提交數據。儘管如此,在2020年6月初,該數據庫僅包含1753個獨特的NPS結構。

這一數據集的有限規模反映了非法市場上出現並隨後被法醫實驗室檢測到的核動力源數量。然而,通常用於訓練化學結構生成模型的數據集將包含數十萬個數據。
之後,該研究團隊獲得了194種NPS藥物的數據,發現其中176種出現在AI生成的數據中。研究人員還通過使用AI推斷1億種可能的化學結構,研究未來可能生成的藥物。
此外,哥倫比亞大學梅爾曼公共衛生學院的研究人員正在研究使用機器學習來評估法律及其與處方阿片類藥物分配模式的關係。
“機器學習方法越來越多地應用於類似的高維數據問題,並可能為其他形式的政策分析提供一種補充方法,包括作為篩選工具來識別需要進一步關注的政策和法律規定相互作用。”哥倫比亞大學流行病學副教授Silvia Martins說。
結語:AI+醫療,落地場景更廣闊
“機器學習方法越來越多地應用於類似的高維數據問題,並可能為其他形式的政策分析提供一種補充方法,包括作為篩選工具來識別需要進一步關注的政策和法律規定相互作用。”哥倫比亞大學流行病學副教授Silvia Martins說。
NPS特殊的化學結構,使得不法分子有可乘之機,而AI模型能夠快速識別其分子結構,並利用AI從藥物分子結構中預先推斷其可能的情況,提前阻止某些藥物流入市場。這為AI工具的應用提供了新範例,能夠評估類似的藥物分子結構、藥物分配模式等問題。