當(dāng)前位置 > 首頁 > 技術(shù)文章 > 深度學(xué)習(xí)在藥物研發(fā)領(lǐng)域的應(yīng)用方向及常見算法

選型 | 市場 | 應(yīng)用 | 使用 | 法規(guī) | 技術(shù) | 其他

深度學(xué)習(xí)在藥物研發(fā)領(lǐng)域的應(yīng)用方向及常見算法

瀏覽次數(shù)：568　發(fā)布日期：2024-3-26　來源：本站　僅供參考，謝絕轉(zhuǎn)載，否則責(zé)任自負(fù)

一般而言，一種藥物研發(fā)周期在 10 年以上，研發(fā)投入在數(shù)十億美金，并且呈現(xiàn)逐年上升的趨勢。近年來，深度學(xué)習(xí) (Deep Learning, DL) 技術(shù)在語音識別、圖像識別等領(lǐng)域取得重大突破，迅速成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。

深度學(xué)習(xí)是人工智能的一個分支，它是一種利用神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)的技術(shù)。深度學(xué)習(xí)技術(shù)在生物醫(yī)學(xué)領(lǐng)域已經(jīng)取得重要進(jìn)展，目前研究人員已經(jīng)開發(fā)了一系列基于深度學(xué)習(xí)的疾病診斷、蛋白質(zhì)設(shè)計、醫(yī)學(xué)圖像識別的應(yīng)用策略。制藥工業(yè)界目前也開始重視深度學(xué)習(xí)技術(shù)，希望利用其加速藥物研發(fā)并降低成本。

此前的研究表明，深度學(xué)習(xí)技術(shù)在優(yōu)化化學(xué)合成路線、預(yù)測藥物的藥代動力學(xué)性質(zhì)、預(yù)測藥物的作用靶點(diǎn)以及生成新型分子等方面具有優(yōu)勢。

圖 1. 虛擬篩選在藥物開發(fā)流程中的地位^[1]。

▐ 虛擬篩選：化合物-靶蛋白的親和力
深度學(xué)習(xí)可以通過訓(xùn)練大量的已知化合物-靶蛋白相互作用數(shù)據(jù)來學(xué)習(xí)化合物和靶蛋白之間的內(nèi)在關(guān)系。這種訓(xùn)練過程使得深度學(xué)習(xí)模型能夠自動提取和利用化合物和靶蛋白的特征，以及它們之間的相互作用模式。

Yelena Guttman 等人基于 DeepChem 框架，構(gòu)建了一個 CYP3A4 抑制劑預(yù)測模型。先基于 lipinski 五原則對庫中化合物進(jìn)行排除，再基于此模型對 FOODB 庫中 68,900 個化合物進(jìn)行 CYP3A4 抑制活性預(yù)測，順利得到了兩種新的 CYP3A4 抑制劑。

圖 2. 基于 DeepChem 的 CYP3A4 抑制劑預(yù)測^[2]。

在 KNIME 分析平臺 4.0.314 中創(chuàng)建了一個工作流來準(zhǔn)備和分析虛擬篩選。

▐ 預(yù)測化合物的 ADMET 性質(zhì)
自 Lipinski 類藥五原則提出以來，對先導(dǎo)化合物的 ADMET (吸收、分布、代謝、排泄和毒性) 性質(zhì)進(jìn)行早期預(yù)測也變得越來越重要。許多研究表明，通過對大量已知化合物的 ADMET 數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)，自動識別和提取化合物特征與性質(zhì)之間的關(guān)系，訓(xùn)練好的深度學(xué)習(xí)模型可以用來預(yù)測新化合物的性質(zhì)，從而加速藥物發(fā)現(xiàn)和開發(fā)的進(jìn)程。

Liu 等人利用定向消息傳遞網(wǎng)絡(luò) (directed message passing neural networks, D-MPNN，又稱 Chemprop) 對 FOODB 庫中化合物進(jìn)行了 Nrf2 激動活性預(yù)測及毒性分析，順利得到了Nicotiflorin這一兼具 Nrf2 激動活性和安全性的藥物，并且在體內(nèi)外實驗中得到了驗證[3]。

圖 3. 利用深度學(xué)習(xí)算法評估藥物安全性^[3]。

▐ 優(yōu)化化學(xué)合成路線

近年來，人們已經(jīng)看到人工智能 (AI) 開始為化學(xué)合成帶來革命性的變化。然而，由于缺乏合適的化學(xué)反應(yīng)表示方式和反應(yīng)數(shù)據(jù)的稀缺性，限制了人工智能在反應(yīng)預(yù)測中的廣泛應(yīng)用。深度學(xué)習(xí)可以通過對大量的化學(xué)合成數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)，自動識別和提取合成路線的特征和模式，用來預(yù)測新的合成路線的效率和選擇性，從而加速新藥的開發(fā)和生產(chǎn)。

圖 4. 深度學(xué)習(xí)在預(yù)測化學(xué)反應(yīng)合成路線上的應(yīng)用^[4]。

Schwaller 等人結(jié)合了深度學(xué)習(xí)網(wǎng)絡(luò)和符號人工智能來規(guī)劃化學(xué)合成路線。他們開發(fā)了一個名為“MoleculeNet”的框架，該框架能夠預(yù)測反應(yīng)是否可能成功，并使用這些預(yù)測來規(guī)劃出從起始原料到目標(biāo)分子的合成路徑[5]。

深度學(xué)習(xí)在虛擬篩選領(lǐng)域中的應(yīng)用，主要是通過神經(jīng)網(wǎng)絡(luò)來預(yù)測化合物的活性或性質(zhì)，從而在虛擬環(huán)境中篩選出有潛力的候選藥物或材料。

以下是一些常見的深度學(xué)習(xí)算法在虛擬篩選中的應(yīng)用：

卷積神經(jīng)網(wǎng)絡(luò) (CNN)：CNN 特別適合處理圖像數(shù)據(jù)，如分子結(jié)構(gòu)圖。通過識別和提取分子中的特征，如原子和化學(xué)鍵的類型和位置，CNN 可以預(yù)測分子的性質(zhì)和活性。

循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN)：對于處理序列數(shù)據(jù) (如化學(xué)分子序列) 的虛擬篩選任務(wù)，RNN 特別有用。RNN 可以捕捉分子序列中的長期依賴關(guān)系，從而更準(zhǔn)確地預(yù)測分子的性質(zhì)。

生成對抗網(wǎng)絡(luò) (GAN)：GAN 可以生成新的分子結(jié)構(gòu)，這在進(jìn)行虛擬篩選時非常有用。通過訓(xùn)練 GAN，可以生成具有所需性質(zhì)的分子，從而大大減少實驗的必要性。

圖神經(jīng)網(wǎng)絡(luò) (GNN)：GNN 特別適合處理圖結(jié)構(gòu)數(shù)據(jù)，如分子圖。GNN 可以捕捉分子中原子和化學(xué)鍵之間的關(guān)系，從而更準(zhǔn)確地預(yù)測分子的性質(zhì)。

Transformer：對于處理長序列數(shù)據(jù)的虛擬篩選任務(wù)，如多步化學(xué)反應(yīng)預(yù)測，Transformer 是一個很好的選擇。Transformer 可以捕捉序列中的長期依賴關(guān)系，從而更準(zhǔn)確地預(yù)測分子的性質(zhì)。

今天，小 M 給大家介紹了深度學(xué)習(xí)在藥物研發(fā)領(lǐng)域的應(yīng)用方向及常見算法，作為一種新興的技術(shù)，AI / 深度學(xué)習(xí)技術(shù)在新藥研發(fā)領(lǐng)域已初見成效，相信隨著科學(xué)的進(jìn)步，AI 助力藥物篩選一定會在生物醫(yī)藥領(lǐng)域有著更加深遠(yuǎn)的影響。

Virtual Screening

虛擬篩選 (Virtual Screening, VS) 是基于小分子數(shù)據(jù)庫開展的活性化合物篩選。利用小分子化合物與藥物靶標(biāo)間的分子對接運(yùn)算，虛擬篩選可快速從幾十至上百萬分子中，遴選出具有成藥性的活性化合物，大大降低實驗篩選化合物數(shù)量，縮短研究周期，降低藥物研發(fā)的成本。

MCE 50K Diversity Library

MCE 50K Diversity Library 由 50,000 種類藥化合物組成。依據(jù)谷本相似性 (Tanimoto Coefficient) 及聚類算法 (Bemis-Murcko) 對上百萬化合物進(jìn)行篩選以確保結(jié)構(gòu)多樣性。本多樣性庫具備新穎性、類藥性，化合物結(jié)構(gòu)類型多樣、化學(xué)空間豐富，庫中化合物可重復(fù)供應(yīng)，是新藥研發(fā)的有力工具，可以廣泛地應(yīng)用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。

MegaUni 10M Virtual Diversity Library

運(yùn)用生成式人工智能技術(shù)，依托強(qiáng)大的計算能力，基于高質(zhì)量的 40,662 個分子砌塊，匹配合適的反應(yīng)規(guī)則，選擇最優(yōu)的化合物生成策略，去除合成難度高、類藥性低、PAINS 等不利化合物后，進(jìn)一步分析化合物骨架，優(yōu)選出類藥多樣性分子組成虛擬庫，適用于 AI 藥物篩選、大型虛擬篩選等。

MegaUni 50K Virtual Diversity Library

Retatrutide 是胰高血糖素受體 (GCGR)、葡萄糖依賴性促胰島素多肽受體 (GIP 優(yōu)選 50,000 個分子組成 MegaUni 50K Virtual Diversity Library。50,000 個分子具有 46,744 種 BMS 分子骨架，每種分子骨架僅包含 1-3 個化合物，化學(xué)空間多樣，結(jié)構(gòu)新穎，適用于新型先導(dǎo)物發(fā)現(xiàn)等。

MCE 的所有產(chǎn)品僅用作科學(xué)研究或藥證申報，我們不為任何個人用途提供產(chǎn)品和服務(wù)。

參考文獻(xiàn)：
[1] Rifaioglu AS, et al. Recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases. Brief Bioinform. 2019 Sep ;20(5):1878-1912.

[2] Guttman Y, Kerem Z. Dietary Inhibitors of CYP3A4 Are Revealed Using Virtual Screening by Using a New Deep-Learning Classifier. J Agric Food Chem. 2022 Mar ;70(8):2752-2761.

[3] Liu S, et al. Virtual Screening of Nrf2 Dietary-Derived Agonists and Safety by a New Deep-Learning Model and Verified In Vitro and In Vivo. J Agric Food Chem. 2023 May ;71(21):8038-8049.

[4] Li B, et al. A deep learning framework for accurate reaction prediction and its application on high-throughput experimentation data. J Cheminform. 2023 Aug;15(1):72.

[5] Segler MHS, et al. Planning chemical syntheses with deep neural networks and symbolic AI. Nature. 2018 Mar ;555(7698):604-610.

索取資料

來源：上海皓元生物醫(yī)藥科技有限公司
聯(lián)系電話：021-58955995
E-mail：sales@medchemexpress.cn

【點(diǎn)擊可查看上海皓元生物醫(yī)藥科技有限公司相關(guān)產(chǎn)品】

分享到：QQ空間新浪微博騰訊微博微信

【所有文章】【本類新聞】【相關(guān)產(chǎn)品】【關(guān)閉窗口】

本類文章

本類新聞