近日,首屆全球AI藥物研發算法大賽總決賽在清華大學舉行。經過與來自全球高校、科研機構、企業的878支隊伍的激烈角逐,冰鑒科技-南京大學聯合團隊脫穎而出,斬獲三等獎。
首屆全球AI藥物研發算法大賽由百度飛槳、清華大學藥學院和臨港實驗室共同發起,并得到中國藥學會等單位大力支持,同時邀請到多位生物制藥領域專家教授擔任專家委員會委員。
大賽共吸引了來自全球878支團隊的1105人報名參賽,參賽團隊共提交了6080次算法成果。冰鑒科技聯合南京大學組隊參賽,經過歷時3個月戰況激烈的初賽、復賽,與來自微軟亞洲研究院、中國科學院上海藥物研究所、上海交通大學、浙江大學、西安交通大學等14支優秀的隊伍進行總決賽的較量。通過現場答辯,就賽題思路、核心理論、數據分析及處理、算法方案等問題展開深入探討,冰鑒科技-南京大學聯合團隊最終以答辯分數第五、綜合排名第六的成績斬獲三等獎。
本次大賽聚焦于新冠小分子藥物等熱點議題,旨在鼓勵參賽者利用人工智能方法,發掘治療新冠病毒的潛在藥物。?參賽者可以利用深度學習、分子對接等方法,預測和評估小分子與主蛋白酶之間的相互作用,以及小分子在細胞中抑制病毒復制的潛力,挖掘潛在的藥物候選物。以期通過本次大賽,推動藥物研發領域的創新,為未來的疾病治療和防控工作提供有力的支持。
本次的參賽團隊由冰鑒科技和南京大學Christopher J. Butch課題組共同組成,包括冰鑒科技的智能決策部和模型開發部的成員,以及南京大學Chris教授團隊。在初賽中,團隊嘗試了Bayes Ridge, SVM, LightGBM, GBDT等多種傳統機器學習算法和Transformer-CNN、GCN、D-MPNN等深度神經網絡模型,并嘗試使用分子的3D構象信息、graph特征、摩根分子指紋等多種分子表征方法對分子的酶活性進行預測。其中,SVM模型和摩根分子指紋的訓練方法在預測酶實驗活性中發揮了良好效果。
復賽任務是更為復雜的分子在Caco2細胞實驗中的活性預測。面對這一挑戰,冰鑒科技-南京大學團隊采用特征融合的方法,對GEM基線模型進行了創新性的修改,并加入新的MFP encoder結構,將關注分子全局結構和形狀的graph特征與關注分子內部局部結構信息的摩根分子指紋結合在一起。這為模型提供了更全面的分子信息,提升了模型對分子活性的預測分類能力,也降低了過擬合的風險,提升了模型的泛化能力。同時,團隊還引入了Drop out機制,并使用分子的scaffold作為依據來劃分訓練集和驗證集,以更真實地評估模型在面對新分子時的預測性能。
自2022年3月開始,冰鑒科技與南京大學強強聯合,共同探索AI+醫藥領域的前沿技術與應用,致力于計算機輔助藥物分子設計方法和應用研究,使用人工智能、分子動力學模擬、計算生物學等技術與化學/生物學實驗室的有機結合來加速藥物分子的發現。
僅一年時間,雙方的合作就取得了顯著的成果。除了在大賽中獲得獎項之外,本月合作團隊還發表了一篇重要的SCI論文《Improving drug discovery with a hybrid deep generative model using reinforcement learning trained on a Bayesian docking approximation》,介紹新的藥物發現方法——該方法結合深度生成模型和強化學習,通過使用貝葉斯回歸模型預測的近似對接分數來訓練,生成的新化合物在對接分數上比相似大小的分子提高了10-20%,同時比僅使用對接的方法快了130倍,可以有效地用于發現具有潛在治療應用的新化學分子形態。
?
?