在創(chuàng)新藥物研發(fā)中,一個核心問題是如何快速發(fā)現(xiàn)具有理想生物學特性的新化學實體癣吝。然而询枚,滿足Lipinski's類藥性的化學空間所包含的理論分子數(shù)可能超過1063【1】保蒲,如何更高效地探索這樣巨大的多樣性空間假褪,找到具有良好的可合成性和成藥性的新分子是擺在計算化學家和藥物化學家面前的一道難題亡谭。針對這一問題筐带,Reymond團隊利用窮舉法構(gòu)建重原子數(shù)在13到17范圍之內(nèi)的分子結(jié)構(gòu)彪薛,建立了包含有166億個化合物的GDB庫【2】鳞贷;Levré等人從市售的炔烴和疊氮化物出發(fā)通過使用Click反應(yīng)規(guī)則構(gòu)建了Zinclick數(shù)據(jù)庫【3】坯汤,該庫具有較好的可合成性但結(jié)構(gòu)類型相對單一虐唠;此外,也有一些基于人工智能(Artificial Intelligence惰聂,AI)?方法疆偿,例如Segler等人利用LSTM模型設(shè)計集中化合物庫【4】,Zhavoronkov等人將基于生成對抗網(wǎng)絡(luò)?(GANs)的AI技術(shù)應(yīng)用到化學空間探索【5】搓幌。雖然方法眾多杆故,但這些虛擬化合物庫都面臨著多樣性、可合成性和成藥性的多方面問題溉愁。
如果將尋找藥物新化學實體看做數(shù)據(jù)科學中的采樣問題处铛,那在已知藥物結(jié)構(gòu)所代表的數(shù)據(jù)點附近進行采樣無疑是獲得類藥分子結(jié)構(gòu)的高效策略之一。
?
近日拐揭,中國科學院上海藥物研究所蔣華良撤蟆、鄭明月課題組從已批準上市藥物出發(fā),采用電子等排體和化學反應(yīng)轉(zhuǎn)化規(guī)則構(gòu)建了成藥性拓展空間數(shù)據(jù)庫DrugSpaceX?(https://drugspacex.simm.ac.cn/)码累。研究結(jié)果近期在線發(fā)表于Nucleic Acids Research譬椰,題為“DrugSpaceX: a large screenable and synthetically tractable database extending drug space”?【6】。中國科學院上海藥物研究所藥物設(shè)計與發(fā)現(xiàn)中心?(DDDC)的蔣華良和鄭明月研究員為論文通訊作者激撮,第一作者是博士研究生楊天標姚不,博士后李召軍為共同第一作者。
目前版本的DrugSpaceX包含超過1億種可用于虛擬篩選的新分子結(jié)構(gòu)泉惋,且在類藥性衷玩、可合成性和三維化學多樣性空間覆蓋率方面均具有突出的特點?(圖1),為開展虛擬篩選和藥物分子設(shè)計提供了高質(zhì)量的資源扔缭。此外盾倍,DrugSpaceX還提供了幾個規(guī)模較小的子集,包括10%多樣性子集洗馅,擴展的類藥性子集膀钝,類藥性子集,先導化合物子集和片段子集等赌羽,可供用戶免費下載使用萎煤。
圖1 DrugSpaceX數(shù)據(jù)庫在類藥性,可合成性和結(jié)構(gòu)多樣性上均具有突出的特點
研究團隊使用了盤狀蛋白結(jié)構(gòu)域受體1?(discoidin domain receptor 1, DDR1)?進行案例研究领迈,展示了如何利用DrugSpaceX快速篩選活性化合物?(圖2)彻磁。首先,以藥物數(shù)據(jù)集為出發(fā)點進行基于結(jié)構(gòu)的虛擬篩選狸捅,選擇分子對接打分前十的藥物分子衷蜓。通過文獻檢索可以發(fā)現(xiàn)其中Imatinib,Nilotinib,Ponatinib均對DDR1有交叉活性磁浇。然后斋陪,從DrugSpaceX上檢索前十名藥物分子第一輪衍生物,再進行第二輪篩選扯夭△⒓郑可以發(fā)現(xiàn),在第一輪衍生物中對接打分前十的化合物主要集中在ponatinib周圍(如圖2A所示)交洗,其中排名第3的化合物DE209841骑科,已被Insilico Medicine最近報道的DDR1抑制劑專利所覆蓋(NO. WO2020079652A1)。圖2B中顯示了DE209841的預測結(jié)合模式构拳,與Zhavoronkov等人文章報道的結(jié)合模式吻合【5】账菊。進一步解析重構(gòu)數(shù)據(jù)集并采用相同篩選流程,可以發(fā)現(xiàn)對接打分和配體效率更高的新結(jié)構(gòu)DE50204704耀奠。如圖2C所示册吹,該分子結(jié)構(gòu)可以視作是老藥Ponatinib經(jīng)過對“tail” 和“l(fā)inker” 片段進行兩輪改造得到的。
圖2 預測DDR1激酶抑制劑
除了幫助藥物化學家能夠進行快速的骨架躍遷和分子設(shè)計用堤, DrugSpacesX為我們提供了一種高效探索類藥化學空間的思路馒狡。可以發(fā)現(xiàn)萌烁,通過將專家知識和人工智能相互融合煮肋,我們可以在巨大的虛擬化學空間中更容易地找到具有理想生物效應(yīng)的目標化合物。此外绎儡,Christoph Gorgulla等人近期在Nature發(fā)表的文章中也指出超大規(guī)模虛篩可以提高真陽性率【7】响友,DrugSpaceX也可以與VirtualFlow等虛擬篩選平臺結(jié)合使用,通過擴大初始篩選規(guī)模和提高篩選庫質(zhì)量兩方面來進一步提升效率蚯氯。目前扳辉,研發(fā)團隊還在對DrugSpaceX進行擴充和完善,期待后續(xù)可以推出功能更為強大的版本橄浓。
?
原文鏈接:
https://doi.org/10.1093/nar/gkaa920
參考文獻
1.Reymond, J.L. (2015) The chemical space project.?Acc. Chem. Res., 48, 722-730.
2.Ruddigkeit, L., van Deursen, R., Blum, L.C. and Reymond, J.L. (2012) Enumeration of 166 billion organic small molecules in the chemical universe database GDB-17.?J. Chem. Inf. Model., 52, 2864-2875.
3.Levré, D., Arcisto, C., Mercalli, V. and Massarotti, A. (2019) ZINClick v.18: Expanding Chemical Space of 1,2,3-Triazoles.?J. Chem. Inf. Model., 59, 1697-1702.
4.Segler, M.H.S., Kogej, T., Tyrchan, C. and Waller, M.P. (2018) Generating Focused Molecule Libraries for Drug Discovery with Recurrent Neural Networks.?ACS Cent Sci, 4, 120-131.
5.Zhavoronkov, A., Ivanenkov, Y.A., Aliper, A., Veselov, M.S., Aladinskiy, V.A., Aladinskaya, A.V., Terentiev, V.A., Polykovskiy, D.A., Kuznetsov, M.D., Asadulaev, A.?et al.?(2019) Deep learning enables rapid identification of potent DDR1 kinase inhibitors.?Nat. Biotechnol., 37, 1038-1040.
6.Yang, T., Li, Z., Chen, Y., Feng, D., Wang, G., Fu, Z., Ding, X., Tan, X., Zhao, J., Luo, X.?et al.?(2020) DrugSpaceX: a large screenable and synthetically tractable database extending drug space.?Nucleic Acids Research.
7.Gorgulla, C., Boeszoermenyi, A., Wang, Z.F., Fischer, P.D., Coote, P.W., Padmanabha Das, K.M., Malets, Y.S., Radchenko, D.S., Moroz, Y.S., Scott, D.A.?et al.?(2020) An open-source drug discovery platform enables ultra-large virtual screens.?Nature, 580, 663-668.