摘要:抗生素通过针对入侵的生物体将本身置身于宿主-病原体的进化军备竞赛中。然而,跟着病原体因天然选择进化出的耐药性,抗生素医治效果下降。别的,抗生素的研发是一个成本高及周期长的工程,耐药性的呈现促使人们对有望加快候选药物发现的计算办法产生了极大的兴致。本文论述了人工智能在小分子抗生素和抗菌肽的发现方面获得的停顿。除了抗菌活性的根本预测外,还强调抗菌化合物的表征、类药性的预测、抗菌素耐药性和从头分子设想。
人工智能加速抗生素发现
Ref:Commun. Biol. Published: 9 September 2021 IF=6.268
链接:
1 研究布景
细菌耐yao性(AMR)的呈现削弱了抗生素的成效,使全球发病率和灭亡率程度升高。美国疾病掌握和预防中心估量,美国每年有280万传染是由耐药细菌引起的,此中有3.5万人死于那种无法医治的传染。临床试验中的抗生素也与现有的耐药机造的药物类似,进一步强调了发现全新抗生素的需要性。抗生素的研发是一个成本高及周期长的工程。2014年至2019年期间,只要14种新的抗生素胜利研发并通过审批。在一项对超越21000种化合物的近186000项临床试验的查询拜访中,研发的新药可以胜利医治流行症的可能性仅为25.2%。那种失败的风险促使企业以更高的投资回报包管停止研发,为学术界启动抗生素设想和优化的早期阶段开拓了道路。
跟着人工智能和大数据范畴的普遍应用,有可能从底子上改动药物发现入彀算模子的切确性和可靠性。可用的开源数据集(表1)、计算机工程的朝上进步以及机器进修算法模子,极大地促进了机器进修在药物发现,出格是抗生素发现中的应用。本文次要介绍了人工智能在小分子抗生素和抗菌肽研发中的应用。
表1与抗生素研发相关的数据库
2 化合物表征
为制止浪费大量时间用于合成非活性化合物和停止尝试,研究人员通过计算来预测新设想分子的活性,在计算模子平分子的表征也是比力重要的一部门(图1)。分子的各类性量和尝试能够产生大量的信息。如,为了描述简单的氨基酸残基,在线数据库中已经有400多个差别的丈量办法;关于小分子药物,有计算和压缩量子力学推导出的描述符来表达拓扑性量的办法。然而,屡次丈量中包罗的大量数据和冗余信息使得利用所有描述符变得不实在际或拔苗助长。因而,需要将尝试数据组合成简单的描述符,以尽可能少的维度来描述尽可能多的信息。如本文中提到可是利用图卷积收集,操纵分子的几何外形和毗连性将它们天然地转换成图,利用神经收集从化学构造中进修分子的特征。轮回神经收集(RNN)也多用于处置分子的SMILES表达,或连系长短期记忆神经收集(LSTM)从已知药物的SMILES进修分子特征并生成新的化合物,或RNN也可与强化进修连系,根据药物的SMILES生成药物的embedding特征。此外,RNN还用于抗菌肽的表征。
图1基于人工智能抗生素的研发办法
3 抗菌活性预测
抗菌活性的预测是机器进修整合到抗生素开发中的核心,颠末多年的研究并为此供给了新的处理计划。如,研究人员利用逻辑回归对训练集中的分子片段停止分类,构造了一个基于分子片段的活性“片段库”,能够将那些分子片段拼接起来做为有活性的新抗生素;研究人员操纵神经收集来表达化合物,然后评估其抗菌才能,以筹算从现有的药物中选出具有抗菌感化的药物;基于撑持向量机预测分子的抗菌活性;基于深度神经收集预测多肽对铜绿假单胞菌的活性;基于RNN的回归模子匹敌菌肽活性的预测等办法。
4 性量预测
较差的药代动力学特征和毒性是临床试验失败的次要原因,因而迫切需要借助机器进修或深度进修的办法对此停止预测。预测的性量次要包罗吸收、散布、代谢、排泄和毒性(ADMET)。本文也提到有一系列工做别离操纵神经收集、分类树、梯度提拔分类器和共识模子预测抗菌肽和类抗菌肽药物的溶血活性。也有一系列研究操纵随机丛林、深度神经收集和深度泰勒合成用于预测候选药物的细胞毒性。
为考虑抗菌肽的化解性和不变性。已有相关工做借用神经收集、梯度加强模子、逻辑回归分类器、撑持向量机和随机丛林预测卵白量化解度。因为卵白酶的降解也会影响抗菌肽不变性的评估,所以可操纵撑持向量机、卷积神经收集、随机丛林分类器和逻辑回归模子来预测水解位点,以有利于先导抗菌肽的挑选和不变性优化。
5 耐药性预测
与大大都医治办法差别,抗生素设想的目的是杀死具有耐药性进化才能的细菌。因而,抗生素药物设想需要考虑细菌耐药性进化。固然当前已有基于机器进修的耐药性预测办法在临床上预测抗生素配方的耐药性,但它也可能在药物开发的尝试中有用。基于耐药性基因组学的机器进修办法将越来越多地专门用于药物开发,例如操纵机器进修对先导化合物的耐药性尝试停止预测。目前基于机器进修的抗药性预测都是基于细菌的基因组特征,而不是药物或分子靶点特征。已有工做基于病原体基因组数据训练了可以预测细菌匹敌生素的敏感性和耐药性表型的机器进修模子。也有工做操纵SVM预测外排介导的耐药性。固然“黑盒”办法可能会限造机器进修在降低耐药风险的效果,但可阐明性的模子能够使模子可以在机体和种群规模上找出耐药性的进化原因。将机器进修与基因-卵白构造图谱,相连系,可研究结核分枝杆菌耐药性进化的驱动因素,其假设付与细菌耐药性的基因之间的彼此感化表示为它们在SVM超平面的权重和符号的相关性。别的,也可基于卵白量同源性的基因变异定位的可阐明耐药性预测。
6 基于生成模子抗生素的发现
生成模子已经被用于化学工程和卵白量工程,包罗无机物的逆向设想和基于图的神经收集模子卵白量折叠生成。做者着重介绍分子从头设想,其凡是利用生成匹敌收集(GANs),变分主动编码器(VAEs)相关的架构。已有工做别离操纵告终合深度强化进修的生成收集,深度生成匹敌主动编码器,可微分强化进修和匹敌训练神经收集,连系蒙特卡罗树搜索的深度神经收集,连系随机和目的指引分子设想的主动编码器GAN用于从头药物设想。鉴于对序列数据的适用性,也有工做操纵承受SMILES输入的RNN模子停止药物设想。如GAN已被用于生成对大肠杆菌的更低按捺浓度明显低于氨苄青霉素的抗菌肽。基于迁徙进修的LSTM生成模子表白,在对较小数据集的目的特异性生物活性分子停止微调后,能够胜利生成已知的靶向金黄色葡萄球菌的分子。此外,有研究者在一个基于单向LSTM的抗菌肽设想中,察看到82%的生成肽是潜在的抗菌肽,而训练数据的氨基酸散布中只要65%的随机摆列被预测为抗菌素。
综之,基于机器进修或深度进修的办法均可加速抗生素或抗菌肽的发现。
操纵人工智能可能从底子上改动药物发现入彀算模子的切确性和可靠性,在尝试中拥有一个称手的“人工智能东西”是能够大幅提拔尝试效率的“神器”,下面以MaXFlow产物为例向各人介绍人工智能东西。能够使分子模仿分子模仿,是MaXFlow产物很重要的功用。当2021年再去谈及分子模仿,我们更愿意将之描述成一个东西,那现实上是MaXFlow产物设想的一个很重要的目的,就是把一种过去认为是手艺的工具酿成一种实正的东西,出格是可以称心尝试工做人员利用的一种东西。恰是因为目的差别,使得MaXFlow中的分子模仿区别于其它的分子模仿软件。人工智能MaXFlow提出人工智能次要针对素材和生物医药那两个范畴,那种具有针对性的人工智能跟各人凡是所说的购物网站、人脸识此外人工智能是差别的,其更多存眷素材和生物医药那两个范畴中人工智能的办法以及模子。工做流MaXFlow的设想理念,是将分子模仿东西化,把人工智能和素材、医药连系起来,那此中十分重要的东西就是工做流。要想把东西实正酿成一个东西,就必需要将过程主动化,要想实现主动化就必需要将其酿成流程化的工具。然而,如许的工做其实不容易,此中包罗了大量经历,需要必然进修和掌握的时间。MaXFlow通过工做流的体例,把那些繁琐的过程组件化,使工做变得愈加轻松。MaXFlow是创腾科技旗下产物,创腾科技专注医药和素材科学研发范畴20年,通过对云计算,挪动互联和科学人工智能的手艺的立异应用,搀扶帮助企业和立异科研机构快速停止研发的数字化转型,实现智能立异。创腾科技拥有从数字化研发到智能立异的整体挪动互联处理计划,包罗iLabPower数字化研发平台(涵盖研发与量量检测),SDH科学数据基因组平台和MaXFlow科学人工智能立异平台。创腾科技拥有超越千家用户,正在办事数万名中国的科技精英,国内科研机构,首屈一指的造药企业,CRO/CDMO和石油化工企业,以及新药立异的明星企业都在操纵创腾科技的数字化研发及智能立异平台,实现其智能立异的核心战略规划。
参考文献:
[1] Melo, M.C.R., Maasch, J.R.M.A. de la Fuente-Nunez, C. Accelerating antibiotic discovery through artificial intelligence. Commun Biol 4, 1050 (2021).