NMI | 陈红明团队合作开发基于神经网络的分子设计新算法

来源: 本网 作者: 本网 日期: 2020-05-20

近日,广州再生医学与健康广东省实验室陈红明研究员与阿斯利康制药公司研究人员联合在“自然•机器智能” (Nature Machine Intelligence)发表了题为“Direct steering of de novo molecular generation with descriptor conditional recurrent neural net”的论文,文中提出一种新的基于带约束循环神经网络的分子设计方法,该方法可利用神经网络快速设计满足一定约束条件的小分子分子结构。

近年来,深度学习技术在人工智能研究领域取得了巨大突破,它在化学信息学领域的应用也开始大量涌现,其中基于深度学习的生成模型算法可谓是异军突起。作为一种数据驱动而不依赖任何组装规则的方法,它能通过学习大量化学结构知识,进而简便地生成具有高度像药性的分子结构。虽然目前的生成模型算法能高效地生成分子结构,但如何生成满足一定约束条件的像药性分子和增大生成结构的多样性仍然是具有很大挑战性的课题。


640.webp.jpg

带约束循环神经网络架构


陈红明与阿斯利康制药公司的联合研究团队提出了一个新颖的带约束循环神经网络架构,将小分子化合物的物理化学性质作为神经网络的约束条件,可以方便地生成满足特定物理化学性质约束条件的小分子结构。分子结构用SMILES字符序列来表示,在这种架构中,循环神经网络(Recurrent Neural Network, RNN)被用来处理SMILES字符输入数据,同时另一个全连接的神经网络则被用来对指定的化合物物理化学性质参数进行编码,编码后的信息被输入到RNN网络中的起始神经元单元充当约束条件。

在模型训练阶段,计算出来的化合物物理化学性质和它的结构信息作为输入,模型将试图重建输入的分子结构。在分子生成阶段,只需将人为设定的化合物物理化学性质作为输入参数,就可启动神经网络来设计满足设定的物理化学性质条件的分子结构。研究中对一套多巴胺受体D2(DRD2)的小分子数据集进行了建模验证计算,在限定DRD2拮抗剂/激动剂的分子量、分子内氢键受体/供体数量、分子的油水分配系数等性质范围的条件下利用神经网络进行分子结构设计。计算机实验结果表明,这种神经网络设计出的分子结构的上述物化性质基本上都落在预先设定的范围内,达到了预期的目的,期待将来能将这种分子设计方法用于实际的药物开发项目中。