作者/凯霞
哺乳动物细胞中表达全长抗体(约个变体)的低通量筛选,导致治疗性抗体的优化需要大量时间和资源。
近日,瑞士苏黎世联邦理工学院(ETH)的Reddy和他的研究团队开发出一种机器学习方法,通过从大量不同的抗体序列空间中进行深度学习来预测抗原特异性,从而确定优化的抗体变异体。此研究有助于开发更有效的抗体药物。
该研究成果于以「通过深度学习从抗体序列预测抗原特异性优化治疗性抗体」(Optimizationoftherapeuticantibodiesbypredictingantigenspecificityfromantibodysequenceviadeeplearning)为题发表在《自然生物医学工程》(NatureBiomedicalEngineering)杂志上。
抗体由我们的免疫细胞产生,可以抵抗体内的病毒和其他病原体。几十年来,医学上一直在使用生物技术产生的抗体作为药物。「靶点-击中」(target-to-hit)阶段是抗体药物发现公认的过程。然而,开发此类抗体药物绝非易事。基本要求是抗体以最佳方式结合其靶分子,同时,抗体药物必须满足许多其他标准。
近年来,机器学习应用于生物序列数据,为蛋白质工程提供了一种强大的方法。深度测序和并行计算的出现,使我们可以构建能够从序列数据预测分子表型的深度学习模型。
现在,ETH研究团队开发出一种机器学习方法,通过从大量不同的抗体序列空间中进行深度学习来预测抗原特异性,从而确定优化的抗体变异体。
研究人员利用深度学习直接在哺乳动物细胞中对治疗性抗体(完整的免疫球蛋白)进行多参数优化。对治疗性抗体曲妥珠单抗(约1,个变体)进行了深度测序,并筛选了人表皮生长因子受体2(HER2)特异性文库。从未过滤的文库中随机选择30个变异体进行重组表达和实验检测,结果表明30个变异体均保留了对HER2的特异性。证明了深度学习可以促进和优化抗体工程。
在研究中,「我们选择卷积神经网络(CNN)作为分类模型的基础,因为它们代表了一种最先进的深度学习方法。」
图示:实现深度学习预测抗体靶向特异性。(来源:论文)
通过机器学习,机会增加
Reddy和他的同事正在使用机器学习技术,将测试的初始抗体集增加到几百万个。Reddy说:「可供选择的『候选序列』越多,找到真正符合药物开发所需的所有标准的『候选序列』机会就越大。」ETH研究人员使用罗氏(Roche)公司已经上市20年的抗癌药物赫赛汀(Herceptin)为他们的新方法提供了概念验证。Reddy解释说:「我们选择这种抗体是因为它在科学界是众所周知的,而且其结构已在开放获取数据库中公开。」
节约时间和成本,降低临床风险
Reddy说:「为了解决哺乳动物细胞中抗体优化的局限性,我们开发了一种基于深度学习的方法,该方法使我们能够高精度地识别抗原特异性序列。计算和预测抗原特异性变异体的各种生物、物理特性可以有效识别最具发展潜力的抗体分子,从而节省大量的时间和成本,并大大降低了下游临床开发的风险。」将来也可以探索其他诱变方法,这些方法可以生成丰富的训练数据,以训练深层神经网络。
加速抗体的发现
研究者从计算优化的候选序列库中,选择了55个变异体,从中鉴定出了一个相对于曲妥珠单抗具有可比性表达并提高了热稳定性的序列(变体1)。「值得注意的是,与原始曲妥珠单抗序列相比,该变体有显著的潜在免疫原性。」Reddy说:「一种新的变体甚至比赫赛汀(Herceptin)在体内的耐受性更好。」
ETH的科学家们正在应用他们的人工智能方法来优化正临床开发中的抗体药物。为此,他们最近成立了ETH的子公司deepCDRBiologics,与生物技术和制药公司合作开发抗体药物。
Mason称:「未来的工作将采用更严格的或附加的过滤器来处理其他可开发性参数(例如,稳定性,特异性和人性化),以进一步减少序列空间到最可开发的治疗候选者。」
原文链接: