药物发现的联合学习

2020-09-18 13:12:12

去年6月,10家主要制药公司-安进(Amgen)、阿斯特拉斯(Astellas)、阿斯利康(AstraZeneca)、拜耳(Bayer)、勃林格-英格尔海姆(Boehringer Inglheim)、葛兰素史克(GSK)、Servier de Recherches Servier、扬森(Janssen)、默克(Merck)和诺华(Novartis)-签署了一项协议,建立一个名为MELLODDY(用于药物发现的机器学习分类协调)的共享平台。在与NVIDIA、Owkin和其他公司的合作中,该小组寻求利用联合学习等技术来集体训练人工智能关于数据集的知识,而不必共享任何专有数据。

今天,为期三年的MELLODDY项目的贡献者宣布,他们已经实现了第一年的目标:成功部署平台。他们说,这标志着一个更大的里程碑,他们还完成了该平台的第一次联合学习运行。

进入临床试验的所有药物中,只有不到12%最终进入药店,药物至少需要10年时间才能完成从发现到市场的旅程。根据美国制药研究和制造商的数据,仅临床试验一项就平均需要六到七年的时间,研发成本约为26亿美元。

MELLODDY项目的联合创始人断言,联合学习可以加速这一过程。在机器学习中,联合学习需要跨持有数据样本的分散设备训练算法,而不交换这些样本。可以使用集中式服务器来协调算法的步骤并充当参考时钟,或者该布置可以是对等的。无论如何,局部算法是在局部数据样本上训练的,并且在算法之间以一定的频率交换权重(算法的可学习参数)以生成全局模型。

为了构建MELLODDY平台,技术供应商BME、Iktos和NVIDIA实施了用于药物发现的机器学习解决方案,确保了隐私并优化了NVIDIA显卡的培训。Owkin提供了Owkin Connect,这是其为多任务联合学习设计的隐私保护框架,而KU Leuven提供了一个名为SparseChem的开源库,用于训练特定于药物发现的机器学习模型。Kuberma部署了其Kubernetes平台,为每个制药合作伙伴建立基础设施。Substra Foundation管理技术操作、监控工作负载,并托管作为Owkin Connect一部分的开放源代码。

在部分托管在Amazon Web服务上的MELLODDY平台中,合作伙伴可以在体系结构的本地实例中安全地注册他们的数据集。(一位发言人告诉VentureBeat,该平台通过了由一家外部公司和每个制药合作伙伴的IT团队进行的“广泛”安全审计。)。私有区块链提供可追溯性,分类账以分散的方式分布在制药合作伙伴之间。

据一位发言人说,在最初的运行中,所有参与的制药公司都设法以一种去识别、聚合的方式同时训练他们的预测模型,而不会暴露私人研究、数据或信息。

MELLODDY项目合作伙伴表示,他们已经开始对第一轮建模运行的结果进行科学和商业案例评估。他们将考虑将这些结果发表在一篇科学论文中,在接下来的两年里,MELLODDY项目将专注于通过暴露于越来越多的数据来提高通用预测模型的性能。

MELLODDY项目建立在通过使用联合学习来发现健康洞察力的其他努力的基础上。今年5月,英特尔公布了美国国立卫生研究院(National Institutes Of Health)资助的一个项目的细节,该项目将利用人工智能来识别脑瘤,同时保护隐私。该公司将与宾夕法尼亚大学佩雷尔曼医学院(Penn Medicine)协调一个由美国、加拿大、英国、德国、瑞士和印度的29个国际医疗中心组成的联合会,利用联合学习来培训AI模型。

除此之外,美国放射学学院、巴西成像中心Diagnosticos da America、合作伙伴医疗保健公司、俄亥俄州立大学和斯坦福医学院合作开发了一个联合学习模型,使用来自33,000项乳房X光检查研究的130,000多张图像。NVIDIA开始与合作者合作,通过该公司的克拉拉成像软件平台发布接受联合学习培训的新冠肺炎相关模型,此前该公司与伦敦国王学院合作开发了用于脑瘤分割的联合学习神经网络。

MELLODDY项目的预算估计为1840万欧元(2176万美元),并从欧盟和欧洲制药业之间的公私合作伙伴关系创新药品倡议获得资金。(Pharma Partners出资1000万欧元,NVIDIA出资12万欧元,其余来自公共赠款。)。强生公司的子公司扬森制药公司(Janssen PharmPharmtica NV)在欧金的协调下担任制药业的领头羊。