CANDLE将成为全美第一个AI框架,它旨在改变我们了解癌症的方式,为世界各地的数据科学家提供一种针对癌症的强大武器。
合作研究CANDLE的团队中包括国家癌症研究所(NCI)、弗雷德里克癌症研究国家实验室、美国能源部(DOE)以及阿贡、橡树岭、利弗莫尔和洛斯阿拉莫斯国家实验室。为了优化最新的超级计算机基础设施,NVIDIA的工程师和计算科学家将全力以赴共同开发AI软件平台。他们的目标是为癌症研究人员的研究成果实现10倍的年度增长率。
NVIDIA-图片引自英伟达
在阿贡国家实验室,环境与生命科学研究室副主任里克·史蒂文森(Rick Stevens)说:“AI将是实现癌症登月计划的关键要素。 “新的计算架构在短短三年内,将神经网络的训练加速了50次。我们期望这样的计算架构将会对研究进程有更大的推进。”
英伟达创始人兼首席执行官黄仁勋表示:“GPU深度学习[1]为我们提供了一个新工具,以应对迄今为止连最强大的超级计算机都觉得过于复杂的巨大挑战。我们与能源部和国家癌症研究所一起为癌症研究创造一个AI超级计算平台。这一雄心勃勃的合作是加速美国打击癌症的巨大飞跃。”
美国能源部和国家癌症研究所之间的癌症登月计划战略伙伴关系加速了精准肿瘤学的发展,其中包括三个精准医学试点项目。这三个项目的目标是更好地了解癌症的发展情况; 发现比现有治疗更有效、毒性更小的治疗方法; 并了解临床试验设置以外的治疗方法有效性的关键驱动因素。 深度学习的算法技巧对于这些项目至关重要。
首先,通过NCI的数据分享云平台Genomic Data Common[2]收集的大量分子数据,将协助CANDLE发现存在于普通癌症的DNA和RNA中的潜在遗传特征,这些遗传特征能够进一步帮助人们预测相应的治疗方法。其次,CANDLE将加速关于关键蛋白质相互作用的分子动力学模拟,以了解为癌症创造条件的潜在生物学机制。然后通过半监督学习,CANDLE将自动化提取和分析数百万临床病历的记录信息,从而建立一个关于疾病转移和复发的综合癌症监测数据库。
劳伦斯利福摩尔国家实验室(LLNL)计算副总监James M. Brase表明:“大规模数据分析(特别是深度学习)是LLNL从精密医学到确保性核不扩散等领域不断增长的任务核心。 “英伟达在加速机器学习方面处于领先地位,新的CORAL / Sierra架构对于开发下一代可扩展的深度学习算法至关重要。通过对NVLink的Pascal™GPU架构的结合支持,对最大神经网络进行加速训练将成为可能。”
橡树岭国家实验室卫生数据科学研究所所长Georgia Tourassi表示:“今天的癌症监测仍依赖于临床报告的人工分析来提取、发现癌症进展和结果的重要生物指标。通过应用高性能计算和人工智能 ,例如英伟达的可扩展解决方案DGX-1™,我们可以更容易地提取重要的临床信息并实现信息提取自动化,这样将可以极大地提高我们对大众癌症的健康认识。”
注释:
[1]深度学习(英语:deep learning)是机器学习拉出的分支,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。
[2]
The NCI's Genomic Data Commons (GDC) provides the cancer research community with a unified data repository that enables data sharing across cancer genomic studies in support of precision medicine.
NCI基因组数据共享(GDC)为癌症研究界提供了一个统一的数据存储库,使癌症基因组研究的数据得以共享,从而支持精密医学。
翻译:许凯南