第四范式 AutoML 再次斩获图学习「世界杯」OGB 2 项冠军

由于图结构的普适性,诸如生物医学、分子制药、天体物理等越来越多的高精尖领域已经将图学习视为智能化、规模化、高效率、低成本创新的关键技术。

由于图结构的普适性,诸如生物医学、分子制药、天体物理等越来越多的高精尖领域已经将图学习视为智能化、规模化、高效率、低成本创新的关键技术。尤其在生物医药领,图学习已在分子性质预测、蛋白质结构预测、药物靶点亲和力预测等方面发挥了巨大价值,受到了学术界及工业界的广泛关注。

近日,国际顶级图学习标准 OGB(Open Graph Benchmark)挑战赛公布了最新排名。在与微软亚研、Twitter、腾讯、百度、字节跳动、帝国理工、北京大学、上海交大等众多科技巨头及顶尖高校的竞技中,第四范式、清华大学电子系机器学习课题组联合团队使用基于 AutoML打造的AutoGraph(自动化图神经网络)算法在 3 项任务中斩获 2 项第一、1 项第三,继去年摘得 OGB 双料第一后再创佳绩。

OGB 是目前公认的图学习基准数据集「标杆」,由图学习领域的国际顶级学者斯坦福大学 Jure Leskovec 教授团队建立,于 2019 年国际顶级学术会议 NeurIPS 上正式开源。该数据集囊括了节点性质预测、边性质链接预测、图性质预测等多项赛题,以质量高、规模大、场景复杂、难度高著称,素有图学习领域「ImageNet」之称,成为众多科技巨头、科研院所和高校团队试验技术成色的试金石。

继去年摘得 2 项知识图谱链接预测冠军后,第四范式今年参与了 ogbg-molhiv、ogbg-molpcba、ogbg-ppa 等 3 项数据量庞大且极具挑战的图分类任务。其中,ogbg-molhiv、ogbg-molpcba 是用于测试分子特性的知名机器学习数据库 MoleculeNet 中最大的数据集之一,对多种疾病的有效药物筛选和开发具有重要意义和参考价值。

本次大赛中,联合团队使用了基于第四范式 AutoML 打造的 PAS(面向图分类任务的自动池化图神经网络搜索算法)参赛。由于图数据和任务的复杂性,不同任务需要使用最为合适的图神经网络模型才能达到最佳效果。PAS 算法的价值是可在任意任务上自动搜索效果最优的图神经网络,最终在比赛中超过了业界一系列基于图神经网络的图分类模型,进一步印证了该技术的领先性及有效性。

公司地址:北京市朝阳区酒仙桥路4号751 D·Park正东集团院内 C8座105室 极客公园

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注