向语言与知识领域再下一城!百度世界2020文心升级深入产业应用

2020-09-16 14:37:29  来源:砍柴网  

K图 BIDU_0

  语言与知识技术的相关研究进展,影响着人工智能理解世界的方式。9月15日,一年一度的科技圈盛会百度世界2020大会于线上召开,总台央视主持人康辉,与百度创始人、董事长兼首席执行官(CEO)李彦宏的“虚拟人”在千万观众面前亮相,不仅动作自然、栩栩如生,更与真人进行多轮流畅交互,引发网友惊叹,满足了人们对未来时代“智能管家”的许多想象。

  而为虚拟人理解世界、理解语言起到关键作用的,正是语言与知识技术。在当天下午举办的百度大脑分论坛上,来自百度的杰出架构师、文心(ERNIE)负责人孙宇登台演说,介绍知识增强语义理解框架文心(ERNIE)在语言理解、语言生成和跨模态语义理解等能力上的重大突破。此外,百度大脑提出了基于多流机制的预训练语言生成技术ERNIE-GEN和知识增强跨模态语义理解技术ERNIE-ViL,其中,ERNIE-ViL首次将场景图知识融入到跨模态的预训练模型中。孙宇还介绍,百度文心语义理解技术平台可为企业提供一整套NLP定制与应用能力,目前已累计支持2万余名开发者,覆盖金融、通信、教育、电商等行业。

  语义理解核心技术升级,文心多项NLP技术全球领先

  据了解,知识增强语义理解框架文心(ERNIE)于去年发布,大幅提升机器理解语言的水平,更在国际权威的通用语言理解评估基准 GLUE上首次突破 90大关,超越人类三个点,获得全球第一。文心的创新点在于,将大数据预训练与多源丰富知识相结合,持续学习海量文本中词汇、结构、语义等方面的知识,实现模型效果不断进化,如同人类持续学习一般。

  分论坛上,孙宇介绍,百度文心语义理解技术包括基于预训练的语义表示、文章理解、文本匹配、文本生成等技术,以及可识别理解法律、金融文本的领域语义理解技术,并布局了跨模态、多语言、图理解等前沿技术,形成了涵盖基础、应用、领域、拓展四大层面的全景图。

  在常识知识、多粒度语言知识、场景图知识等多源知识学习的支持下,文心语义理解能力、语言生成能力和多模态语义理解能力都得到了进一步提升和拓展。同时,基于海量数据,百度大脑构造了多粒度自编码任务和指代消解任务,推动文心在情感分析、文本分类、阅读理解等八项典型自然语言理解任务效果上获得进一步显著提升。