理解代词对象，人工智能需要多努力？

2020-12-28 15:18

陈述根本

陈根

对于人类来说，识别代词指代对象并不算困难，凭借对上下文和对句子的理解就可以找出代词的指代对象。然而，对于人工智能来说，却并不容易——机器对文本的理解通常需要核心性解析。换言之，能否准确搜索、追踪、分析代词与实体之间的关联，对于人工智能能否准确理解文本内容至关重要。

具有代替和指示作用的代词，作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。

这种能力被称为共指消解（Conference Resolution），是自然语言处理（NLP）领域的重要研究方向，即通过追踪长句、段落、文章中的代词，找到其对应的指代对象或内容。

尽管目前有很多体量庞大的众包数据集，但它们主要考察模型理解局部语义以及谓词参数结构，涉及共指消解的问题很少见。

针对这一问题，艾伦人工智能研究所的研究团队最近公布了一个新的众包数据集，被称为为QUOREF，里面包含超过2400个广度选择问题，旨在专门考察模型的共指消解能力。这些问题需要在维基百科的4.7K多个英文段落中分析并找到各个实体的指代对象。

作为专门测试共指消解能力的数据集，QUOREF足以证明目前常见的机器阅读理解模型仍有很大的进步空间。通过分析错误答案背后的原因，NLP研究者才能更好地改进模型，实现在复杂、多元、大跨度的文本内容中准确对应实体与代词，做到真正意义上的的语义理解。

THEEND

免责声明：凡注明为其它来源的信息均转自其它平台，由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本站联系，我们将及时更正、删除，谢谢。联系邮箱：xiali@infoobs.com

本月热门

精选文章

热点资讯