Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme
-
Abstract
本文将联合提取任务转化为标记问题,将其建模为三元组问题,无需分别识别实体和关系。
Model
The Tagging Scheme
如图所示:"CP"表示“Country-President”的简称,“CF”表示"Company-Founder"的简称
买个单词都被分配一个标签,用于提取BIOES编码,标签由三部分组成:实体中的单词位置,关系类型,关系角色- 关系类型是预定义的,实体在关系角色信息由数字1,2表示(Entity1, Relation Type, Entity2)
- 特殊标签标注:“United”这个词是“United States”实体的第一个词,与“Country-President”关系有关,所以它的标签时“B-CP-1”
From Tag Sequence to Extracted Results(从标记序列到提取结果)
如果一个句子中包含两个或多个相同关系类型的三元组,本文将每两个元素按照最接近的原则组合成一个三元组
The End-to-end Model
启示
- 比较老的论文,主要的工作是把任务变成了BIOES标注问题,还是牛啊