End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures
-
Abstract
通过在双向序列LSTM-RNNs上叠加双向树形结构来捕获单词序列和依赖树的子结构信息(采用共享参数的方法进行实体关系联合抽取)
Model
主要由三层组成:- 嵌入层
- 将words 、POS词性、依存关系、实体标签分别映射成向量vw,vp,vd,vev^w,v^p,v^d,v^evw,vp,vd,ve
- 序列层
- 利用BiLSTM作为编码器,得到的输出st=[ht→;ht←]s_t=[\overset{\rightarrow}{h_t};\overset{\leftarrow}{h_t}]st=[ht→;ht←]
- 将实体抽取看做一项序列标注任务,使用BIOES方式
- hte=tanh(W1[st;vt−1e]+b(eh))h^e_t = \text{tanh}(W_1[s_t;v^e_{t-1}]+b^{(e_h)})hte=tanh(W1[st;vt−1e]+b(eh))
- yt=softmax(W2hte)+beyy_t = \text{softmax}(W_2h_t^e)+b^{e_y}yt=softmax(W2hte)+bey
- 依存关系层
- 如模型图的右上部分所示,该层主要关注依存关系树中一对目标词之间的最短路径
解码:
- 在序列层采用贪婪、从左到右的实体检测
- 在依赖层实现关系分类
启示
- 模型比较老,在当时看来引入依赖树是一个非常大的创新点,还有共享参数联合实体关系抽取的方法也是非常新颖的,为大佬点赞
- 嵌入层