自然语言处理的处理单元分为字(编码、输入法),词、短语(形态分析、汉语分词、词性标注、词义消歧、命名实体识别等),句子(句法分析、语块分析、语义角色标注),篇章(机器翻译、篇章推理、问答系统、自动摘要和情感分类等)
篇章中出现词汇链,是指一个相同的词在不同位置的重复出现,在抽取实体词汇链之后,抽取词汇链上每个词最近的谓词-论元,构成事件链,通过判断相邻事件之间的关系谓词-论元构成的有向图,回指是指一个词或短语在语篇中用于指代同一语篇中的另一个词或短语的概念,一组以名词回指(noun anaphora, NA)、代词回指(pronoun anaphora, PA)和零形回指(zero anaphora, ZA)形式的话题连接起来的小句或句子称为话题链,名词回指指的是之前出现的名词的简称,零形回指是指忽略主语但是隐含了主语是之前出现过的名词这一事实

篇章关系分析

  • Anchor Identification:recognize the anchors from candidates,显式的包括关联词,非显式的包括标点符号(所有的分号、逗号、冒号、句号、破折号、省略号、问号和感叹号作为候选)
  • Argument Extraction:extract argument pair according to the anchor,首先判断arg1和arg2是否在同一个句子SS(same sentence)还是不同的句子PS(previous sentence),,也就是确定句子范围,然后根据不同的情况进行seed pair generation和seed expansion
  • Sense Classification:predict the type of sense between arg1 and arg2
  • Argument Relabeling:re-label the labels of two arguments,Argument标签重新标记的目的是进一步确定Arg1和Arg2孰前孰后。Arg1和Arg2的前后关系是根据语义决定的, 而不是位置。例如在因果关系中,Arg1表示原因,Arg2表示结果。

原文地址:http://www.cnblogs.com/eryoyo/p/16822293.html

1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长! 2. 分享目的仅供大家学习和交流,请务用于商业用途! 3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入! 4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需! 7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员! 8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载 声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性