书籍详情
《面向中文信息处理的框架语义分析》[41M]百度网盘|亲测有效|pdf下载
  • 面向中文信息处理的框架语义分析

  • 出版时间:2013-04
  • 热度:4974
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

内容简介

  《面向中文信息处理的框架语义分析》即以框架语义理论为基础,以汉语框架语义知识库为语义角色标注的范畴知识体系,以真实语料为依据,根据短语类型、句法功能以及短语内、外部其他句法语义特征,归纳汉语语义角色标注规则,为计算机自动语义分析提供资源。

作者简介

  由丽萍,1979年6月生,博士、硕士生导师,山西大学副教授。研究方向为中文信息处理和信息检索。2006年获上海师范大学博士学位,2010年美国科罗拉多大学波尔得分校访问学者。主持国家社会科学基金项目1项、教育部人文社会科学研究规划基会项日l项,参加国家863计划项口l项、国家社科项目2项以及省级课题多项、发表学术论文20余篇。

内页插图

目录

第1章 面向信息处理的语义分析
1.1引言
1.2面向信息处理的语义分析研究现状
1.3信息处理的精确化语义理解需求
1.4汉语框架语义知识库构建工程
1.5本研究的主要内容和应用价值

第2章 汉语框架语义知识库构建技术
2.1汉语框架语义知识库构建方法
2.2汉语框架语义知识库软件体系
2.3汉语框架语义知识库语义Web表示体系

第3章 汉语认知领域框架及框架元素系统
3.1认知领域的界定及词语采集
3.2汉语认知领域框架示例
3.3认知领域框架语义知识库摘要
3.4认知领域框架及框架元素解析
3.5汉语非核心框架元素体系

第4章 汉语框架语义标注方法
4.1汉语框架语义标注的内容要求
4.2句法层面标注体系
4.3零碎成分的标注
4.4几种特殊情况的处理
4.5汉语框架语义标注的特点

第5章 汉语框架元素实现规律
5.1框架元素特征数据库的构建
5.2短语类型与框架元素的关系
5.3句法功能与框架元素的关系
5.4其他特征与框架元素的关系
5.5汉语框架元素标注规则的构建路线

第6章 认知领域核心框架元素的识别
6.1规则的形式化描述方法
6.2指人词语集合的构建
6.3认知领域核心框架元素识别规则
6.4实验及结果分析

第7章 汉语介词短语边界划分及框架元素识别
7.1相关研究
7.2汉语介词短语边界划分策略
7.3介词短语边界划分实验结果
7.4介词短语框架元素识别规则
7.5介词短语框架元素识别实验结果

第8章 基于框架语义本体的时间信息抽取
8.1框架语义本体与信息抽取
8.2基于框架语义本体的信息抽取模型
8.3时间信息抽取实验

附录1 汉语框架语义标注样例
附录2 汉语框架语义词元库样例
附录3 介词、右边界词、右边界词性搭配模式
附录4 介词、后词、后词词性搭配模式
参考文献

精彩书摘

  1.5.1研究内容
  本书的研究是汉语框架语义知识库整体工程的一部分,即引进、吸收框架语义理论的研究成果,面向中文信息处理应用需要,研究汉语框架语义分析问题。一方面,确立汉语词汇的框架语义知识库构建方法、句子的框架语义标注规范;另一方面,以语义标注语料为基础,根据短语类型、句法功能以及短语内、外部其他句法语义特征,归纳汉语句子中框架元素的识别规则,并通过实验验证规则的有效性。此外,为满足精确化语义理解的需要,本书还对汉语介词短语的信息处理问题进行了专门研究。
  各章内容如下:
  第1章评述目前国内外词汇语义知识库构建现状以及语义组合关系分析模式的设计情况,确定本研究的语义分析方法体系,明确研究内容。
  第2章确立汉语框架语义范畴知识体系的构建方法。分析汉语框架语义知识库建设的语料准备、数据库结构设计和软件需求等工作路线;根据框架语义理论,制定框架和框架元素的编写原则;借助语义Web描述语言,用本体(Ontology)组织框架语义知识库内容,使之成为机器可读、可理解的词汇语义资源。
  第3章以认知语义领域为例,对汉语框架及框架元素体系的构建进行实践,构拟框架一框架关系,详细解析所构建的框架和框架元素的内涵和适用范围,从中总结汉语框架语义知识库的特点。
  第4章设计汉语框架语义标注的方法体系。从句法功能类型、短语类型和框架元素标注三方面对汉语框架语义标注方法加以规定,并重点讨论句法和语义不一致造成的一些特殊情况的处理方法,形成一套完整的、实用的语义标注方法体系,为汉语框架语义分析提供语料加工规范。
  第5章以真实语料标注为基础,通过统计、对比等方法,分析汉语框架元素的实现规律;考查短语类型、句法功能与框架元素的对应关系,以及短语内部、外部其他形式和意义特征与框架元素的对应关系。
  第6章研究框架元素标注规则的获取方法和描述形式,并以认知语义领域为例,通过对真实语料的分析归纳其框架元素标注规则,通过实验,对规则的使用效果进行定量分析和评价。
  第7章研究汉语介词短语的边界划分及其框架元素识别技术。采取基于搭配模板匹配的方法和基于词性边界统计模型的方法划分短语边界,再采取基于规则的方法,对其框架元素进行自动识别,最后通过语料标注实验证明方法的有效性。
  ……

前言/序言

  计算机语义分析是21世纪以来自然语言处理的研究重点之一。目前在主干语义信息以及浅层语义信息的处理方面,已经积累了较为丰富的成果。然而,多数语义表示方法和处理结果却在追求体系的简洁性和处理的可行性的同时,丢失了语言表达中深层次的、复杂的语义信息,导致研究结果无法达到现实社会的应用需要。菲尔墨(Fillmore)在其格语法基础上进一步提出了框架语义理论,将词语、句子乃至篇章的语义内容统一用图式化的认知情境——“框架”加以描述,以细化的语义范畴表示更丰富的语义内容,使得语义分析结果更加精确。
  本书即引进、吸收框架语义理论的研究成果,面向中文信息处理应用需要,研究汉语框架语义分析问题。一方面,确立汉语词汇的框架语义知识库构建方法、句子的框架语义标注规范;另一方面,以语义标注语料为基础,根据短语类型、句法功能以及短语内、外部其他句法语义特征,归纳汉语句子中框架元素的识别规则,并通过实验验证规则的有效性。具体研究内容包括:
  (1)研究汉语框架语义知识库构建技术。从语料准备、数据库结构设计和软件需求等方面确立汉语框架语义知识库的构建路线;根据框架语义理论,制定框架编写原则;借助语义Web描述语言。用本体(Ontology)组织框架语义知识库内容,使之成为机器可读、可理解的词汇语义资源。
  (2)构建框架语义知识库样本——认知领域框架及框架元素系 统。从语料实际出发,用框架语义分析方法,描述认知领域动词的语义内容,定义完整的框架、框架元素及框架一框架关系体系,为全面构建语义知识库提供可行的研究路线和具体的构建样本,同时,这些研究结果本身也可作为计算机分析现代汉语语义的重要资源。
  (3)设计汉语框架语义标注的方法体系。设计汉语框架语义句子标注规范体系,包括短语类型标注体系、句法功能标注体系和框架元素标注体系,明确特殊句式、特殊表达形式的处理方法,为汉语框架语义分析提供语料加工规范。
  (4)确立框架元素标注规则的获取技术和描述体系。用语料统计数据详细分析短语类型与框架元素的关系、句法功能与框架元素的关系以及短语内、外部其他形式和意义特征与框架元素的关系,分析框架元素与句法表现形式之间的对应规律,在此基础上,明确框架元素标注规则的构建路线和描述体系。
  (5)构建认知语义领域汉语框架元素识别规则。以认知领域为例,归纳框架元素识别规则,对其进行形式化描述,并应用到计算机自动语义标注实践,通过实践检验规则的性能,给出量化的评价结果。
  (6)研究汉语介词短语的边界划分及其框架元素识别技术。采取基于搭配模板匹配的方法和基于词性边界统计模型的方法划分短语边界,再采取基于规则的方法对其框架元素进行自动识别,最后通过语料标注实验证明方法的有效性。
  (7)研究基于汉语框架语义本体的信息抽取。为显示汉语框架语义分析的应用价值,以时间语义为例,进行信息抽取技术研究和实验。
  本书的研究特色可以归纳为:
  (1)以框架语义理论为基础,构建汉语语义分析的范畴知识体系,其语义角色细化,语义信息丰富,使得计算机语义理解更加精确化。
  (2)在范畴知识体系、标注方法体系和标注规则体系的构建上,始终采用基于语料库的方法,避免“从意义到意义”的理性思维,使研究结果可靠、实用。
  (3)用基于规则的方法解决语义标注歧义问题,避免了基于统计的方法面临的语义资源匮乏、数据稀疏的问题,通过实验证明本研究所归纳的规则对于解决语义角色标注问题十分有效。
  本研究工作是跨现代汉语语义和中文信息处理两个领域进行的,无论是在对语义理论和前人研究工作的引进、吸收,还是在语义知识范畴体系和规则体系的构建上,都力求探讨汉语框架语义分析的各方面问题,其研究结果,一方面,对推进中文信息处理技术的发展有直接的应用和参考价值;另一方面,也可以为语言研究工作提供丰富的研究素材。