题名:
面向非结构化文本的知识发现 基于英汉双语平行语料库的句法级知识挖掘和抽取研究   / 王东波著 ,
ISBN:
9787516126035 价格:
出版发行:
出版地: 出版社: 中国社会科学出版社 出版日期: 2013
内容提要:
本书基于英汉双语平行语料库、宾州英汉双语树库和清华汉语树库,首次揭示和验证了英汉双语词汇句法功能分布复杂度呈现洛特卡现象的规律。在揭示该规律的过程中,不仅得到了英汉两种语言中词汇的句法功能分布,而且获取了英汉两种词汇在句法上的歧义分布状态,并结合齐夫定律给出了英汉两种词汇在句法上的平均歧义值。以英汉双语树库中已标注英汉双语介宾短语结构为数据资源,构建了英汉双语介宾短语结构知识抽取的模型并完成了基于英汉双语平行语料库的介宾短语结构知识抽取。在构建模型的过程中,统计了英汉双语介宾短语结构的内部和外部特征,并对 
主题词:
工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>专家系统、知识工程  
中图分类法:
TP182 版次: