本站联系方式
   联系QQ  :1095080675
   联系QQ  :1223950575
  技术指导:1353934434
  
  电子邮箱:1095080675@qq.com
标题  基于HowNet的词语相似度计算方法
编号  15096
编程语言  C#.NET
开发环境  Visual Studio 2005
资料明细  毕业论文、设计(源码)、答辩PPT
推荐指数  ★★★★★
内容简介

基于HowNet的词语相似度计算的程序设计基于C/S架构,使用Visual Studio 2005开发工具开发完成,使用C#.NET语言编写程序,具体功能如下:
摘 要
自然语言的词语之间有着非常复杂的关系,在实际的应用中,有时需要把这种复杂的关系用一种简单的数量来度量,而词语相似度就是其中一种。词语相似度计算在很多领域中都有广泛的应用,例如信息检索、信息抽取、文本分类、词义排歧、基于实例的机器翻译[2]等等。
《知网》作为一部比较详尽的语义词典,受到人们的普遍重视。在基于实例的机器翻译中,词语相似度计算是一个重要的环节。不过,由于《知网》中对于一个词的语义采用的是一种多维的知识表示形式,这给词语相似度的计算带来了麻烦。
本文的主要任务就是研究知网中描述语言的算法,利用知网提供的词语标注从中文语义角度计算词语相似度。首先了解其描述一个词义所用的多个义原之间的关系,区分其在语言相似度计算中所起的作用;其次研究了义原的相似度计算方法,集合和特征结构的相似度计算方法;再次通过实验验证该算法的有效性。
关键词:《知网》;词汇语义相似度计算;自然语言处理
ABSTRACT
Natural language words have a very complex relationship. In practical application, sometimes need to put this complex relationship with a simple number to measure, and the word similarity is one of them.Word similarity is broadly used in many applications, such as information retrieval, information extraction, text classification, word sense disambiguation, example-based machine translation, etc. As a lexical knowledge base with rich semantic information , How-net has been employed in various researches. In based on the example machine translation, the words and expressions similarity computation is an important link. However, because How-net defines a word in a complicated much dimensional knowledge description language, this has brought troublesome for the words and expression similarity's computation. The main task of this paper is to study the language of the algorithm described in How-net, the use of the words How-net provide semantic annotations from the perspective of the Chinese word similarity calculation. First , we rewrite the How-net definition of a word in a more structural format. Secondly, A study on the algorithm used to compute word similarity based on Hownet.
Keywords: Hownet;Word Similarity Computing;Natural Language Processing
目 录
第1章 前 言 1
1.1 课题内容及意义 1
1.2 论文组织结构 2
第2章 词语相似度及其计算方法 3
2.1 词语相似度的含义 3
2.2 词语相似度与词语距离 3
第3章 《知网》简介 7
3.1 《知网》的结构 7
3.2 《知网》的知识描述语言 11
第4章 基于《知网》词汇相似度的计算方法 14
4.1 词语相似度计算 14
4.2 义原相似度计算 14
4.3 虚词概念的相似度的计算 15
4.4 实词概念的相似度计算 16
4.4.1 特征结构的相似度计算 18
4.4.2 集合的相似度计算 18
第5章 系统实现 20
5.1 义原处理 20
5.2 义项处理 22
5.3 实验检测 24
第6章 总 结 28
致 谢 30
参考文献 31
本基于HowNet的词语相似度计算方法主界面如下所示:

说明
 以上是论文部分内容。如果对以上内容感兴趣,可以QQ:1095080675或邮件1095080675@qq.com继续联系我们。
  • 上一篇:基于C#.NET的中国象棋程序
  • 下一篇:基于C#.NET公司仓库库存管理系统