本站联系方式
   联系QQ  :1095080675
   联系QQ  :1223950575
  技术指导:1353934434
  
  电子邮箱:1095080675@qq.com
标题  一种混合式P2P文件共享与检索模型
编号  22103
资料明细  学术论文
推荐指数  ★★★★★
论文内容

1. 引言
P2P做为当前最有潜力的网络技术之一已经引起越来越多 人的关注。 在P2P网络中每台计算机拥有相同的权利, 负有相同 的责任, 它除去了中央服务器, 使节点之间可以直接交换资源和 服务。 由于P2P的这个特点, 文件共享一直是其较为成功的一项 应用,随着使用 P2P 网络共享文件的用户越来越多, 如何针 对其网络特点更有效的进行文件检索与共享成为近期大家研究 的热点。
在对等网络中要进行有效的文件检索面临的两个主要问 题: 一是怎样在高速变动的网络中探知文件所在的对等节点是 否在线;二是现存的P2P文件共享系统大都基于文件名或关键 字进行信息检索,当文件名或关键字不足以代表文件的真实内 容时, 搜索到的文件往往与检索者本意相去甚远。
本文通过对传统信息检索技术与对等网络自身特点的研究 提出一种基于对等点兴趣相似性的混合式 P2P 信息检索模型, 该模型既可将对等节点按其兴趣相似度组成若干以超级对等节 点为中心的兴趣对等组以提高检索效率,又利用每个对等节点 的计算能力缓解了 C/S模式下进行检索时中央服务器计算量过 大的问题, 为P2P信息检索研究提供了一些新的思路。
2. 基于兴趣相似性的P2P的文件检索模型
2.1 网络拓扑结构
考虑到对等网络中对等节点可自由进入、 离开网络, 为便于 管理结点信息又避免引发中央服务器带来的"瓶颈"问题, 系统 采用了混合式的网络拓扑结构,如图 1 所示。
整个网络形成若干以 hub 为中心的对等组。其中 hub 储存所在 对等组中所有节点的共享文件索引, 并负责判断新的边缘节点 (provider) 是否可注册至该对等组; consumer 在进行查询时将查 询关键词传给所在对等组的 hub,Hub 检索本地信息,若本地已 有满足查询的信息数则直接将响应信息回送查询点,否则选择 若干相邻hub转发查询。
可见, 在这种模式下, 由于查询不再到达边缘节点, 因此有 效的降低了查询信息在网络中传送的冗余度,避免了文件共享对 等网络中应用最广泛的Gnutella协议所引起的"洪泛"问题。
现在的问题是如何提高系统的检索效率? 显然, 由于超级节 点 (hub) 的存在, 如果查询节点所在的对等组中有满足查询的足 够的信息数, 系统的检索效率最高。 当本地对等组资源不足以满 足查询时, hub 如能选择合适的相邻 hub 也能通过降低查询转 发跳数提高查询的效率。
2.2 相似性分布假设
用于文件共享的对等网络与传统的 C/S网络一个很大的不 同之处在于:对等网络的共享效果取决于参与节点的数量及提 供的共享文件数。这其中节点提供的共享文件数量及质量又是 该网络是否吸引人的关键所在, 因此, 用于文件共享的对等网络 有一句口号即: 我为人人, 人人为我。
通过我们的调查发现一个有趣的现象:用户提供的共享文 档通常是其自身感兴趣的方向中已有的文档。 例如, 若一个用户 对计算机方面的文档感兴趣,他往往会将其已有的技术文档共 享, 然后在网络中查找其没有的其它文档。由此, 我们提出一个 根据用户提供的共享文档间的相似度将用户划分成若干以 hub 为中心的兴趣对等组的假想。

说明
 以上是论文部分内容。如果对以上内容感兴趣,可以QQ:1095080675或邮件1095080675@qq.com继续联系我们。
  • 上一篇:基于相关系数的加权朴素贝叶斯分类算法
  • 下一篇:计算机多媒体辅助教学在高职教育中的应用研究