本站联系方式
   联系QQ  :1095080675
   联系QQ  :1223950575
  技术指导:1353934434
  
  电子邮箱:1095080675@qq.com
标题  基于内容的P2P文件共享系统
编号  22105
资料明细  学术论文
推荐指数  ★★★★★
论文内容

  对等计算 (peer - t o - peer computing) 是一种 新型计算方式 , 其目的在于充分利用各个自治用户节点的计算资源 (包括内存 , 文件系统以及 CPU 执行周期 ) , 以较低的性能价格比进行资源共享及协同计算。Peer - t o - Peer ( P2P) 的最主要用途 之一是进行文件共享 , 它允许任意终端用户对等体间 ( Peer) 直接通过 I nternet完成文件交换 , 不需 修改已存在的软件协议和网络的底层结构就能快速地添加新的网络功能。目前已经提出了很多 P2P 网络的组织结构 , 如集中目录式的 Nap ster结构; 纯分布式的 Gnutella结构;引入散列表的非结构化 Freenet结构和加州大学伯克利分校的 结构化 CAN项目等。
在实际应用中 , 因特网上的大规模 P2P系统的特点是: 系统规模巨大; 用户节点自治且权利、 地位平等; 具有高度动态性 (用户节点可以随意加入 /离开网络 ) 和高度多样性 (用户节点的有效 性、延迟、带宽存在 3~5个数量级的差异)。但是现有的设计都由于其自身的局限性而仅适合于 规模较小的 P2P系统。比如 , 集中式结构并不适用于 P2P系统, 因为中央服务器的瘫痪容易导致 整个网络的崩溃 , 可靠性和安全性较低 , 而且随着网络规模的扩大 , 对中央目录服务器进行维护和更 新的费用将急剧增加 , 所需成本过高。Gnutella系统虽然具有良好的自治性和健壮性 , 但是查询所引 起的大量信息流会加重系统的负担。例如 , 在一个拓扑为 8个分支的树型、TT L (Ti me To L ive, 即信 息包在网络中由一个服务器向另一个服务器转送的次数 ) 取值为 8的 Gnutella系统中 , 为了搜索一个 18字节的字符串 , 只是进行文件定位可能就会产生 112G B的网络流量[ 6 ] 。结构化的 DHT (Distribu2ted Hash Table) 具有纯分布式的特性 , 可以避免 服务器结构带来的问题; 同时 , 由于其结构化的特征 , 可以避免非结构化的纯分布式系统的不确定性 ( Freenet) 以及对网络带宽的急剧消耗 (Gnutella)等问题。但是 , 目前所设计的 DHT均假设节点具 有相同的能力 , 并不符合大规模系统的要求。
基于上述原因 ,本文提出一种基于内容的 P2P文件共享系统 Content - Based P2P System ( CB2Peers)。此系统有两个特点:
1)系统中共享的文档按照内容分类 ,每种类型的文档占据一定的单位空间 ,从而缩小了搜索范围,并且具有很好的可扩展性。
2)系统充分考虑到现有网络中终端用户性能的差异 (即多样性 ) ,并参考 Super - peer网络的设计思想 ,在共享同类型文档的不同用户间以簇为 单位进行查询 ,提高了搜索的效率。作者通过实验仿真来测试 CBPeers的搜索效率和网络搜索负载量方面的性能。结果显示 CBPeers 在共享空间数据方面确实具有可行性 ,并且在搜索方面比 Super - peer网络具有更好的性能表现。 本文组织如下:第 1部分介绍了 CBPeers网络的基本假设和相关概念 ,第 2部分详细阐述 CBPeers 网络模型的设计方案 ,第 3部分给出仿真实验结果。文章的最后对全文进行了总结 ,并对未来工作进行了展望。
1 基本假设和概念
在实际的网络应用中 ,人们的查询大多是关于某一类内容的信息查询。例如 ,用户查询的 jazz、 blues类歌曲均属于内容为 Music类文档; Olymp ics、NBA则是内容为 Sport类的文档。如果将系统中共 享的文档按照内容进行分类 ,将查询限定在某一范围的节点间 ,就可以有效缩小搜索的范围 ,提高查询 效率。但是 ,在现实世界中 ,将文档按照内容进行归类 (即信息的分类 )是十分复杂的 ,不同的用户可能 有不同的内容分类标准。为了设计需要 ,规定本文的 CBPeers网络基于如下假设:用户对共享文档按 照内容进行分类的标准是一致的。CBPeers网络设计过程中涉及的相关概念如下:

说明
 以上是论文部分内容。如果对以上内容感兴趣,可以QQ:1095080675或邮件1095080675@qq.com继续联系我们。
  • 上一篇:计算机多媒体辅助教学在高职教育中的应用研究
  • 下一篇:校园网的安全性分析与对策研究