本站联系方式
   联系QQ  :1095080675
   联系QQ  :1223950575
  技术指导:1353934434
  
  电子邮箱:1095080675@qq.com
标题  寻找DNA序列最大基调算法的改进与实现
编号  22096
资料明细  毕业论文
推荐指数  ★★★★★
论文内容

摘 要 DNA序列由A、T、C、G 四种核苷酸 组成 。通常 ,在一组序列中会有共有的子串存在 。这个子串就叫做基调 。现在已存在算法来找出DNA序列的频度基调和最大基调 ,但它存在一些不足。例如算法的时空复杂性很高 。本文将将采用 根据 基调的长度建树的方式改进原算法 ,并基于改进的算法 实现一个小系统。
关键词 DNA序列,最大基调 ,数据挖掘
1 引言
近几年来,世界上的科学家都在研究人类和其他生物的基因组。它的研究成果已经 应用到各行各业特别是在医药领域。其中,最重要的是要找出.DNA 序列中的最大基调,因为它有助于在研究中找到基因的共同特征。
现在已存在算法来找出DNA序列的最大基调。
首先,根据给定的阈值找出序列的频度基调。然后基于第一步的结果计算最大基调,但是,这个算法存在以下不足: (1)在第一步中,当我们基于长度是l-1 的基调计算长度是l的基调时,算法要扫描序列中的每个元素,浪费了很多时间。 (2)计算频度基调和最大基调的过程是分别进行的,该算法是基于频度基调计算最大基调的,这个过程实际上是不必要的。所以,本文提出一种基于树的改进方法,能避免上述问题。下文将详细介绍算法的改进并给出一个系统运行结果的例子。
2算法介绍及其改进
2.1算法概述
找出DNA 序列最大基调的算法主要包含三步。 (前提是我们已经设定了研究的阈值)
3结果分析
最后,我们基于改进的算法设计了一个系统。用户可以手工输入DNA 序列,也可以加载序列文件。我们选择参考文献[1]中的例子作为测试集.,并给出了阈值在0.3 到 0.8之间, 间隔 0.1 的最大基调.最后,我们将输出结果保存在result.txt文件中
4 结束语
总之,我们改进了找出DNA 序列最大基调的算法并介绍了它的设计和实现过程。最后,我们给出一个例子来测试改进算法的正确性。它节省了执行时间和空间,避免计算M(U,?),提高了算法的效率。将来,我们要进一步减少算法的时空复杂性,更好地提高系统效率。

说明
 以上是论文部分内容。如果对以上内容感兴趣,可以QQ:1095080675或邮件1095080675@qq.com继续联系我们。
  • 上一篇:基于改进的D-S证据理论的分布式入侵检测方法研究
  • 下一篇:基于Rabin算法研究改进递增背包公钥密码体制