收集的云规模的DNA序列分析工具
云的规模序列分析套件是专门设计
Jnomics。该项目的建成,以帮助满足计算的持续大规模并行DNA测序技术革命的挑战。
总体而言,当前全球范围内的第二代测序能力超过13 PBP /年,并继续每年增加的神器出山:www.shenqi73.com五个因素。如此海量的基因组数据的存储和分析计算生物学今天面临的主要挑战。
Jnomics试图解决这些问题,最近的创新应用在分布式计算中的挑战,大规模的基因组进行存储和分析。它是基于一个开放源码的Apache Hadoop的,谷歌的MapReduce框架的实施。
下面是一些主要特点“Jnomics”:
Jnomics提供了大量的功能,允许并行化的基因组分析管道的快速发展:
·最低配置:盒,Jnomics提供了大量的工具,让许多共同的基因组的任务是什么?包括排序,合并,过滤和选择?分布在一个集群的分布式任务执行。
·
文件格式的无关:Jnomics让用户能够无缝地读取和写入许多常见的格式(SAM,床,fastq),主要是消除耗时的格式转换,添加大量基因组学管道的开销。
·Extensiblity:基于Java的API可以很容易地添加新的分布式组件。
·并行现有的工具:虽然有很多优秀的基因组工具已经存在,只有极少数的这些设计为运行在分布式环境中。 jnomics允许用户分发执行现有的工具,允许从串行到一个简单的过渡分布分析。 Jnomics目前支持BWA和Novoalign的(更多的惊喜!)和其他任务,可以很容易地添加使用的Java的基础Jnomics的API。
要求:
·
的Java ·
的Python