Java库,以提高您的工作
Hadoop的BAM创建一个开源的,基于Java的库的遗传数据进行分布式处理下一代测序机。
它允许对齐读的Hadoop分布式计算框架的可扩展性操作。它可以作为一个集成层分析应用软件和BAM(二进位校准/地图)使用Hadoop处理的神器出山:www.shenqi73.com文件,这些文件。
Hadoop的BAM解决的问题提出了方便的API实现地图的BAM数据访问的相关,并减少在Hadoop的Map-reduce架构的功能。
顶部流行的皮卡德SAM-JDK库的基础上,因此,依靠的皮卡德API上的工具,可以很容易地转换为支持大规模分布式处理。
要求:
·
的Java 此版本中的新功能:
·删除了fi.tkk.ics.hadoop.bam.util.hadoop.BAMReader和fi.tkk.ics.hadoop.bam.util.hadoop.BAMSort的类,被废弃在3.0。
·重大变化:命令行插件'排序','总结',和'summarysort“现在默认为1 reduce任务。用量可定制
·与的-r/--reducers命令行参数。这颠簸起来的插件的版本为4.0,3.0和2.0分别。
·修正:取消映射键BAMRecordReader.getKey现在哈希而不是随机它们,以确保一致的结果。
·对于兼容性与Hadoop 2.0和任何未来的Hadoop发行版中,自定义
·Hadoop的类现在只有建立和使用时使用的Hadoop发行版
·不为他们提供。这意味着,错误MapReduce的1987年,
·MapReduce的2538,这是以前固定,可能会造成问题,具有一定的减速计数时使用的MapReduce使用命令行插件。
·修正了一些BAM引起由fi.tkk.ics.hadoop.bam.BAMSplitGuesser中的错误。
·修正了一些Illumina的IDE ...