Gerbil:支持GPU加速的kmer count工具

网友投稿 725 2022-11-25

Gerbil:支持GPU加速的kmer count工具

Gerbil:支持GPU加速的kmer count工具

欢迎关注"生信修炼手册"!

对于基因组组装而言,kmer count是最基础的分析内容之一,传统的kmer count工具在kmer长度小于32时,有着较好的性能,但是对于较大长度的kmer, 内存消耗和运行速度都差强人意。随着测序读长的不断增加,一款能够支持较大kmer的计数,而且性能良好的工具就显得非常的有必要。

Gerbil就是这样的一款工具,除了在算法上进行优化外,还引入了GPU加速,进一步加强其性能,对应文献链接如下

​​count工具

JellyfishBFCounterDSKKMCTurtleMSPKmerCounterKCMBT

这些工具对于长度大于32的kmer, 性能都没有Gerbil好。对于hg38基因组,各个软件的运行速度比较如下

软件的github链接如下

​​clone gerbilmkdir buildcd buildcmake ..make

基本用法如下

gerbil -k 32 input.fasta temp_dir output_dir

​​-k​​​参数指定kmer的长度,​​input.fasta​​​代表输入序列文件,​​temp_dir​​​代表临时文件的目录,​​output_dir​​​代表输出文件的目录。和jellysifh不同,Gerbil支持多种输入文件格式

fastq/fastafastq.gz/fasta.gzfastq.bz2/fasta.bz2stdintxt

支持fastq和fasta两种格式,也支持gzip和bzip两种压缩格式,还可以从标准输入流读取文件,甚至可以是一个txt文件,每一行是一个文件路径,这样就可以,一次处理多个输入文件。

软件的输出文件是二进制文件,可以通过​​toFasta​​命令转换为纯文本格式。

更多参数和用法参考github上的说明文档。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:HLAforest:使用RNA-seq数据进行HLA分型
下一篇:RADAR:RNA编辑位点的数据库
相关文章

 发表评论

暂时没有评论,来抢沙发吧~