微前端架构如何改变企业的开发模式与效率提升
2285
2022-11-25
Juicer:Hi-C数据处理分析的利器
欢迎关注”生信修炼手册”!
通过Hi-C数据可以分析TAD,chromatin loops等染色质空间结构的基本单元,加强我们对染色质三维结构的认知。面对海量的Hi-C数据,如何高效完成数据分析成为了一个挑战。
目前针对Hi-C数据的分析也有很多的软件可以用,而juicer无疑是使用的最广泛的软件之一。该软件的源代码托管在github上,网址如下
GPU,集群等硬件资源来加速处理速度提供了数据预处理,交互图谱创建和可视化,TAD和染色质环结构预测等一些列完整的pipeline简单易用,不需要复杂的背景知识
该软件按照功能拆分成了三个大的分析步骤,依次运行即可得到最终的分析结果
数据预处理,将原始的fastq序列比对参考基因组,识别其中的valid pairs, 并生成一个后缀为hic的文件读取hic文件,创建可视化的交互图谱,也称之为contact map, 并进行归一化采用算法预测TAD和染色质环等结构
完整功能示意如下
juicer采用ArrowHead算法对原始的交互矩阵进行转化,并预测TAD拓扑关联结构域,采用HiCUUPS算法识别染色质环chromatin loops。和其他Hi-C数据处理软件相比,juicer的功能更为齐全
juicer独创了一种名为hic的文件格式,用来存储Hi-C数据的相关信息,这种格式是一种高度压缩的二进制文件格式,在以下链接可以查看这种格式的详细信息
https://github.com/theaidenlab/juicebox/blob/master/HiC_format_v8.docx
在后续的文章中,会详细介绍该软件的用法。
·end·
—如果喜欢,快分享给你的朋友们吧—
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~