HLA-VBSeq:对全基因组数据进行HLA分型-FinClip官网

HLA-VBSeq:对全基因组数据进行HLA分型

网友投稿 776 2022-11-25

HLA-VBSeq:对全基因组数据进行HLA分型

欢迎关注"生信修炼手册"！

HLA-VBseq 利用全基因组测序的数据，可以提供8位的HLA分型结果，其文献链接如下

PHLAT, HLAminer这3款软件的分型结果进行了评估，准确率汇总如下

可以看到，只有HLA-VBSeq提供了8位的分型结果，准确率高达99.94%；对于2位到4位的分型结果，其准确率也高于另外两款软件。

同时还评估了不同测序量时，各种软件提供的4位分型结果的准确率,结果如下

在不同条件下，HLA-VBseq的准确率都是最高的。由此可见，该软件的分型效果还是相当不错的，官网如下

挑选位于HLA 基因区域的reads

利用samtools view 命令挑选出比对到HLA区域的reads , 命令如下

samtools view -hb align.bam chr6:29907037-29915661 chr6:31319649-31326989 chr6:31234526-31241863 chr6:32914391-32922899 chr6:32900406-32910847 chr6:32969960-32979389 chr6:32778540-32786825 chr6:33030346-33050555 chr6:33041703-33059473 chr6:32603183-32613429 chr6:32707163-32716664 chr6:32625241-32636466 chr6:32721875-32733330 chr6:32405619-32414826 chr6:32544547-32559613 chr6:32518778-32554154 chr6:32483154-32559613 chr6:30455183-30463982 chr6:29689117-29699106 chr6:29792756-29800899 chr6:29793613-29978954 chr6:29855105-29979733 chr6:29892236-29899009 chr6:30225339-30236728 chr6:31369356-31385092 chr6:31460658-31480901 chr6:29766192-29772202 chr6:32810986-32823755 chr6:32779544-32808599 chr6:29756731-29767588 | samtools fastq - -1 R1.fq -2 R2.fq

需要注意的是，在使用view命令时，虽然也可以直接提供一个bed格式的文件来挑选特定区域的reads,但是这种用法不会利用到bam文件的索引，所以速度很慢。对于全基因组数据，bam文件很大，上述写法虽然冗长，但是执行效率高。

2. 挑选没比对上的reads

利用samtools view 命令挑选出没有比对上参考基因组的reads, 命令如下：

samtools view -hb -f 12 /home/pub/output/WGS/18B0315D/6343/6343_final.bam | samtools fastq - -1 unmapped_R1.fq -2 unmapped_R2.fq

3. 合并reads

将比对到HLA区域的reads和没比对上参考基因组的reads合并，命令如下

cat R1.fq unmapped_R1.fq > R1.fastqcat R2.fq unmapped_R2.fq > R2.fastq

4. 与HLA参考reads比对

利用bwa软件，将上一步得到的reads与HLA参考序列比对，命令如下

bwa index hla_all.fastabwa mem -t 8 -P -L 10000 -a hla_all.fasta R1.fastq R2.fastq > out.sam

5. 运行HLA-VBSeq

HLA-VBSeq支持双端或者单端测序的数据，这里以双端数据为例，用法如下

java -jar HLAVBSeq.jar hla_all.fasta out.sam result.txt --alpha_zero 0.01 --is_paired

6. 格式化结果

上一步就已经生成结果了，这一步只是格式化,下面的代码会筛选出HLA-A基因的分型结果

perl parse_result.pl Allelelist.txt result.txt | grep "^A\*" | sort -k2 -n -r > HLA.txt

格式化之后的结果，内容如下

A*01:01:01:01 17.4022266628604A*11:01:01 12.0376819868684

共两列，第一列为Allel, 第二列为该Allel区域的平均测序深度。

在数字化转型中，选择合适的跨平台开发框架不仅能提高效率，还有助于确保数据安全与合规性。

776 2022-11-25

HLA-VBSeq:对全基因组数据进行HLA分型

洞察掌握android电视app开发中的安全与合规策略，提升企业运营效率

在数字化转型中，选择合适的跨平台开发框架不仅能提高效率，还有助于确保数据安全与合规性。

在数字化转型浪潮中，企业如何通过跨端开发框架提升运营效率，兼顾合规性与数据安全？

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计