使用TCGAbiolinks下载TCGA的数据

网友投稿 812 2022-11-25

使用TCGAbiolinks-TCGA的数据

使用TCGAbiolinks-TCGA的数据

欢迎关注”生信修炼手册”!

TCGAbiolinks是一个分析处理TCGA数据的R包,通过GDC API来查询和-TCGA的数据,同时提供了差异分析,生存分析,富集分析等常见的分析功能,网址如下

​​Query

和在线查询类似,只不过是将网页上的各种可选的属性变成了对应的参数,基本用法如下所示

以​​project​​为核心进行查询, 其他参数用来对数据进行过滤,常用的有以下几个参数

datga.categorydata.typeworkflow.typeexperimental.strategyplatformaccess

以上参数和和网页上的的各项选择菜单相对应,示意如下

除此之外,还有几个重要参数,​​legacy​​​参数的默认值为​​FALSE​​​,表示从harmonized database进行查询,​​TRUE​​​表示从 GDC legacy archive进行查询;​​barcode​​参数用于选择其中部分样本的数据。

查询结果的基本单位为Files, 可以通过以下代码进行查看

datatable(getResults(query))

结果是一个html的表格,通过网页进行查看,每行代表一个表格,示意如下

2. Download

除了查看检索结果外,还可以-检索结果,用法如下

这里分成了两个步骤,第一步从GDC-原始数据,可以使用API或者gdc-clinet进行-, API的速度相对快一点;第二步对原始数据的结果进行整理,从GDC-的原始数据是每个文件单独分开的,需要先对结果进行整理,才可以用于后续分析。以表达谱数据为例,需要进行样本的合并,样本ID的转换等,所有这些都可以通过​​GDCprepare​​完成。

整理好的结果存放在​​data​​对象中,  样本的信息可以通过如下方式进行查看

结果示意如下

表达量矩阵的信息查看方式如下

结果示意如下

数据-并整理好之后,就可以进行分析了。不同类型的数据对应的分析方法也不同,具体的分析方法请参考官方文档。

·end·

—如果喜欢,快分享给你的朋友们吧—

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:使用OncoLnc进行TCGA生存分析
下一篇:GEPIA:TCGA和GTEx表达谱数据分析平台
相关文章

 发表评论

暂时没有评论,来抢沙发吧~