JASPAR:转录因子motif数据库

网友投稿 1694 2022-11-25

JASPAR:转录因子motif数据库

JASPAR:转录因子motif数据库

欢迎关注”生信修炼手册”!

JASPAR是一个免费公开的转录因子数据库,在该数据库中收录了转录因子的mitif信息,可以用来预测转录因子与序列的结合区域。网址如下

​​JASPAR CORE

该类别下都是从文献中收集的,有实验证据支持的真核生物转录因子motif信息,而且经过了人工核对,是一个非冗余的,高质量的转录因子motif数据库,所以也是整个数据库中的核心。

由于其高质量量,非冗余等特性,通常情况下,该类别信息都是我们的第一选择。每个motif编号以​​MA​​开头,示意如下

2. Collection CNE

该数据集包含了233个调控人类非编码基因的转录因子motif信息,是根据Xie et al. (PNAS 2007)文章中的数据收集整理的,编号以​​CN​​开头,示意如下

3. Collection FAM

该类别下保存的是转录因子的类别class信息,多个转录因子可以拥有相同的调控序列,将调控序列相同的转录因子归为一类。每个class的编号以​​MF​​开头,示意如下

4. Collection PBM

该类别下是运用体外技术分析了104个小鼠的转录因子后得到的motif信息,每个motif编号以​​PB​​开头,示意如下

5. Collection PBM HLH

和PBM类似,只不过该类别下是 C. elegans bHLH的19个转录因子的信息,物种不同,该类别下的motif编号以​​PL​​开头,示意如下

6. Collection PBM HOMEO

该类别下包含的是小鼠的转录因子motif信息,是从文献Berger et al (Cell 2008)整理得到的,每个motif编号以​​PH​​开头,示意如下

7. Collection PHYLOFACTS

该类别下分析的是哺乳动物进化保守基因的转录因子motif信息,对应的文章为

Systematic discovery of regulatory motifs in human promoters and 3’ UTRs by comparison of several mammals

每个motif的编号以​​PF​​开头,示意如下

8. Collection POLII

该类别包含的是RNA聚合酶结合区域的motif序列,每个motfi编号以​​PL​​开头,示意如下

9. Collection SPLICE

该类别包含的是human剪切位点的motif序列,数据量很小,一共只有6个motif, 每个motif编号以​​SA​​开头,示意如下

每个collection都是一个小的子集,core 是整合了所有这些子集,从而构建的非冗余数据集。在core数据集中,将物种分层了一下6大类别

通过官网的检索功能,可以方便的进行检索,示意图如下

在检索出的motif详情页面,提供了许多信息,以​​MA0001.1​​为例

1.  基本信息

包括名字,编号,类别,对应的物种等信息,示意如下

2. Sequence logo

motif每个bp上碱基的分布,碱基的大小与对应的频率成正比,频率越大,对应的字母越大,示意如下

3. position frequency matrix

简称PFM, motif每个bp上四种碱基的频数分布,提供了多种格式的-,示意如下

4, Binding sites

红色标识的是motif对应的具体的序列,示意如下

该数据库提供了-功能,主要是motif对应的PFM矩阵,示意如下

JASPAR数据库是免费的,但是相比TRANSFAC数据库, 还是有很多不足之处,首先就是motif数量的差异,比TRANSFAC数据库少了许多,其次就是信息的类别上,JASPAR只提供了motif信息,并没有直接的转录因子调控的靶标基因的信息。

通过JASPAR数据库,我们只能获取转录因子的motif信息,然后通过软件去预测和DNA序列的结合位点,即TFBS。

·end·

—如果喜欢,快分享给你的朋友们吧—

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:ENCODE转录因子靶基因数据库
下一篇:详解CPM定量方式
相关文章

 发表评论

暂时没有评论,来抢沙发吧~