使用limma进行两组间的差异分析-FinClip官网

使用limma进行两组间的差异分析

网友投稿 1611 2022-11-25

使用limma进行两组间的差异分析

欢迎关注”生信修炼手册”!

limma这个R包可以用于分析芯片数据，也可以分析NGS测序的数据，其核心是通过线性模型去估算不同分组中基因表达量的均值和方差，从而进行差异分析。

limma也是基于raw count的定量方式，但是它并不提供归一化的算法。在官方手册中，推荐采用edgeR的TMM归一化算法。完整代码如下

1. 读取文件

读取基因在所有样本中的表达量文件，示例如下

gene_id ctrl-1 ctrl-2 ctrl-3 case-1 case-2 case-3geneA 14 0 11 4 0 12geneB 125 401 442 175 59 200

每一行为一个基因，每一列代表一个样本。读取数据的代码如下

# 读取表达量的表格counts <- read.table( "gene.counts.tsv", header=T, sep="\t", row.names=1, comment.char="", check.names=F)# 设置样本分组group <- factor(rep(c("control", "case"), each = 3))design <- model.matrix(~group)# 构建edgeR中的对象library(edgeR)y <- DGEList(counts=count)

之所以采用edgeR来读取数据，是为了方便后续的预处理和归一化。

2. 过滤count数很低的基因

和edgeR中的预处理过程类似，根据CPM表达量对基因进行过滤，代码如下

keep <- rowSums(cpm(y)>1) >= 2y <- y[keep, , keep.lib.sizes=FALSE]

3. 归一化

默认采用TMM归一化算法，计算每个样本的 sizefactor, 代码如下

y <- calcNormFactors(y)

4. 表达量转换

在进行差异分析前，需要对表达量进行转换，有以下两种选择

logCPMvoom

第一种转换就是计算logCPM值，第二种转换适用于样本间sizaFactors差异较大的情况。转换的代码如下

# logCPMlogCPM <- cpm(dge, log=TRUE, prior.count=3)# voomv <- voom(dge, design, plot=TRUE)

5. 差异分析

转换之后的表达量就可以进行差异分析了，代码如下

fit <- lmFit(logCPM, design)fit <- eBayes(fit, trend=TRUE)res<- topTable(fit, coef=ncol(design))

上述代码采用的是logCPM值，当然也可以采用voom转换后的值，当采用voom转换时，注意trend参数为FALSE。

这里只是介绍了最简单的用法，更多复杂案例，比如多个分组，时间序列的差异分析等，请参考官方文档。

·end·

—如果喜欢，快分享给你的朋友们吧—

轻量级前端框架助力开发者提升项目效率与性能

1611 2022-11-25

使用limma进行两组间的差异分析

轻量级前端框架助力开发者提升项目效率与性能

大屏前端框架如何推动企业数据可视化与用户体验的革新

探索flutter框架开发的app在移动应用市场的潜力与挑战

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计