详解CPM定量方式-FinClip官网

详解CPM定量方式

网友投稿 1766 2022-11-25

详解CPM定量方式

欢迎关注”生信修炼手册”!

在edgeR中，提供了一种名为CPM的定量方式，全称为count-per-millon。假定原始的表达量矩阵为count, 计算CPM的代码如下

cpm <- apply(count ,2, function(x) { x/sum(x)*1000000 })

原始的表达量除以该样本表达量的总和，在乘以一百万就得到了CPM值。从公式可以看出， CPM其实就是相对丰度，只不过考虑到测序的reads总量很多，所以总的reads数目以百万为单位。

在前面的文章中我们介绍了edgeR提供的TMM归一化算法，CPM这种求相对丰度的思想，虽然也是一种比较简单的归一化方式，但它并不用于差异分析之前的归一化。

在edgeR中，CPM主要有以下两种用途

1. 过滤表达量较低的基因

DESeq2和edgeR都是针对raw count表达量进行分析，在DESeq2中，在过滤低表达量的基因时，直接是根据reads数的总和进行判断，代码如下

countData <- count[apply(count, 1, sum) > 10 , ]

由于不同样本测序的reads总数不同，所以直接将所有样本的reads相加，然后进行过滤，这种方式略显粗糙。edgeR中，利用CPM的定量结果，对低表达量的基因进行过滤，代码如下

countData <- count[apply(cpm(count), 1, sum) > 2 , ]

利用相对丰度的加和进行过滤，消除了样本间reads总数不同的影响。需要注意的是，我们只是用CPM来过滤基因，而后续分析还是基于raw count的结果，因为只有raw count是基于负二项分布的。

2. 差异分析的MA图

MA图是差异分析常用的可视化手段之一，横坐标为基因在两组样本中的均值，纵坐标为Fold change, 就是两组表达量的倍数。edgeR中的plotMD函数可以绘制如下所示的MA图

从x轴的标签可以看出来，采用的是CPM值。由于不同基因CPM值差异很大，所以采用log转换，缩小了不同基因之间的差异。

·end·

—如果喜欢，快分享给你的朋友们吧—

轻量级前端框架助力开发者提升项目效率与性能

1766 2022-11-25

详解CPM定量方式

轻量级前端框架助力开发者提升项目效率与性能

大屏前端框架如何推动企业数据可视化与用户体验的革新

探索flutter框架开发的app在移动应用市场的潜力与挑战

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计