ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

GEO代码分析流程 - 7. 复杂数据及其分析

2022-09-16 00:31:35  阅读:191  来源: 互联网

标签:分析 control 批次 数据 流程 分组 treat GEO 差异


1. 配对样本的差异分析

在差异分析的数据处理中,只有design这一行代码有区别

pairinfo = factor(c(1,2,1,3,2,3))
design = model.matrix(~group_list + pairinfo)

配对信息:1,2,3分别为三个病人;

分组信息:由group_list指定,post和pre为有序因子。

配对样本数据的可视化


 2. 多个分组的数据

策略1:选出一个分组作为对照,其他分组分别与对照进行差异分析

策略2:两两对比:AB、AC、BC

关于作图:火山图只能分开画,其他图分开和合并都可以


  3. 多个series联合分析

考虑批次效应:

(1)选择来自同同一芯片平台(GPL)的series

(2)需要处理批次效应(Batch effect)

数据集A + B,各自分为treat和control两组;

本来AB各自的treat和control各差异,合并后竟然差异

本来AB各自的treat和control差异,合并后竟然差异

处理批次效应

例如,合并两个数据集时,第二个数据集的第三个样本有异常:

 

可以用limma::normalizeBetweenArrays()函数把异常样品的中位数拉到同一水平上,也可以直接把异常样本去掉。比较来说,去掉的结果更好些。

但是,直接用两个中位数不在同一水平上的数据集来做分析的结果是错误的,需要处理批次效应,将两个数据集的中位数拉到同一水平上:

 

处理批次效应的两个函数:limma::removeBatchEffect(),sva::ComBat()


 

标签:分析,control,批次,数据,流程,分组,treat,GEO,差异
来源: https://www.cnblogs.com/xiaogaobugao/p/16698083.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有