标签:load pca PCA component 热图 GEO 质控 principal
3. 数据质控 - PCA、热图
rm(list = ls()) load(file = "step1output.Rdata") load(file = "step2output.Rdata") #输入数据:exp(表达矩阵)和group_list(分组信息) #Principal Component Analysis(PCA图,主成分分析图) #PCA代码来源:http://www.sthda.com/english/articles/31-principal-component-methods-in-r-practical-guide/112-pca-principal-component-analysis-essentials dat=as.data.frame(t(exp)) library(FactoMineR) #画主成分分析图需要加载这两个包。 library(factoextra) #画主成分分析图需要加载这两个包。 # pca的统一操作 dat.pca <- PCA(dat, graph = FALSE) pca_plot <- fviz_pca_ind(dat.pca, geom.ind = "point", #仅显示点(但不是“文本”)(show points only (nbut not "text"))。 col.ind = group_list, #按分组信息赋予颜色(color by groups)。 #palette = c("#00AFBB", "#E7B800"), #如需设置非默认颜色,将此行代码的“#”去掉并修改颜色,颜色个数需与分组个数相同。 addEllipses = TRUE, #浓度椭圆(Concentration ellipses)。 legend.title = "Groups" #注释标题。 ) pca_plot ggsave(plot = pca_plot,filename = paste0(gse,"PCA.png")) #保存PCA图(.png格式)。 save(pca_plot,file = "pca_plot.Rdata") #保存PCA对象 。 #热图 cg=names(tail(sort(apply(exp,1,sd)),1000)) #取表达矩阵exp中标准差最大的1000个探针的名字。 n=exp[cg,] #取表达矩阵exp中标准差最大的1000个探针。 #绘制热图 annotation_col=data.frame(group=group_list) #生成含有一列值的数据框,列名为“group”,值为分组信息(group_list)。 rownames(annotation_col)=colnames(n) #行名为表达矩阵exp中标准差最大的1000个探针的名字。 library(pheatmap) pheatmap(n, show_colnames =F, #不显示列名。 show_rownames = F, #不显示行名。 annotation_col=annotation_col, #按分组进行列注释。 scale = "row") #按行标度。 dev.off() #关闭画板。若运行代码后不出图也不报错,可能是画板被占用,运行此行代码即可。
标签:load,pca,PCA,component,热图,GEO,质控,principal 来源: https://www.cnblogs.com/xiaogaobugao/p/16675422.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。