标签:语言 df 差异 50 pval 初识 数据处理 orderP deg
差异基因筛选
差异系数,可以体现对象数据与标准数据的相对差异,数值越大,表示不平衡程度越大[1]
设x与y分别为对象数据和标准数据,则差异系数k的表达式为:
差异倍数
df = read.delim('DEG_nofiltered.xls',
header = T, sep = '\t')
#### 3.1.1 根据差异倍数大于2且P值小于0.05筛选
dim(subset(df, FC > 2 & pval < 0.05 |
FC < 0.5 & pval < 0.05))
df$logFC = log2(df$FC)
deg = subset(df, abs(logFC) > 1 & pval < 0.05)
dim(deg)
### 3.2 排序
#### 3.2.1 差异最显著的50个基因
orderP = order(deg$pval) # 返回pval从小到大排序的坐标
deg_orderP = deg[orderP,] # 根据上述位置关系重新排列行
top50P = head(deg_orderP, 50) # 提取前50行
top50P$id
#### 3.2.2 差异倍数最大的50个基因
orderFC = order(abs(deg$logFC),
decreasing = T) # 返回差异倍数由大到小排序的坐标
deg_orderFC = deg[orderFC,]
top50FC = head(deg_orderFC, 50)
top50FC$id
将数据写入
### 4.2 txt文件
write.table(deg_TF_all, 'deg_TF_all.xls',
col.names = T, row.names = F,
sep = '\t', quote = F)
### 4.3 xlsx文件
library(writexl)
write_xlsx(list(mysheet=deg_TF_all),
'deg_TF_all.xlsx')
每文一语
这个世界上没有单纯的一如既往,有条件的人绝对不会选择为善意付出时间!
标签:语言,df,差异,50,pval,初识,数据处理,orderP,deg 来源: https://blog.csdn.net/weixin_47723732/article/details/121071604
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。