ICode9

精准搜索请尝试: 精确搜索
首页 > 系统相关> 文章详细

Linux-vcf文件-如何通过VCF文件鉴别群体的等位基因频率?

2022-06-01 18:04:00  阅读:261  来源: 互联网

标签:文件 vcf VCF -- 等位基因 频率 freq


如何判定化石是祖先型等位基因还是突变型等位基因?

PS:不能挖到化石就说它是祖先。

可以和亲缘关系较近的物种进行序列比对,和近缘物种相同的就是祖先型,更大概率来自于更古老的祖先。

如何通过VCF文件鉴别群体的等位基因频率?

首先确定等位基因频率是一个群体的概念,也就是说不是每一个个体的VCF信息,而是一个群体的VCF文件,才有等位基因频率这一说法,在combine vcf文件中,每一个个体的基因型进行统计,才能得到这个群体的等位基因频率。注意到是一个个体是没有等位基因频率的,只有群体才有。

方法1.使用Vcftools

Vcftools –vcf file.vcf –frq –chr 1 –out filefreq

也可以使用某条染色体

Allele等位基因,一个个体就有一个基因型,但是这里C:0 、和T:1是什么意思呢?答:频率为100%

纯合型CC的频率是0和纯和型TT的频率是1?

--freq输出每个位点的等位基因频率,--freq2 抑制等位基因任何信息。

第二种用plink计算:

/path/to/plink-1.07-x86_64/plink --noweb --bfile file --freq --out filefrquency

frq (basic allele frequency report)

Produced by --freq. Valid input for --read-freq.

A text file with a header line, and then one line per variant with the following six fields:

CHR

Chromosome code

SNP

Variant identifier

A1

Allele 1 (usually minor)

A2

Allele 2 (usually major)

MAF

Allele 1 frequency

NCHROBS

Number of allele observations

原文链接:https://www.cnblogs.com/chenwenyan/p/7565619.html

计算等位基因频率方法

 

vcftools --gzvcf $indir/four_pops_132goats.final.chr.mt.biallel.snp.vcf.gz \

       --freq \

       --out $outdir/four_pops_132goats_snps_freq

#等位基因数目,染色体的数目(染色体的数目×2就应该是总样本的所有染色体数,为什么比后者小呢,是因为有缺失的存在),后面是等位基因以及他的频率

 

后者直接从VCF文件中提取

Vcftools –vcf file.vcf –get-INFO AF –out xx.test

#AF,应该就是等位基因频率

 

标签:文件,vcf,VCF,--,等位基因,频率,freq
来源: https://www.cnblogs.com/2022-1102/p/16335125.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有