ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Longitudinal Statistics 纵向统计分析

2021-01-27 21:05:17  阅读:313  来源: 互联网

标签:统计分析 Statistics Longitudinal qdec -- mgh 纵向 long 时间


在这之前的准备工作:用freesurfer的纵向处理流处理您的数据——http://surfer.nmr.mgh.harvard.edu/fswiki/LongitudinalProcessing

本文主要是讲统计分析方法:本文官方教程链接:http://surfer.nmr.mgh.harvard.edu/fswiki/LongitudinalStatistics

纵向数据比横截面数据(横截面数据就是我们用recon-all处理过的数据)更复杂,因为每个对象内的重复测量值相关(因为纵向数据是对一个对象重复扫描得到不同时间点的数据,来分析这个人从健康到生病到疾病的严重程度的分析)。 这种关联的强度将取决于扫描之间的时间间隔。 此外,当数据在时间点数和扫描间隔(不完善的时间)上显示出受试者之间的显着变化时,必须格外小心(我理解这句话的意思是说当我们研究的对象在扫描的次数和扫描的间隔不同时,如果变化很大,那就需要特别注意了(例如,A患者扫描10次,每次扫描间隔一个星期;B患者扫描了20次,每次间隔一个月;这种因为采样方式不同得到的不同的数据,如果他们的差别很大,拿我们分析的过程中,需要注意比较))。 然后,统计分析应考虑这些数据特征,以获得有效的统计推断。

Freesurfer当前(至少)具有三个不同的纵向数据分析框架:

1. 简化的重复测量方差分析(忽略测量场合的相关性和时序)http://surfer.nmr.mgh.harvard.edu/fswiki/RepeatedMeasuresAnova

2. 直接分析萎缩率或百分比变化(忽略相关性和单个时间点)http://surfer.nmr.mgh.harvard.edu/fswiki/LongitudinalTwoStageModel

3. 线性混合效果模型<-推荐(但更复杂)http://surfer.nmr.mgh.harvard.edu/fswiki/LinearMixedEffectsModels

Simplified Repeated Measures ANOVA

此方法可用于检查各个时间点之间的差异或比较各组之间的时间点差异。 对于两个时间点,它简化为PairedAnalysis:http://surfer.nmr.mgh.harvard.edu/fswiki/PairedAnalysis

Advantages:

包含在mri_glmfit中。
假设平均响应随时间没有任何特定趋势,因此可以捕获复杂的轨迹。
可以使用mri_glmfit随附的不同的多个比较方法。

Disadvantages:

不考虑重复测量之间的相关性,因此,统计功效显着降低。
不考虑测量时间可能会导致进一步的统计功效的降低。
只能应用于少量重复测量(<= 3)的平衡数据(所有对象在相同的测量场合获得其扫描)。我理解为只能应用在对称的数据上,也就是所有研究对象都要有相同的扫描次数和扫描间隔时间,并且扫描要少于等于3次。

Analysis of Rates or Percent Changes

分析,例如 在两个或两个以上时间点的年度变化百分比或萎缩率,可以运行两阶段模型。 这避免了处理纵向相关性。 这两个阶段是:

首先,将统计信息简化为每个对象为一个数字(两个时间点的差或拟合线的斜率或年度百分比变化等)。
然后,使用标准GLM分析上一步得到的跨主题或组的汇总度量。
该模型非常简单,如果所有对象都具有相同数量的时间点,并且时间间隔大致相等,则可以选择该模型。 线性拟合到每个主题数据通常是有意义的,因为在几种应用中,可以假定在短时间内纵向变化几乎是线性的。

Advantages:

可以处理时间点数量不同且间隔不同的数据(但不对可变性的差异进行建模)。
适用于ROI统计信息(例如aseg.stat或aparc.stats)和皮质图(例如厚度)。
第二阶段可以使用QDEC(简单GUI)执行,也可以直接使用mri_glmfit执行。
第二阶段分析可以利用mri_glmfit随附的不同的多重比较方法。
脚本可用(long_mris_slopes和long_stats_slopes),不需要matlab。
对于两个时间点的简单情况,当查看简单差异时,此模型可简化为成对分析,但还可以计算(对称)百分比变化。
包括用于相交皮质标签(跨时间和跨主题)的代码,以确保排除所有非皮质顶点。

Disadvantages:

不对重复测量之间的相关性建模,因此统计功效显着降低。
不会根据时间点的数量来说明主题斜率内的不同确定性,因此它具有最高的假阳性倾向(质量单变量环境中的I型家庭明智误差)。
难以对非线性时间行为进行建模。
难以处理随时间变化的协变量(需要将斜率拟合到每个主题的变量中,以将其简化为一个数)。
无法包含来自单个时间点的主题信息,因此结果可能会出现偏差,并且统计能力较低。(我理解为不能处理只有一个时间点的数据)

线性混合效果模型克服了这些限制,如果对象的时间点不同(或更复杂的模型),则应使用线性混合效果模型。

Linear Mixed Effects Model

线性混合效应(LME)模型是最强大和原则性的方法。 我们推荐这种方法。

Advantages:

适用于统计量(单变量)和表面分析(质量单变量)。
可以处理时间间隔不相等和时间点数量不同的对象(丢失数据)。
即使是只有一个时间点的对象也可以包括在这些模型中(确保它们也经过纵向处理流处理过,这在FS 5.2版本中可用,以避免由于不同的图像处理而产生偏差)。
适当地对时间相关性建模。
可以跨测量场合对不同的方差建模。
我们的质量单变量(mass-univariate)方法可以很好地处理皮质测量之间的空间相关性,并且通过处理相关结构相对恒定的空间区域可以非常快速地进行处理。
可用于建模复杂的纵向行为(例如,二次或分段线性轨迹)和时变协变量。
在统计学家看来,LME模型是研究纵向数据的正确机制似乎已成为共识,而且审稿人可能会在期刊出版物中要求使用它们。

Disadvantages:

使用起来更复杂(例如,需要区分混合效果和固定效果...)。
目前,我们的实现仅在Matlab中进行。
当前仅提供FDR用于多重比较校正。

LinearMixedEffectsModels模型可以进行ROI分析以及对皮质图的高级纵向分析。 在这里,我们仅讨论如何为该分析准备数据。 分析本身是在matlab中执行的。

与常规(横截面)处理类似,ROI统计数据包含在统计文件中(请参阅ROI教程)。 例如,您可以在每个tpN.long.templateID / stats / dir中打开统计信息文本文件,其中包含统计信息,例如皮层下结构的体积或皮层区域的平均厚度。 这些统计信息可以输入到任何外部统计数据包中,以运行您感兴趣的任何分析。有用的命令包括asegstats2table和aparcstats2table,可从所有主题和时间点获取数据并创建单个表。

例如,要创建一个包含所有主题和所有时间点的皮质下ROI的表,您可以运行以下命令:

asegstats2table --qdec-long long.qdec.table.dat --stats aseg.stats --tablefile aseg.table.txt

这将自动从纵向目录(tpN.long.templateID / stats /)中获取统计信息,并创建一个表格(行:主题/时间点,列:结构)。 同样,您可以使用aparcstats2table进行表面ROI分析。

要在表面图上运行线性混合效果模型,您需要将所有数据映射到模板(通常为fsaverage)并平滑数据:

mris_preproc --qdec-long long.qdec.table.dat --target fsaverage --hemi lh --meas thickness --out lh.thickness.stack.mgh
mri_surf2surf --hemi lh --s fsaverage --sval lh.thickness.stack.mgh --tval lh.thickness.stack.fwhm10.mgh --fwhm-trg 10 --cortex --noreshape

Longitudinal QDEC Table

QDEC是用于对横截面数据进行简单统计分析的图形程序。 QDEC表是一种简单的文本格式表,其中包含主题ID(每行一个主题)和每列不同的协变量(例如年龄,性别,诊断等)。 第一行包含标题,第一列标题为fsid,其他列根据其内容命名。 QDEC组分析教程(http://surfer.nmr.mgh.harvard.edu/fswiki/FsTutorial/QdecGroupAnalysisV6.0)中对此进行了描述。 请注意,QDEC当前无法直接执行纵向统计!

为了分析纵向数据,一些命令行工具需要一个“纵向QDEC表”。 该表基于QDEC表格式,带有附加的第二列fsid-base,该列进行分组并为其主题分配多个时间点。

为了准备进行统计分析的纵向数据(LongitudinalTwoStageModel或LinearMixedEffectsModels),您需要以以下格式创建表(以文本文件分隔的空格):

其中第一列称为fsid(包含所有主题的所有时间点),第二列为fsid-base,包含主题内模板(= base)名称,以将主题内的时间点分组。您可以有更多列,例如性别,年龄,组别等。请确保其中包含一列准确的时间变量(如果您对年度变化感兴趣,则以年为最佳单位),例如年龄或研究持续时间(初始扫描的时间)。在这里,我们用几年来衡量从基线扫描(= tp1)开始的时间。您可以在表中看到,两个主题OAS2_0001和OAS2_0004分别具有两个时间点(MR1,MR2),它们的间隔时间不相等(相隔约15和18个月)。

请注意,fsid列包含原始主题/时间点ID,而不包含纵向名称。命令行脚本知道这是一个纵向表(由于参数,通常是--qdec-long和现有的fsid-base列),它将自动处理纵向目录中的数据。

例如:

long_mris_slopes --qdec ./qdec/long.qdec.table.dat --meas thickness --hemi lh --do-avg --do-rate --do-pc1 --do-spc --do-stack --do-label --time years --qcache fsaverage

是LongitudinalTwoStageModel的工具,并且期望使用纵向QDEC表(即使标志仅为--qdec)。 它将自动从纵向subN_tp1.long.subNtemplate目录中获取数据,并在受试者萎缩率等范围内进行计算。

并且

mris_preproc --qdec-long qdec.table.dat --target study_average --hemi lh --meas thickness --out lh.thickness.mgh

是通常用于mri_glmfit的工具。 它遍历QDEC表中的主题,将它们映射到study_average(通常为fsaverage),并将它们堆叠到一个文件中。 在此示例中,它使用纵向QDEC表(--qdec-long),然后从纵向目录中获取数据,以映射和堆叠它们并将它们准备好用于LinearMixedEffectsModels(http://surfer.nmr.mgh.harvard.edu/fswiki/LinearMixedEffectsModels)(通常,在 mris_preproc完成后,您需要使用mri_surf2surf 做一个平滑处理步骤,请参阅LME说明。

 

 

 

标签:统计分析,Statistics,Longitudinal,qdec,--,mgh,纵向,long,时间
来源: https://blog.csdn.net/qq_28480795/article/details/113258011

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有