ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

MDL4Microbiome:通过多模态深度学习提升宏基因组数据疾病预测的准确性

2022-03-02 10:31:45  阅读:242  来源: 互联网

标签:模态 特征 模型 MDL4Microbiome 基因组 准确性


来源 国家基因库大数据平台 

在过去的几十年里,先进的宏基因组测序技术使得对人类微生物组的研究能够发现细菌组成与功能、疾病之间的病理关系。然而相关分析工具在诊断和治疗方面的应用仍需提高其准确性。近日,《Scientific reports》发表了一个新工具:MDL4Microbiome,其通过使用宏基因组序列的各种特征和多模态深度学习模型,在预测疾病状态方面表现出很高的准确性。

MDL4Microbiome是什么?

MDL4Microbiome是一个深度学习模型,利用从微生物组测序数据中提取的特征对疾病状态进行分类。

MDL4Microbiome 示意图

该分类器是利用微生物组数据的基本信息构建和训练的。采用了不同的方法来提取特征,即传统的分类学特征、代谢功能特征和基因组水平的丰度。不同的特征被送入多模态深度学习模型。该模型通过留一交叉验证法(LOOCV)进行评估。

多模态深度学习模型的体系结构  

多模态深度学习模型和简单的深度神经网络模型是用Python(version 3.6.9)实现的。

MDL4Microbiome的性能评估

开发团队使用炎症性肠病(IBD)、2型糖尿病(T2D)、肝硬化(LC)和结直肠癌(CRC)数据集来测试模型准确性:准确度分别为0.98、0.76、0.84和0.97;与经典的机器学习方法相当或更高。此外,开发团队还对选定特征的结果集进行了更深入的分析,以了解其不同特征的贡献。与其他机器学习方法相比,MDL4Microbiome是一种具有更高或相当准确度的分类器。

为了评估模型结构方面的准确性,开发团队使用不同的特征构建了四个不同的模型。与具有单个特征类型的简单DNN分类器相比,多模态神经网络在所有四个数据集上都达到了最佳精度。

ROC曲线和曲线下面积(AUC)所示:与具有单一特征类型的神经网络相比,多模态神经网络表现出更好的性能。特别是对于IBD、LC和CRC数据集,当结合特征并使用多模态深度学习模型时,ROC曲线和AUC值显著改善。

不同特征对性能的影响:分类等级作为特征,越小的等级(从门到种)准确度越高,即在IBD、T2D、LC和CRC数据集中,“门”的准确率最低,而“种”的准确率最高。此外,对于IBD、T2D和CRC数据集,基因组水平的变异特征显示出最高的准确性。生成基因组特征时,参考样本的数量会影响准确性。

与现有模型的精度比较

总之,多模态深度学习方法允许结合微生物组不同方面的特征,从而实现宿主表型的高精度分类。后续开发团队还将对MDL4Microbiome开展进一步研究,以确定对诊断疾病的重要特征有贡献的未标记物种

标签:模态,特征,模型,MDL4Microbiome,基因组,准确性
来源: https://blog.csdn.net/qq_42458954/article/details/123223839

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有