普瑞纯证

外媒 | 研究人员提出开发高质量医疗机器学习模型的策略-普瑞纯证

研究人员提出开发高质量医疗机器学习模型的策略

本月发表在BMC医学研究方法学杂志上的一项研究,阐述了如何通过数据预处理、超参数调整和模型比较等实用技术来开发高质量的基于机器学习的医疗模型。为了提供这些指南,研究人员训练和验证了多个机器学习模型,以演示最佳实践。这些模型旨在使用乳腺X线摄影图像特征和患者年龄来将乳腺肿块分类为良性或恶性。模型预测结果与同一乳腺图像的组织病理学评估进行比较,以衡量性能。以此为例,研究人员提供了执行机器学习分析的逐步说明,从数据准备开始,到模型评估结束。他们还利用开源软件和数据,让其他人可以练习本文中概述的技术,这是机器学习在医学领域系列文章的一部分。

研究人员首先讨论了数据预处理,包括数据清洗和特征工程。数据清洗是指删除不正确、不相关和重复的数据,并处理缺失数据的过程。作者指出,处理缺失数据需要对数据有深入的了解,包括收集数据的背景和机器学习模型使用的背景。因此,他们建议临床医生和数据科学家之间进行多学科合作,以充分清洗数据。特征工程描述了用于准备数据的统计方法,以便机器学习模型可以更有效地利用它们。例如,数据归一化、转换、特征选择、降维和数据类型转换等。该过程的下一步是超参数调整。超参数控制特定机器学习算法的配置。它们可以分为优化超参数和模型超参数。优化超参数旨在控制给定模型的训练过程和学习率,而模型超参数则指定算法的架构,例如神经网络中的层数。研究人员还指出,超参数与模型参数不同。模型参数是在训练过程中直接从数据中导出的,他们解释道。相比之下,超参数是预先指定的。

版权声明 本网站所有注明“来源:普瑞纯证”或“来源:pureFDA”的文字、图片和音视频资料,版权均属于普瑞纯证网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:普瑞纯证”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。