科学家发现稀疏可靠的组学生物标记物

美国斯坦福大学Brice Gaudillière团队利用Stabl发现了稀疏、可靠的组学生物标记物。相关研究1月2日在线发表于《自然-生物技术》。

研究人员表示,在临床研究中采用高内涵组学技术并结合计算方法,产生了大量候选生物标志物。然而,将这些研究结果转化为真正的临床生物标志物仍具有挑战性。

为了推动这一进程,研究人员引入了Stabl,这是一种通用的机器学习方法,通过将噪声注入和数据驱动的信噪比阈值整合到多变量预测建模中,来识别一组稀疏、可靠的生物标记物。

通过合成数据集和5项独立临床研究中对Stabl的评估表明,与常用的稀疏性促进正则化方法相比,该方法提高了生物标记物的稀疏性和可靠性,同时保持了预测性能;它将包含1400~35000个特征的数据集精简为4~34个候选生物标记物。

Stabl还可扩展到多组学整合任务,对复杂的预测模型进行生物学解释,因为它能筛选出预测分娩开始的蛋白质组、代谢组和细胞计量学事件、早产的微生物生物标志物以及手术后感染的术前免疫特征。

相关论文信息:

https://doi.org/10.1038/s41587-023-02033-x