谷歌研究团队与加州大学圣克鲁兹分校的科研人员共同推出了 deepsomatic,一款全新的人工智能模型,专注于检测癌细胞中的基因突变。在与儿童医疗中心合作开展的研究中,该模型成功识别出10种此前被其他分析工具遗漏的小儿白血病相关体细胞变异。
DeepSomatic 是一种专为癌症基因组设计的小型变异检测工具,兼容多种测序技术,包括 Illumina 短读段、PacBio HiFi 长读段以及 Oxford Nanopore 长读段数据。该模型基于 DeepVariant 框架进行优化和扩展,能够高效识别单核苷酸变异(SNV)和小插入缺失(indels),并支持肿瘤-正常配对及仅肿瘤样本的分析流程,同时集成了针对福尔马林固定石蜡包埋(FFPE)样本的处理能力。

其核心技术在于将比对后的测序读段转化为类似图像的张量结构,这些张量编码了序列比对的堆叠信息、碱基质量得分以及局部上下文特征。借助卷积神经网络,DeepSomatic 对候选变异位点进行分类,判断其是否为真实的体细胞突变,并最终输出标准的 VCF 或 gVCF 文件。这种图像化建模方式赋予模型跨平台的强大适应性,因为它能有效捕捉不同测序技术特有的错误模式和局部单倍型结构。
在训练与评估过程中,研究团队采用了 CASTLE(癌症标准长读段评估)数据集,该数据集包含6组匹配的肿瘤与正常细胞系样本,均通过 Illumina、PacBio HiFi 和 Oxford Nanopore 三种技术完成全基因组测序。研究人员已公开发布该基准数据集及相关访问权限,旨在推动多平台体细胞变异研究的发展,填补了当前领域内高质量训练与测试资源的空白。

实验结果表明,DeepSomatic 在 SNV 和 indel 的检出性能上显著优于现有主流方法。例如,在 Illumina 数据的插入缺失检测中,DeepSomatic 实现了约90% 的 F1分数,而传统方法仅为80%;在 PacBio HiFi 数据中,其 F1分数也超过了80%。此外,研究还发现了共计329,011个体细胞插入缺失变异,进一步证明了该模型在复杂变异识别方面的卓越表现。
以上就是谷歌 AI 研究推出 DeepSomatic:新型癌细胞基因变异识别模型的详细内容,更多请关注php中文网其它相关文章!
谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁,使用起来得心应手。这里提供了谷歌浏览器纯净安装包,有需要的小伙伴快来保存下载体验吧!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号