微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

Nature子刊新登，如何检测小分子机器学习中的覆盖率偏差

碧海醫心

发布： 2025-02-13 22:56:10

原创

739人浏览过

小分子机器学习模型的训练数据覆盖偏差问题研究

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

小分子机器学习旨在预测分子的化学或生物特性，广泛应用于毒性预测、药物研发等领域。近年来，端到端模型备受关注，但这些模型依赖于训练数据的代表性，忽略了数据覆盖偏差可能带来的风险。

德国一个研究团队近期发表在《Nature Communications》上的论文(Coverage bias in small molecule machine learning)，深入探讨了大规模数据集对已知生物分子结构空间的覆盖情况。他们提出了一种基于最大公共边子图 (MCES) 的距离度量方法，更准确地评估分子结构间的相似性，并以此分析了常用数据集的覆盖偏差。

研究结果显示，许多常用数据集缺乏对生物分子结构的全面覆盖，这限制了模型的预测能力。研究人员提出了两种补充方法来评估训练数据集与已知分子分布的差异，为未来数据集构建提供了指导。

数据集分析方法

该研究团队采用了一种基于最大公共边子图 (MCES) 的新距离度量方法，克服了传统分子指纹方法的不足，更有效地捕捉分子结构的相似性。他们利用均匀流形近似和投影 (UMAP) 技术对生物分子结构进行可视化，直观地展现了数据集的覆盖情况。

SEEK.ai

SEEK.ai

AI驱动的智能数据解决方案，询问您的任何数据并立即获得答案

SEEK.ai

100

SEEK.ai

图示：生物分子结构的初始图谱 (论文截图)

研究人员对 20,000 个生物分子结构进行了抽样分析，并对 10 个常用的公共数据集进行了评估。结果表明，这些数据集的分子结构分布通常远非均匀，许多生物分子结构区域存在空白。

图示：最大公共边子图计算 (论文截图)

结论与展望

该研究揭示了小分子机器学习中训练数据覆盖偏差的普遍性及其对模型性能的负面影响。研究人员强调，构建具有代表性的数据集至关重要，并建议将数据集分布分析纳入机器学习最佳实践指南中。他们提出的 MCES 距离度量方法为评估数据集覆盖情况提供了一种有效工具，有助于改进模型的泛化能力和预测精度。未来研究可进一步优化MCES计算效率，并将其集成到机器学习模型的训练流程中。

以上就是Nature子刊新登，如何检测小分子机器学习中的覆盖率偏差的详细内容，更多请关注php中文网其它相关文章！

相关标签：

工具

大家都在看：

腾讯AI图像增强怎么提升低光照片质量_腾讯AI图像增强工具实战操作问界官宣亮相2025广州车展全车型集结5.2馆2E01展台岚图泰山37.99万元起！首搭三腔空悬+四激光雷达天宫AI怎么提升工作效率_天宫AI职场工具与效率提升技巧分享天宫AI能做简历吗_天宫AI简历生成与优化技巧分享

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：刚刚，奥特曼剧透GPT-4.5、GPT-5重大更新，o3取消独立发布下一篇：超越思维链？深度循环隐式推理引爆AI圈，LLM扩展有了新维度

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

使用Java Stream groupingBy时添加元素的方法

2025-11-16 12:34:15
Scala中抽象类方法内实现对象克隆与不可变更新的策略

2025-11-16 12:41:11
Flexbox布局中固定宽度组件因滚动条动态出现导致的位移问题及解决方案

2025-11-16 12:41:34
微调Llama 7B模型时AutoTokenizer使用错误解析与解决方案

2025-11-16 12:43:50
使用备忘录（Memoization）优化递归斐波那契程序的数学时间复杂度证明

2025-11-16 12:55:02
使用 CodeIgniter 3 通过外键从表中获取数据

2025-11-16 12:55:15
如何解决前后端分离中的CORS跨域难题？MezzioCORS组件助你轻松打通任督二脉

2025-11-16 12:56:02
解决Express中JWT验证403错误：Authorization头部处理详解

2025-11-16 12:57:05
使用Boto3和Python高效遍历S3存储桶对象：深入解析s3list生成器

2025-11-16 13:02:02
CodeIgniter 4：解决控制器向视图传递Model数据为Null的问题

2025-11-16 13:04:02

最新问题

智谱清言官方网站最新地址智谱清言AI对话主页平台直达入口智谱清言官方网站最新地址是https://chatglm.cn/，该平台基于自研GLM-4大模型提供智能对话、文本生成、代码辅助和知识问答等服务，具备语义理解准确、响应流畅、界面友好等特点，支持多轮交互与会话管理，助力用户高效完成各类文字与编程任务。

2025-11-19 10:07:02

423

松鼠AI怎么查看学习报告_松鼠AI学生端学习数据报告查看方法可通过松鼠AI官网登录学生或家长端查看“我的学习报告”获取详细数据；2.使用手机APP登录后点击“报告”或“学情”选项查阅知识点掌握率、学习时长等指标；3.联系教师由其在教师端生成PDF报告并通过邮件或微信发送，便于长期跟踪学习进展。

2025-11-19 09:39:55

854

小可AIAPI服务官网_小可AIAPI接口官方地址小可AIAPI服务官网入口地址是https://www.xiaokeai.com/api，该平台提供实时文本对话、情绪识别、语音转换、角色定制、形象装扮、数据管理等功能接口。

2025-11-19 09:33:31

222

百度AI文心一言官网入口文心一言网页版直接登录入口文心一言官网入口是https://yiyan.baidu.com，用户可直接访问该链接登录或注册账号使用其多轮对话、内容创作、知识问答和图像生成等功能。

2025-11-19 09:33:10

113

2026 DeepSeek AI聊天入口 DeepSeek AI互动免费App入口 2026DeepSeekAI聊天入口为https://chat.deepseek.com，提供免费App及多平台接入，支持长文本对话、代码辅助、联网搜索等功能，用户可通过官网、腾讯元宝小程序、WPS等渠道使用，App兼容安卓与iOS，具备语音输入、主题自定义特性，同时支持API对接与本地部署，满足多样化需求。

2025-11-19 06:25:16

740

即梦AI最新官方网址分享即梦AI免费版在线体验入口即梦AI最新官方网址为https://jimeng.jianying.com/，用户可通过抖音扫码或手机验证码登录，享受多端同步的AI绘画、图生视频、智能画布等免费创作功能。

2025-11-19 02:15:18

123

讯飞火星AI怎样进行减肥计划制定_讯飞火星AI减肥方案与饮食建议智能生成方法讯飞火星AI可基于个人身体数据和生活习惯制定科学减肥方案。首先输入性别、年龄、身高、体重及活动水平等基础信息，设定减重目标；接着填写饮食偏好、食物禁忌和口味倾向，便于生成个性化食谱；系统据此计算每日热量需求，创建300-500大卡热量缺口，并搭配高蛋白、低碳水、高纤维的一周餐单，支持导出购物清单；同时匹配运动计划，包括每周3-5次有氧和2-3次力量训练，初学者可获动作指导，完成数据可手动录入以动态调整方案。

2025-11-19 02:03:23

932

蔚来川西环线换电路线贯通李斌：1亿次换电即将达成 11月18日，蔚来官方宣布川西环线换电路线实现全线贯通。蔚来创始人、董事长兼CEO李斌在社交平台透露，截至10月26日，蔚来全平台换电次数已突破9000万次，预计将在不久后迎来第1亿次换电里程碑。据悉，这条环线以成都为起点，总里程约1400公里，沿途共建设13座换电站，平均间距约110公里，全面覆盖雅安、康定、丹巴、松潘、都江堰等重要城市节点，并延伸服务至九寨沟、黄龙、四姑娘山、达古冰川等多个热门旅游目的地，极大提升了用户在高原及偏远地区的补能体验。截至目前，蔚来在全国范围内已建成3539座换电

2025-11-18 22:31:01

382

卢伟冰：小米汽车本周将提前达成全年35万台交付目标小米YU711月17日，11月18日晚，小米集团合伙人、总裁卢伟冰在2025年第三季度财报电话会上宣布，小米汽车预计将在本周内达成全年35万台的交付目标。随后，小米公司发言人王化也在社交平台确认了这一喜讯。今年3月，在市场需求持续强劲的推动下，小米汽车将年初制定的30万台年度交付目标上调至35万台。截至10月22日，第30万台新车已成功下线，完成率达86%，仅需再交付5万台即可收官全年任务。据获悉，为保障交付进度，小米北京工厂已全面启动双班生产模式，其设计年产能虽为30万台，但实际利用率接近20

2025-11-18 21:18:06

719

深蓝L06正式上市限时权益价13.29万起多项配置免费送 11月18日，深蓝汽车举行深蓝L06价格及权益发布会，宣布这款全新中型新能源轿车正式上市。新车共推出4款配置，限时权益价区间为13.29万元至15.49万元，提供纯电与增程两种动力选择。深蓝L06据小编了解，深蓝L06全系标配激光雷达，并搭载基于3纳米工艺的车规级座舱芯片与DEEPALADMax辅助驾驶系统，算力达256TOPS，实现“一段式端到端”智能驾驶功能。外观上采用封闭式中网、分体式T字大灯及贯穿式尾灯，车身尺寸为4830×1905×1480mm，轴距2900mm，定位“长续航磁流变激光

2025-11-18 21:16:13

807

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部