微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

炒菜、雕刻、绘画、汽车人变形！MakeAnything用扩散Transformer解锁多任务过程生成

花韻仙語

发布： 2025-02-15 21:06:52

原创

1119人浏览过

新加坡国立大学show lab的研究成果makeanything，让ai学会了分步骤创作！这项突破性研究，通过巧妙结合diffusion transformer (dit)和非对称lora技术，首次实现了高质量、跨领域的程序化序列生成，并在21类任务中展现出优异性能及强大的泛化能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

挑战与突破：AI创作的“过程”难题

以往的AI图像生成，主要集中在最终结果的呈现。而要让AI生成像绘画、手工艺等复杂作品的步骤教程，则面临三大挑战：高质量多任务数据集匮乏、步骤间逻辑关联性不足以及跨领域泛化能力有限。MakeAnything团队另辟蹊径，从数据、模型和方法三个方面入手，攻克了这些难题。

MakeAnything的核心技术：

海量多领域数据集： 构建了涵盖绘画、手工艺、乐高搭建、3D建模、烹饪等21个领域的超大规模数据集，包含超过24,000个标注序列，为AI学习“分步创作”提供了坚实的数据基础。
DiT与蛇形布局： 利用DiT模型的空间注意力机制，并创新性地采用蛇形序列布局，将多步骤图像排列成蛇形网格，强化模型对步骤顺序的感知，确保步骤间的逻辑连贯性和视觉一致性。

非对称LoRA： 借鉴大语言模型的HydraLoRA技术，设计了非对称LoRA，在所有数据集上微调共享矩阵A，学习通用知识和分步骤逻辑；对不同任务单独微调矩阵B，适配特定任务特性，从而在提升泛化能力的同时，保证了不同领域任务的精准适配。

麦艺画板(Max.art)

麦艺画板(Max.art)

AI工业设计平台，专注于汽车设计，线稿、渲染、3D建模全流程覆盖

麦艺画板(Max.art)

27

麦艺画板(Max.art)

ReCraft模型：由结果反推过程： 开发了ReCraft模型，允许用户输入目标图像，AI即可生成相应的创作步骤，实现图像条件下的过程生成。

强大的泛化能力： MakeAnything甚至能在未经训练的任务上展现出令人惊叹的泛化能力。

实验结果与评估：

MakeAnything在多个指标上超越现有技术，包括图文一致性、逻辑连贯性和实用性。消融实验也证明了非对称LoRA的有效性。

结语：

MakeAnything的开源，将推动AI在创意领域的发展，为艺术家和设计师提供强大的辅助工具。其代码、模型和数据集已开源： https://www.php.cn/link/01991b6bec4ceacaf9fd8748b7fa0698

以上就是炒菜、雕刻、绘画、汽车人变形！MakeAnything用扩散Transformer解锁多任务过程生成的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git 工具 ai 排列 github transformer https

大家都在看：

松鼠AI怎么注册账号_松鼠AI新用户注册详细教程哩布哩布AI怎么制作头像_哩布哩布AI统一风格网红头像批量教程哩布哩布AI人像动漫化怎么做_哩布哩布AI照片转二次元完整教程百度AI文心一言怎么创作歌曲_百度AI文心一言AI作曲入门教程 AI志愿助手怎么完成实名认证_AI志愿助手实名认证操作完整流程

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：崔东树：今年1月全国新能源乘用车零售74万辆，渗透率达41% 下一篇：艾森股份拟购棓诺新材70%股权，强化OLED材料业务布局

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

优化Volley StringRequest处理JSON响应及网络错误诊断

2025-11-16 12:24:22
使用 SVGR 在 React 中自定义 Checkbox 的选中状态

2025-11-16 12:25:01
实现 Adminer 自动登录：无缝数据库管理配置指南

2025-11-16 12:25:10
Python print() 函数中回车符的行为解析与应用

2025-11-16 12:33:17
解决CSS图片样式不生效：HTML与CSS文件连接及路径管理指南

2025-11-16 12:34:25
Snowpark：循环处理数据时如何避免结果被覆盖？

2025-11-16 12:36:05
构建沉浸式平滑粘性滚动体验：JavaScript驱动的自定义滚动方案

2025-11-16 12:45:06
Python数据处理：利用字典高效合并重复条目并整合相关信息

2025-11-16 12:46:19
HTML Purifier中MathML支持的实现与挑战

2025-11-16 12:52:18
修复多步骤表单中点击按钮后选项卡自动返回的问题

2025-11-16 12:56:29

最新问题

哩布哩布AI怎么注册账号_哩布哩布AI注册登录详细教程注册并登录哩布哩布AI服务需先访问官网，点击注册按钮填写邮箱或手机号、设置密码并输入验证码完成身份验证后，返回登录页面输入凭证即可成功登录。

2025-11-17 01:09:17

390

腾讯AI安全访问官网地址_腾讯AI平台官方入口链接腾讯AI平台官方入口为https://ai.tencent.com/，该平台提供语音识别、图像处理、自然语言理解等技术，支持企业服务、教育、金融、娱乐等多场景应用，并具备标准化API接口与多终端适配能力。

2025-11-17 00:57:16

564

ai志愿助手安全官方网址入口_ai志愿助手官网直达首页最新链接 AI志愿助手是辅助高考填报的智能工具，考生可通过手机应用商店搜索下载官方App，或在百度等平台搜索“省份+AI志愿助手”获取入口，部分省市教育考试院官网也提供链接，使用时需注意甄别真伪确保安全。

2025-11-17 00:53:10

722

现代汽车：计划从明年至2030年在韩国投资862亿美元近日，现代汽车集团董事长宣布，公司将在2026年至2030年期间于韩国本土投资125万亿韩元（约合862亿美元）。该项投资旨在推动技术升级与产能扩张，目标是在2030年前将电动汽车及混合动力汽车的出口量提升至当前水平的两倍以上。据资料显示，今年9月，现代汽车在2025CEO投资者大会上发布了其最新中长期发展战略。根据规划，集团将从明年起陆续推出涵盖混合动力、纯电动、增程式以及氢燃料电池在内的多款新能源车型。到2030年，混动产品线将扩展至18款以上，覆盖从经济型到高端豪华的各个细分市场，相较目前

2025-11-16 23:08:01

108

即梦生成的图片可以修改吗_即梦生成图片修改方法即梦生成图片后若需调整，可先尝试内置编辑功能优化亮度、对比度和滤镜；如需深度修改，则导出至Photoshop、Pixelcut等专业软件进行局部重绘或修补；最有效方式是通过优化提示词重新生成，以更精准描述场景、光照、姿态等细节迭代获得理想图像。

2025-11-16 21:25:17

455

2026 DeepSeek AI写作入口 DeepSeek AI写作官网免费登录入口 DeepSeekAI写作官网免费登录入口为https://www.deepseek.com，该平台基于先进自然语言处理技术，支持多轮对话交互、自定义写作风格与长文本生成，覆盖科技、教育、职场等多领域写作需求，提供简洁操作界面与跨设备同步功能，适配主流浏览器与移动端，具备快速响应与语义连贯性优势，持续迭代模型并拓展应用场景，提升内容创作效率。

2025-11-16 21:23:02

675

腾讯AI图像生成怎么用文生图功能_腾讯AI Hunyuan文生图详细操作使用腾讯混元AI文生图功能时，需输入明确指令如“生成一张XX的照片”并添加“真实感”“摄影风”等词汇提升真实度，避免使用“画一幅XX画”类表述以防艺术化风格；结合具体风格关键词如“赛博朋克风”“水墨画风格”等控制视觉特征；通过详尽描述主体、背景、色彩等画面细节，并参考示例优化提示词，每次调整单一变量以观察效果；利用模型优化特性，启用人体骨架和人手结构先验提升人物自然度，依赖增强算法改善空间布局与透视，针对人像细化发丝、皱纹等描述可提升细节表现最高30%，场景图像细化草木、波纹等元素可提升细节效果

2025-11-16 21:22:02

428

即梦4.0如何使用自定义字体_即梦4.0导入与使用个性化字体的方法首先安装自定义字体文件至系统，通过字体管理器确认启用状态，再在即梦4.0中导入并应用于文本，最后可将常用字体保存至预设库以便快速调用。

2025-11-16 21:20:57

665

LEANTS乐蚁J5如何设置隐私空间_LEANTS乐蚁J5隐私模式创建与重要文件保护方法可通过手机隐私空间、加密传输和关闭通知预览保护LEANTS乐蚁J5隐私：1.将敏感音频文件存入手机隐私空间并设强密码；2.使用加密工具处理需播放的私密文件，防止未授权访问；3.在蓝牙设置中关闭通知内容显示，避免敏感信息泄露。

2025-11-16 21:20:02

219

哩布哩布ai平台官方网址地址_哩布哩布ai官网直达首页链接哩布哩布AI平台官方网址是https://www.liblib.ai/，该平台提供丰富的AI创作模型资源，支持个性化创作与社区交流，持续更新模型并为用户提供详细使用指南。

2025-11-16 21:13:02

668

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Python+人工智能全栈工程师(Linux基础篇)

314958次学习
收藏
Node.js-前端工程化必学

28488次学习
收藏
Vue3.x 工具篇--十天技能课堂

12020次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部