清华系初创公司发布全球首个4D骨骼动画框架,实现一键将实景转化为动画,并且能够生成个性化角色

PHPz
发布: 2024-01-19 12:39:05
转载
1275人浏览过

苹果最近宣布将于2月2日推出首款虚拟头显设备vision pro,预计这款xr设备将引领下一代终端的快速发展。随着虚拟显示设备的普及,数字交互将从平面走向立体,立体模型和立体动画将成为未来的主流内容形式。多维沉浸式交互在虚实融合的趋势下也将成为潮流。

但从数据规模看,现阶段内容产业的数据积累仍以 2D 图像、平面视频为主,3D 模型、4D 动画等数据基础较为薄弱。其中,4D 动画是在传统 3D 模型的基础上引入时间序列,即随时间变化的 3D 模型,可以呈现出动态立体效果,在游戏动画、电影特效、虚拟现实等领域具有广泛的应用,但也是目前内容生态开发中最困难的环节。

因此,面向即将到来的多维沉浸式体验,构建立体化的数字内容将成为重要的基础性工作。

面向该前沿领域,清华系创业团队生数科技开展了系列研究和产品研发,于近期联合清华大学、同济大学等高校推出全球首个基于「骨骼动画」的 4D 动画生成框架「AnimatableDreamer」,能够直接将 2D 视频素材一键转成动态立体模型(即 4D 动画),支持自动提取骨骼动作、一键转换动画效果并可通过文字输入进行个性化角色生成。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

  • 论文地址:https://arxiv.org/pdf/2312.03795.pdf

  • 项目地址:https://animatabledreamer.github.io/

  • 论文标题:AnimatableDreamer: Text-Guided Non-rigid 3D Model Generation and Reconstruction with Canonical Score Distillation

大家可以看以下Demo视频。一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

全新内容生产方式

颠覆立体动画开发流程

过往业界制作立体动画,需要经过 3D 建模、贴图渲染、骨骼绑定、动画制作等复杂流程,需要建模师、动画师等专业人员参与才能完成,效率低、成本高。据统计,单一个静态 3D 模型建模的生产周期就在数小时到几天时间,成本可高达上千美元,再进行动态化处理成本投入将更高。

从官方发布的 demo 视频可以看到,上传一段松鼠的 2D 实景视频,通过输入「A squirrel with red sweater」(穿红色毛衣的松鼠)的文本描述,原本实景的松鼠一键转成动画风格,而且完美保留了动作姿势,同步还可生成 360 度视角下的立体动态模型,通过切换文字描述,可以自定义角色,将松鼠任意切换为狐狸、杰尼龟等不同的卡通形象。

「AnimatableDreamer」可自动提取视频中目标对象(人物、动物等)的骨骼动作,再通过文本描述将该对象转换为任意的带骨骼动画模型。整个过程不受模版限制,支持任意视频长度和任意类型动作,具备高度的时间一致性和多视角一致性,并且导出的动态立体模型,能够在任意 3D 环境中进行渲染。

面向影视动漫等领域的后期制作,通常需要针对动画做更多编辑,「AnimatableDreamer」也支持针对已经完成骨骼绑定的模型进行更换或编辑动画文件,实现更高的自由度。未来相关技术逐渐落地后,游戏开发、影视动画等场景的 3D 建模、动画制作流程,有望变得更加高效。

面向未来

有望形成全新的内容生态

CreateWise AI
CreateWise AI

为播客创作者设计的AI创作工具,AI自动去口癖、提交亮点和生成Show notes、标题等

CreateWise AI 133
查看详情 CreateWise AI

在实现原理上,研究团队创新性地提出了规范得分蒸馏策略(Canonical Score Distillation,简称 CSD),在随时间变化的相机空间中对不同帧及不同视角的 3D 模型进行渲染及降噪,并统一将梯度回传至不同相机空间共享的规范空间中进行蒸馏,将 4D 生成降维至 3D,即将 4D 生成问题简化为 3D 空间上的生成。

「AnimatableDreamer」能直接从视频中提取关节动作,通过解耦物体的模型与运动,生成的模型具备高度的时间一致性和几何合理性,不受视频长度限制,而且能有效地消除如形状断裂、闪烁和多视角不一致等问题。一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

在有限视角和大幅度运动的场景中,由于引入了 Diffusion 模型的先验知识,即便输入的视频未覆盖完整物体,「AnimatableDreamer」也能自动补全画面信息,实现较好的生成质量。

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

可以说,「AnimatableDreamer」的提出直接打通文本到 4D 骨骼动画的生成,建模、贴图、骨骼绑定、动作驱动一气呵成!输入自然语言描述,自动输出立体动画视频,无需专业知识,普通人也能直接上手,轻松定制动画内容。

以「AnimatableDreamer」为基础的工作将大大降低 3D、4D 数字内容的生产难度,将交互体验丰富化,让每个人都能进行创意内容的生成和编辑,将催生出 3D 时代下全新的内容娱乐与内容消费模式。

畅想一下,在未来的虚拟世界中,用户可以快速搭建自定义的数字空间,打造个性化的交互体验。例如:

  • 数字空间下的每个人物形象可以任意个性化的生成,比如给小朋友穿上超人的衣服、万圣节随意切换节日主题服装等;

  • 养宠物的用户可以将自家宠物卡通化,例如将其生成虚拟的米老鼠形象。宠物日常就如卡通片一样,主人跟宠物的日常互动将变得趣味横生;

  • 人与人的互动方式也变得更丰富,随时随地可以来上一场主题派对,实时生成想要的派对环境、人物装扮等等。

作为一家成立不到一年的初创公司,生数科技团队长期致力于图像、3D、视频等多模态大模型领域,在 9 月份发布了 3D 资产创建工具 VoxCraft,在 Discord 正式上线,支持文图引导、分钟级创建 3D 模型、3D 贴图自定义更换等功能,赋能游戏开发、影视动画等场景的 3D 建模流程。此次推出的 4D 骨骼动画生成是生数科技的又一项全新探索工作,未来将在 VoxCraft 的产品中进行集成。

VoxCraft 工具地址:https://voxcraft.ai/

苹果 Vision Pro 的来临不仅仅是硬件设备层面的重要革新,同时也将开启一场内容和体验革命的序幕。4D 动画生成等生成式 AI 的创新能力,除了带来更好的视觉呈现,还将以全新方式打开多维数字体验,为下一代人机交互带来更多可能。

以上就是清华系初创公司发布全球首个4D骨骼动画框架,实现一键将实景转化为动画,并且能够生成个性化角色的详细内容,更多请关注php中文网其它相关文章!

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:机器之心网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号