
近日,快手旗下的可灵AI数字人正式开启公测。借助先进的多模态技术,该功能实现了从简单的“对口型”到具备表现力的“会表演”的跨越式升级。用户只需上传图片或音频文件,即可生成分辨率为1080p、帧率高达48fps、最长可达1分钟的高质量数字人视频。功能涵盖精准的口型匹配、细腻的情绪与动作控制,并支持多个角色同屏互动,同时兼容中文、英文、日文、韩文等多种语言。
目前,用户可通过访问可灵AI官方网站(https://www.php.cn/link/5fde161290a4ebf1163b976f2fa03cdd。
据悉,可灵AI数字人深度融合了多模态理解能力与视频生成模型,依托基于Transformer结构的DiT架构,在处理时间序列数据和实现精细化控制方面展现出强大优势。系统能够准确识别输入图像中的面部特征,深入理解音频语义内容,并智能推断出与语音情绪相匹配的表情变化和细微动作,确保生成的数字人在整个视频过程中形象统一、表现自然。
在角色形态和语言适配方面,可灵AI数字人展现出广泛的适用性,不仅支持真人形象,还可生成动画人物乃至动物形态的虚拟角色。多语种支持覆盖中、英、日、韩等主流语言,满足全球化场景下的多样化创作需求。在定价策略上,结合会员权益优惠,最低使用成本可降至0.12元/秒,显著降低用户创作门槛。
以上就是快手旗下可灵 AI 数字人上线公测的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号