阿里巴巴发布HappyHorse1.1,视频生成更流畅真实
此次升级进一步巩固了阿里巴巴在视频生成AI领域的竞争力,为开发者、创作者和企业用户提供了更强大、更易用的视频内容生成工具。
动态表现力显著提升
阿里巴巴新近发布的视频生成模型.1, 于动态表现力方面实施了大幅度升级, 相较于1.0版本, .1所生成的人物以及物体动作更为自然流畅, 不存在卡顿或者跳帧之感, 像在跑步场景当中, 人物四肢摆动愈发契合真实运动轨迹, 并非如往昔那般生硬, 依据阿里巴巴内部测试数据, .1在动态连贯性指标层面提升幅度超过30%, 用户反馈画面观感更为舒适。
主体一致性更强
从多帧视频生成的角度来看, .1在主体漂移问题的处理上有着出色表现, 以前模型在连续画面里, 人物脸型以及衣着常常出现突变问题, 而如今.1能够稳定地维持主体外观, 举例来说, 生成一段时长五秒的猫走路视频时, 猫的花纹、体型从第一帧直至最后一帧都保持着一致, 开发团队对注意力机制予以了优化, 以此保证主体特征在多帧之间不会丢失, 这对于那些需要人物或者产品持续出镜的创作场景而言格外实用。

指令理解更准确
一只白色的萨摩耶于雪地里奔跑着, 其毛发有着光泽, .1能够精准地生成与之对应的画面, 并非随意地出现偏差, 阿里的工程师透露, .1运用了新的指令解析模块, 把对于复杂长句的理解正确率提升至92% , 比如同时提出要求, “人物从左边朝着右边行走, 背景是日落时分的海滩”, 模型能够分别去执行动作和场景指令, 不会再出现混淆的情况, 这使得使用门槛有所降低, 新手也能够迅速上手。
视觉质感更细腻
生成的视频画面, 在清晰度方面有进步, 在色彩饱和度方面有进步, 在光影细节方面也有进步。和1.0版本进行对比, .1的1080p视频画面, 噪点减少了, 边缘更锐利了, 像树叶的纹理、水面的反光都更真实了。阿里内部进行测试, 显示.1在视觉质量评分里, 比1.0高出了25%。对创作者而言, 这表明输出的视频能够直接用于社交媒体或者短视频平台, 还能减少后期修图的工作量。
音频同步更自然
新的模型使音频能力得到了增强, 所生成的音效跟视频画面在高度上是同步的。倘若人物处于说话状态, 那么嘴型跟语音的匹配就会更为精准, 背景当中诸如风声、脚步声等之类的环境音同样与场景相互对应。按照阿里技术文档的说明, 添加了实时音频对齐模块, 把音频延迟从原来的500毫秒压缩至100毫秒以内。这使得视频内容具备了更强的沉浸感, 适宜于制作教程视频、广告短片等那些需要音画配合的场景。
多平台接入更方便
当下, .1已全方位接入阿里云、钉钉、淘宝等多个平 台, 用户能够直接于钉钉内调用模型以生成视频, 不需要进行应用切换, 企业开发者同样能够借助API接口进行批量调用, 用以开展自动化内容生产, 阿里宣称, .1的生成速度比1.0快百分之四十, 单次生成五秒短视频的耗时从十五秒降低至九秒, 这对于亟需快速产出大量视频的营销团队而言, 是实实在在的效率提升。
你平常之际 难道会运用 AI 视频生成工具去开展内容创作吗 欢迎于评论区域之中 去谈论一番使用体验 要是感觉好用的情形下 那就点个赞 进而分享于更多的人呀!