阿里巴巴发布HappyHorse1.1，视频生成更流畅真实

最后更新时间：2026年6月23日 13:45 Zevo 50

智能摘要

此次升级进一步巩固了阿里巴巴在视频生成AI领域的竞争力，为开发者、创作者和企业用户提供了更强大、更易用的视频内容生成工具。

动态表现力显著提升

阿里巴巴新近发布的视频生成模型.1, 于动态表现力方面实施了大幅度升级, 相较于1.0版本, .1所生成的人物以及物体动作更为自然流畅, 不存在卡顿或者跳帧之感, 像在跑步场景当中, 人物四肢摆动愈发契合真实运动轨迹, 并非如往昔那般生硬, 依据阿里巴巴内部测试数据, .1在动态连贯性指标层面提升幅度超过30%, 用户反馈画面观感更为舒适。

主体一致性更强

从多帧视频生成的角度来看, .1在主体漂移问题的处理上有着出色表现, 以前模型在连续画面里, 人物脸型以及衣着常常出现突变问题, 而如今.1能够稳定地维持主体外观, 举例来说, 生成一段时长五秒的猫走路视频时, 猫的花纹、体型从第一帧直至最后一帧都保持着一致, 开发团队对注意力机制予以了优化, 以此保证主体特征在多帧之间不会丢失, 这对于那些需要人物或者产品持续出镜的创作场景而言格外实用。

阿里巴巴发布HappyHorse1.1，视频生成更流畅真实

指令理解更准确

一只白色的萨摩耶于雪地里奔跑着, 其毛发有着光泽, .1能够精准地生成与之对应的画面, 并非随意地出现偏差, 阿里的工程师透露, .1运用了新的指令解析模块, 把对于复杂长句的理解正确率提升至92% , 比如同时提出要求, “人物从左边朝着右边行走, 背景是日落时分的海滩”, 模型能够分别去执行动作和场景指令, 不会再出现混淆的情况, 这使得使用门槛有所降低, 新手也能够迅速上手。

视觉质感更细腻

生成的视频画面, 在清晰度方面有进步, 在色彩饱和度方面有进步, 在光影细节方面也有进步。和1.0版本进行对比, .1的1080p视频画面, 噪点减少了, 边缘更锐利了, 像树叶的纹理、水面的反光都更真实了。阿里内部进行测试, 显示.1在视觉质量评分里, 比1.0高出了25%。对创作者而言, 这表明输出的视频能够直接用于社交媒体或者短视频平台, 还能减少后期修图的工作量。

音频同步更自然

新的模型使音频能力得到了增强, 所生成的音效跟视频画面在高度上是同步的。倘若人物处于说话状态, 那么嘴型跟语音的匹配就会更为精准, 背景当中诸如风声、脚步声等之类的环境音同样与场景相互对应。按照阿里技术文档的说明, 添加了实时音频对齐模块, 把音频延迟从原来的500毫秒压缩至100毫秒以内。这使得视频内容具备了更强的沉浸感, 适宜于制作教程视频、广告短片等那些需要音画配合的场景。

多平台接入更方便

当下, .1已全方位接入阿里云、钉钉、淘宝等多个平台, 用户能够直接于钉钉内调用模型以生成视频, 不需要进行应用切换, 企业开发者同样能够借助API接口进行批量调用, 用以开展自动化内容生产, 阿里宣称, .1的生成速度比1.0快百分之四十, 单次生成五秒短视频的耗时从十五秒降低至九秒, 这对于亟需快速产出大量视频的营销团队而言, 是实实在在的效率提升。

你平常之际难道会运用 AI 视频生成工具去开展内容创作吗欢迎于评论区域之中去谈论一番使用体验要是感觉好用的情形下那就点个赞进而分享于更多的人呀！

京东开源实时视觉AI模型，能边看边说，交互更自然

四台Mac Studio跑万亿模型！LM Studio让本地AI算力不再是梦

AI写作平台Writingtools.ai升级，终结营销及创作者发布困扰

英特尔联合头部企业发布‘AI家庭大脑’，智能家居迎突破