ToonCrafter ToonCrafter 是一个基于扩散模型的卡通动画插帧工具,由香港中文大学和字节跳动联合开发。该项目专注于从两张静态卡通关键帧生成流畅的中间过渡动画,支持草图、线稿等多种卡通风格。系统采用预训练的图像到视频扩散模型,通过插值潜在编码实现高质量动画生成,可控制运动幅度和生成帧数。项目提供在线演示、本地部署代码和 Gradio 界面,支持研究和非商业用途。To 视频生成 # 关键帧 # 动画插帧
ConsiStory ConsiStory 是 NVIDIA Research PAR Lab 发布的文本到图像一致性生成研究项目,聚焦在扩散模型中通过共享主体特征来生成多张风格与角色保持一致的图像。该项目面向文本生成图像、角色一致性、故事板创作和多图像生成等场景,提供论文、方法介绍、示例结果及相关研究信息,适合关注生成式 AI、计算机视觉和可控图像生成技术的研究者参考。 AI学习资源 # Consistent Generation # Consistory
DeepFloyd DeepFloyd IF 是一个开源的文本到图像生成模型,由 DeepFloyd 团队开发并托管在 GitHub 上。该模型采用级联扩散架构,通过多阶段处理实现高质量图像生成。DeepFloyd IF 支持从文本描述直接生成图像,具备较强的语义理解和细节表现能力。项目提供完整的代码实现、模型权重和使用文档,方便开发者进行二次开发和研究。作为开源项目,Deep AI开发平台 # DeepFloyd # GitHub
Seaweed APT Seaweed APT 是一个聚焦超快视频生成的研究项目网站,展示面向实时、一步式与交互式生成的基础研究成果。网站内容涵盖视频生成、图像生成、对抗式方法、扩散模型与蒸馏技术等方向,旨在探索更高效的生成式 AI 模型与推理流程。适合关注实时视频生成、AI 图像生成、生成模型加速及多媒体内容创作技术的研究人员、开发者和相关从业者参考。 AI绘画 # adversarial # diffusion
Imagen【推荐试用】 Imagen 是 Google Research 推出的文本生成图像研究项目,旨在探索高质量文本到图像生成技术。该项目结合大型语言模型与扩散模型,根据自然语言描述生成视觉内容,并展示了模型在图像细节、语义理解和风格表达方面的研究成果。官网提供项目介绍、示例图像、技术说明及相关论文信息,适合关注 AI 绘画、生成式人工智能、文本生成图像和计算机视觉研究的用户参 AI学习资源 # AI绘画 # Google Research
DeepFloyd IF DeepFloyd IF 是 DeepFloyd 发布的开源文本生成图像模型,采用级联式像素级扩散架构,支持根据自然语言提示生成高质量图像,并具备较好的文字渲染与细节表现能力。该项目面向 AI 绘画、创意设计、视觉内容生成等场景,提供模型介绍、技术说明与相关资源,适合研究人员、开发者和数字创作者了解与使用。 AI绘画 # AI绘画 # 创意设计