阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

为什么阿里要开源这个端侧AI引擎

你手机里头的淘宝、优酷、钉钉, 每日进行图相识别、语音转文字操作, 背后依凭的皆是同一引擎。此引擎便是阿里巴巴予以开源的MNN推理引擎。在2022年的时候, MNN团队所撰写的论文登上了顶级会议OSDI, 这证实了其在技术方面具备过硬的实力。当下, 它已对Qwen3.5、DeepSeek-R1等50多种大模型予以支持, 你能够在手机上实现这些AI的离线运行, 无需连接网络, 隐私安全得以保障。

性能对比：MNN比同类框架强在哪

海量业务场景的实战打磨

市面上存在ncnn、ONNX Runtime这样等同类型框架, 而是却, MNN具备的最大优势在于, 经由阿里集团进行真真切切实实在在受过考验。从淘宝拍立淘开始, 而后达到天猫商品识别, 从优酷视频理解起步, 进而直至钉钉语音转文字那处, MNN作为的竟是30多款App的底座引擎, 覆盖范围达到了70多种的业务场景。像这样的日均千亿次调用从而所经历得到的历练, 致使MNN的稳定性以及性能远远超过通过只在实验室里产出的产物。

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

轻量通用与高性能的平衡

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

MNN秉持“轻量、通用、高性能、易用”这四大原则, 其核心so体积仅仅只有800KB而已, 然而却能支持诸如CNN、RNN、GAN、Transformer等几乎尽数所有的网络结构, 不管你所使用的是那种高通骁龙芯片, 又或是苹果A系列芯片, 要不然就是联发科芯片, MNN都能够依靠OpenCL、Metal、Vulkan这三平台算子, 从而让推理速度得以达成最为最优的状态, 在骁龙8 Gen 3之上, 端侧LLM推理速度超过了15 token/s。

# macOS 一键安装（推荐新手）
brew install/MNN/tap/mnn

# 源码编译（Linux/macOS）
git clone https://github.com/alibaba/MNN.git
cd MNN
mkdir build && cd build
cmake .. -DMNN_BUILD_CONVERTER=true
make -j8

# Python 包（快速验证）
pip install MNN

快速上手：5分钟跑通你的第一个模型

from MNN.tools import mnnconvert

# 命令行转换
mnnconvert -f TF --modelFile model.pb 
           --MNNModel model.mnn 
           --bizCode MNNTest

import MNN
import numpy as np

# 加载 MNN 模型
interpreter = MNN.Interpreter("model.mnn")
session = interpreter.createSession()
input_tensor = interpreter.getSessionInput(session)

# 准备输入数据
input_data = np.random.randn(1, 3, 224, 224).astype(np.float32)
input_tensor.copyFrom(MNN.Tensor((1, 3, 224, 224), MNN.Halide_Type_Float(), 
                                  input_data, MNN.Tensor_DimensionType_Caffe))

# 推理
interpreter.runSession(session)
output_tensor = interpreter.getSessionOutput(session)
result = np.array(output_tensor.getData())
print("推理结果 shape:", result.shape)

环境准备与安装

from transformers import MnnLlm
# 加载 Qwen3.5 量化模型（仅需约 1.2GB 内存）
llm = MnnLlm(
    model_path="./Qwen3.5-1.8B-Chat-MNN",
    max_new_tokens=512,
    backend="opencl"  # 移动端用 OpenCL，PC 用 Metal/Vulkan/CUDA
)
# 多模态对话
response = llm.chat(
    messages=[{"role": "user", "content": "用一段话介绍端侧 AI 的未来"}],
    image_path="./test.jpg"  # 可选图像输入
)
print(response)

仅需一行命令, 你便能完成MNN的安装。它支持源码编译与包管理器这两种方式, 不管你所使用的是Linux, 亦或是macOS, 又或者是Windows, 尽皆能够迅速搭建。MNN还给出预编译的二进制包, 只需直接下载便可以进行使用, 从而省去复杂的配置过程。

模型转换与推理

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

MNN对TensorFlow、Caffe、ONNX、PyTorch等主流模型格式予以支持, 可以借助MNN-Convert工具, 将训练好的模型通过一键转换成为MNN格式、最新的3.6.0版本里, 该工具已经内藏了对Qwen3.5、DeepSeek-R1、Stable Diffusion 3.5等50多种模型的支持, 一切新模型均可实现无缝接入。

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

五大落地场景：从手机到IoT全搞定

手机本地大模型对话

在手机上, 你能够安装由MNN团队所维护的Android, 另一个则是iOS App, 其具备原生之特性, 对Qwen3.5、DeepSeek-R1等50多种大模型予以支持, 所有的推理完全是在端侧达成的, 即无需进行联网操作, 就拿有着1.8B参数的模型来说, 仅仅需要1.2GB的内存, 在经过Q4量化以后, 所需内存更为节省, 当处于苹果A17 Pro之上时, 推理速度能够达到15+ token/s, 从而实现流畅对话, 毫无压力可言。

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

本地图像生成与创作

Stable Diffusion 3.5 支持在 3.6.0 中于 MNN – Image 模块被新增, 结合阿里自研的 Sana 模型, 你能够在手机上生成 1024 乘 1024 的高清图像, 专为移动 GPU 优化的算子, 使得在 iPhone 15 Pro 上生成一张图仅需 8 至 12 秒, 这个功能特别契合离线设计辅助以及儿童绘画 App 等场景。

电商搜索与内容理解

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

淘宝拍立淘的底座引擎是MNN, 天猫商品识别的底座引擎是MNN, 优酷视频封面的底座引擎也是MNN。模型经过一定处理后即量化压缩, 其核心so仅仅只有800KB, 即便在低端的Android 4.3设备上面, 它依旧能够实现流畅运行。淘宝拍照识别产生的延迟是低于200ms的, 这能使你通过拍一拍就可以搜索到同款商品。短视频内容理解这一场景离不开它, 直播互动营销这一场景同样依赖于它。

端侧多模态数字人对话

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

在 2025 年 6 月, 被发布的是 MNN – 3D 模块, 它会使 LLM、语音识别、语音合成、面部动画、神经辐射场这是五大模型全部在端侧运行, 你能够达成离线 3D 数字人对话, 并且端到端延迟是会低于 1.5 秒的, 而且它还对语音克隆予以支持, 智能客服、虚拟陪伴、视障辅助等这类场景, 均可运用这个能力。

DeepSeek等推理模型端侧运行

率先在2025年2月得以实现DeepSeek – R1 1.5B端侧部署的是MNN团队, 仅需1GB内存的便是1.5B模型, 而3B模型所需内存为2GB, 在iPhone 14上面, DeepSeek – R1 1.5B的推理速度超过了25 token/s, 这意味着你能够并且无需担心数据泄露地在本地运行思维链推理、离线代码助手。

阿里开源端侧AI推理引擎MNN，已在30+App验证，支持Qwen等主流模型

许可证与社区：免费商用还顶会背书

MNN所采用的是Apache 2.0协议，此协议规定其能完全免费地被应用于商业及非商业用途。它作为出自阿里巴巴达摩院所开源的项目, 有着OSDI 2022顶会论文给予的学术背书, 并且展现出15.5K+ GitHub Stars这样的社区活跃度。经过30多款App的实战验证, 达成日均千亿次调用的情况, 这使得MNN成为国内最为成熟的端侧AI推理引擎。

未来展望与选择建议

假若是你正寻觅着端侧AI推理引擎，那MNN便是首选之选, 它历经了阿里核心业务的真切磨砺, 性能稳固且可靠, 3.6.0版本对于Qwen3.5、DeepSeek-R1、SD 3.5等前沿模型有着全栈式支持, 这进一步夯实了它于LLM端侧化浪潮里的领先地位, 数据截止到2026年6月18日, 最新消息请以官网作为标准。

试问, 在你看来, MNN之于ncnn, 哪一个对于你的项目更适配? 欢迎于评论区之中, 分享起你的使用感受及历程, 点赞连带转发, 以使更多的人明晓这一精良工具。

为什么阿里要开源这个端侧AI引擎

性能对比：MNN比同类框架强在哪

海量业务场景的实战打磨

轻量通用与高性能的平衡

快速上手：5分钟跑通你的第一个模型

环境准备与安装

模型转换与推理

五大落地场景：从手机到IoT全搞定

手机本地大模型对话

本地图像生成与创作

电商搜索与内容理解

端侧多模态数字人对话

DeepSeek等推理模型端侧运行

许可证与社区：免费商用还顶会背书

未来展望与选择建议

万亿参数大模型在Mac集群上运行，开发者如何安全远程访问？

马斯克AI接入Office，Word/Excel/PPT用对话就能干活

斯坦福报告：80位美国背景研究员回国，成DeepSeek核心力量

游戏公司裁撤AI研究团队，普通玩家需要担心吗？