模型评测

奈导航为您奉上2026年最新的模型评测在线工具与精品资源指南。本标签页已聚合3款模型评测相关的高品质应用，涵盖等业内极具代表性的站点。全部链接均经过实测，一键点击直达，帮您快速找到最趁手的AI神器。

收录了 3 个网站

排序

发布更新浏览

Open LLM Leaderboard Open LLM Leaderboard 是 Hugging Face 提供的开放大语言模型评测排行榜，用于展示和比较各类开源 LLM 在标准基准测试中的表现。页面汇总模型分数、参数规模、许可证等信息，方便研究人员、开发者和用户了解不同模型的能力差异，辅助模型选型、实验对比与开源 AI 生态研究。

AI学习资源 # Hugging Face # LLM对比

SuperCLUE SuperCLUE 是面向中文大模型能力评测的综合基准与榜单平台，围绕中文理解、知识、推理、数学、代码、多轮对话等任务，对主流大语言模型进行系统测试与结果展示。网站提供 SuperCLUE 评测体系、模型排名、测评说明和相关研究资料，帮助研究者、开发者和企业用户了解不同模型在中文场景下的表现与差异，适合用于大模型选型参考、能力对比和中文 AI 评测信息查询。

AI学习资源 # AI研究 # 中文大模型

StableVicuna StableVicuna 是由 LMSYS Chatbot Arena 提供访问的开源对话模型相关服务入口，用户可通过在线聊天界面体验不同大语言模型的对话能力，并参与模型效果对比与评测。网站聚合了多种 AI 聊天机器人，适合用于了解开源语言模型表现、进行简单问答测试、文本生成体验及模型横向比较。

AI开发平台 # AI聊天 # Chatbot Arena