Open LLM Leaderboard Open LLM Leaderboard 是 Hugging Face 提供的开放大语言模型评测排行榜,用于展示和比较各类开源 LLM 在标准基准测试中的表现。页面汇总模型分数、参数规模、许可证等信息,方便研究人员、开发者和用户了解不同模型的能力差异,辅助模型选型、实验对比与开源 AI 生态研究。 AI学习资源 # Hugging Face # LLM对比
SuperCLUE SuperCLUE 是面向中文大模型能力评测的综合基准与榜单平台,围绕中文理解、知识、推理、数学、代码、多轮对话等任务,对主流大语言模型进行系统测试与结果展示。网站提供 SuperCLUE 评测体系、模型排名、测评说明和相关研究资料,帮助研究者、开发者和企业用户了解不同模型在中文场景下的表现与差异,适合用于大模型选型参考、能力对比和中文 AI 评测信息查询。 AI学习资源 # AI研究 # 中文大模型
StableVicuna StableVicuna 是由 LMSYS Chatbot Arena 提供访问的开源对话模型相关服务入口,用户可通过在线聊天界面体验不同大语言模型的对话能力,并参与模型效果对比与评测。网站聚合了多种 AI 聊天机器人,适合用于了解开源语言模型表现、进行简单问答测试、文本生成体验及模型横向比较。 AI开发平台 # AI聊天 # Chatbot Arena