LLMEval3 LLMEval3 是面向大语言模型评测研究的网站,聚焦构建全面、公平、稳健的 LLM evaluation 框架。平台围绕语言模型、NLP 与 AI 基准测试方法,提供相关研究系列与评估思路,适合关注大模型 benchmark、模型能力评估和评测体系建设的研究人员、开发者及从业者参考。 AI学习资源 # AI # AI研究
百灵大模型 百灵大模型(Ant Ling)是蚂蚁集团推出的通用人工智能基础模型系列,作为其 AGI 计划的核心组成部分。该模型致力于提供前沿的大语言模型能力,支持自然语言理解、对话交互、内容生成等多种 AI 应用场景。百灵大模型秉持开放共享理念,通过持续技术迭代推动通用人工智能的稳健发展与实际落地。用户可通过官方平台体验百灵大模型的智能对话功能,适用于企业服务、知识问答 AI开发平台 # AGI # Ant Ling
Humanloop Humanloop 是一个面向大语言模型应用开发的 AI 工具平台,提供提示词管理、模型评估、实验追踪与 LLM 可观测性等功能,帮助团队构建、测试和优化基于 AI 的产品。其能力覆盖 Prompt 版本管理、效果评估、反馈收集与部署流程管理,适用于希望提升 LLM 应用质量、安全性和迭代效率的开发者与企业团队。Humanloop 已加入 Anthropic AI开发平台 # AI # AI Evaluation
盘古大模型 盘古大模型是华为云面向行业场景推出的 AI 大模型产品体系,以“AI for industries”为理念,涵盖 NLP 大模型、CV 大模型、多模态大模型、预测大模型和科学计算大模型等方向。平台可用于自然语言处理、计算机视觉、AIGC、多模态理解、预测决策和科研计算等应用,帮助政企及行业客户构建智能化解决方案。 AI开发平台 # AIGC # CV大模型