分类

AI模型评测

横评大模型性能！收录各类评测平台。基准测试、RAG评估、代理能力对比，开发者/研究者的模型选型与优化利器！

OpenCompas...

opencompass.org.cn

OpenCompass 是一个专...

HELM

crfm.stanford.edu

HELM 是一个专为 Kuber...

MMBench

mmbench.opencompas...

MMBench 是一个专为评估多...

LLMEval3

llmeval.com

LLMEval3 是一个专为大语...

H2O EvalGP...

evalgpt.ai

H2O EvalGPT 是由 H...

紫东太初

taichu-web.ia.ac.c...

紫东太初是由中国科学院自动化研究...

百度GBI

gbi.cloud.baidu.co...

百度GBI（Global Bus...

AGI-Eval

agi-eval.cn

AGI-Eval 是一个专为评估...

书生大模型

intern-ai.org.cn

书生大模型是由上海人工智能实验室...

Gemma

ai.google.dev

Gemma 是由 Google ...

Gatekeep

gatekeep.ai

Gatekeep 是一个专注于内...

Llama 3

llama.meta.com

Llama 3 是由 Meta（...

上一页 1 2 3 下一页