学习资料

本地 LLMs

评估

Agents

构建高效代理 —— Anthropic

排行榜

语言模型

LMSYS Chatbot Arena
SEAL 排行榜
模型比较（质量、速度、价格等）
幻觉检测： Vectara、Hallucinations
代码生成： BigCode
工具/函数： Gorilla、Nexus、Toolbench
性能（延迟、吞吐量、内存等）
企业场景

向量嵌入模型

MTEB

更多排行榜

HuggingFace Spaces 上的所有排行榜