模型能力评估 | Notion
GitHub - jeinlee1991/chinese-llm-benchmark: 中文大模型能力评测榜单:覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle / chatglm6b 等开源大模型,多维度能力评测。不仅提供能力评分排行榜,也提供所有模型的原始输出结果!
OpenCompass
https://github.com/jeinlee1991/chinese-llm-benchmark
Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4