Hugging Face推出的開源大模型排行榜單
大規模多任務語言理解基準
中文通用大模型綜合性測評基準
H2O.ai推出的基于Elo評級方法的大模型評估系統
生物醫學研究問答數據集和模型得分排行榜
智源研究院推出的FlagEval(天秤)大模型評測平臺
由復旦大學NLP實驗室推出的大模型評測基準
一個全面的中文基礎模型評估套件
一個綜合性的大模型中文評估基準
上海人工智能實驗室推出的大模型開放評測體系
斯坦福大學推出的大模型評測體系
全方位的多模態大模型能力評測體系
以眾包方式進行匿名隨機對戰的LLM基準平臺
AI工具箱導航 關于我們 免責聲明