GAIA:GAIA是评估下一代增强型LLM的基准,含450+非 trivial问题,分3个难度层次,提供公共验证集和私有测试集,需同意不共享数据以防止污染。【此简介由AI生成】 - AtomGit AI社区