Knowledge Index of Noah's Ark
Sheng Jin, Minghao Liu, Yunze Xiao, Zeqi Zhou et al.
54.40/100
🫥 平庸
增量有限 · 存在感薄弱
内容分 54.4 · 引用加成 +0.0 · 暂无引用数据
💡 本文提出细粒度学科知识基准KINA,通过覆盖度贪心近似保证学科代表性、证明tournament激励优于扁平标注付费,评估42个模型揭示现有LLM知识能力仍有较大提升空间
#LLM知识评估#细粒度基准#标注激励机制#理论保证#排序稳定性#LLM Knowledge Evaluation#Fine-grained Benchmark#Annotation Incentive#Theoretical Guarantee#Ranking Stability
维度评分
创新性7.0 / 10
严谨性6.0 / 10
意义8.0 / 10
清晰度9.0 / 10
可复现性4.0 / 10
这个语气还没生成 —— 去重新评测一次 即可生成。