🔥 毒舌 GitHub
← 返回论文榜
GenExam: A Multidisciplinary Text-to-Image Exam
Zhaokai Wang, Penghao Yin, Xiangyu Zhao, Changyao Tian et al.
54.40/100
🫥 平庸
增量有限 · 存在感薄弱
内容分 54.4 · 引用加成 +0.0 · 12 次引用

💡 GenExam是首个多学科文生图考试基准,包含10学科1000样本与四级分类考试提示,通过细粒度评分点评估模型语义正确性与视觉合理性,揭示开源与闭源模型的显著能力差距

#文生图评估#考试型基准#多学科评测#开源闭源差距#text-to-image evaluation#exam-style benchmark#multidisciplinary assess#open-closed source gap

维度评分

创新性6.0 / 10
严谨性6.0 / 10
意义7.0 / 10
清晰度8.0 / 10
可复现性8.0 / 10

这个语气还没生成 —— 去重新评测一次 即可生成。