CoTJudger: A Graph-Driven Framework for Automatic Evaluation of Chain-of-Thought Efficiency and Redundancy in LRMs
Siyi Li, Jiajun Shi, Shiwen Ni, Ge Zhang et al.
47.60/100
🫥 平庸
增量有限 · 存在感薄弱
内容分 47.6 · 引用加成 +0.0 · 暂无引用数据
💡 CoTJudger提出图驱动的思维链评估框架,通过提取最短有效路径量化大推理模型的必要推理与结构冗余,揭示当前LRM普遍存在的过度推理问题。
#大模型评估#思维链冗余#推理效率#依赖图分析#LRM诊断#LLM Evaluation#CoT Redundancy#Reasoning Efficiency#Dependency Graph#LRM Diagnosis
维度评分
创新性6.0 / 10
严谨性5.0 / 10
意义7.0 / 10
清晰度8.0 / 10
可复现性4.0 / 10
这个语气还没生成 —— 去重新评测一次 即可生成。