🔥 毒舌 GitHub
← 返回论文榜
MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization
Xiangyu Zhao, Junming Lin, Tianhao Liang, Yifan Zhou et al.
49.44/100
🫥 平庸
增量有限 · 存在感薄弱
内容分 48.0 · 引用加成 +1.4 · 3 次引用

💡 本文针对多模态大模型长链反思推理能力缺失的痛点,提出合成基准MM-HELIX与混合训练策略AHPO,验证了反思推理的可学习性与泛化潜力。

#多模态大模型#长链反思推理#合成基准#AHPO优化#推理能力补全#Multimodal LLMs#Reflective Reasoning#Synthetic Benchmark#Policy Optimization#Reasoning Gap Filling

维度评分

创新性5.0 / 10
严谨性5.0 / 10
意义7.0 / 10
清晰度8.0 / 10
可复现性6.0 / 10

这个语气还没生成 —— 去重新评测一次 即可生成。