Item: d$^2$Cache: Accelerating Diffusion-Based LLMs via Dual Adaptive Caching
Rating: 65.97
Author: GitHub Roast

← 返回论文榜

d$^2$Cache: Accelerating Diffusion-Based LLMs via Dual Adaptive Caching

Yuchu Jiang, Yue Cai, Xiangzhong Luo, Jiale Fu et al.

65.97/100

📘 能读

合格之作 · 有可取之处

内容分 62.4 · 引用加成 +3.6 · 20 次引用

💡 针对扩散大语言模型双向注意力无法复用标准KV缓存的痛点，提出无需训练的双自适应缓存框架，通过两阶段细粒度选择token自适应更新KV并缓存其余状态，实现推理加速与生成质量双重提升。

#扩散LLM推理加速#无训练缓存优化#KV缓存创新#双向注意力适配#生成质量提升#Diffusion LLM Inference #Training-free Cache Opti#KV Cache Innovation#Bidirectional Attention #Generation Quality Impro

去评测另一篇 →

维度评分

创新性7.0 / 10

严谨性7.0 / 10

意义8.0 / 10

清晰度9.0 / 10

可复现性9.0 / 10

🌸 夸夸

🌶️ 辣评 🌸 夸夸

这个语气还没生成 —— 去重新评测一次即可生成。