VideoRoPE: What Makes for Good Video Rotary Position Embedding?
Xilin Wei, Xiaoran Liu, Yuhang Zang, Xiaoyi Dong et al.
63.20/100
🫥 平庸
增量有限 · 存在感薄弱
内容分 63.2 · 引用加成 +0.0 · 暂无引用数据
💡 本文系统梳理视频RoPE适配核心特性,提出3D结构的VideoRoPE,在多类视频理解任务上验证有效性
#视频位置编码#RoPE适配#长视频理解#3D位置编码#视频鲁棒性#video positional encodin#RoPE adaptation#long-video understanding#3D positional embedding#video robustness
维度评分
创新性7.0 / 10
严谨性8.0 / 10
意义8.0 / 10
清晰度9.0 / 10
可复现性8.0 / 10
这个语气还没生成 —— 去重新评测一次 即可生成。