Agentopia: Long-Term Life Simulation and Learning in Agent Societies
Xintao Wang, Sirui Zheng, Hongqiu Wu, Weiyuan Li et al.
46.40/100
🫥 平庸
增量有限 · 存在感薄弱
内容分 46.4 · 引用加成 +0.0 · 暂无引用数据
💡 该文提出Agentopia框架实现100个LLM agent的10年长期社会模拟,通过模拟产生的life reward做拒绝采样训练LLM,验证了 emergent 社会行为与下游任务泛化效果
#LLM社会模拟#长期agent交互#社会智能训练#模拟奖励对齐#emergent 行为研#LLM Society Simulation#Long-term Agent Interact#Social Intelligence Trai#Simulated Reward Alignme#Emergent Behavior Resear
维度评分
创新性6.0 / 10
严谨性5.0 / 10
意义7.0 / 10
清晰度8.0 / 10
可复现性3.0 / 10
这个语气还没生成 —— 去重新评测一次 即可生成。