复旦AI团队在实验室里运行一个“社会”复旦大学
你是否想象过平行时空的存在?
复旦大学大数据学院副教授魏忠钰带领的Fudan DISC团队以现实为镜构建出由大模型智能体驱动的“硅基人社会”。
这个模拟世界由超千万的真实用户池支撑能够模拟社会群体活动倾听世界各地、各行各业的声音辅助政府、企业做出更科学的决策。
这就是他们研发的大模型驱动的社会模拟器——SocioVerse
从社交媒体传播模拟到服务社会决策,千万“硅基人”社会如何构建?
参与过社会实践或行业调研的人,大多经历过这样的场景:在各个群里发放问卷,请求填写,甚至附上红包。一番辛苦后,往往也只能拿到几百份结果。
而在更为广泛的社会,政府如何制定政策?公司如何优化迭代产品?投资顾问如何预测行业趋势?这些决策都离不开大规模的社会调查,过程更是费时费力。
能否建构一个由大模型智能体驱动的“硅基人”社会,面向社会调查的需求,实现有问必答、有求必应,想要多少数据就有多少数据的理想调查平台呢?DISC团队推出的社会模拟世界模型——SocioVerse,正是面向这一需求而生。
魏忠钰在国际会议上介绍Socioverse
Fudan DISC团队共同参加国际会议
成立于2016年的DISC团队,并不是第一个想到用大模型来进行社会模拟的课题组。斯坦福大学、加州大学和清华大学等高校早已有学者开展过相关研究。然而,构建一个真正可信的“模拟社会”,始终面临着一个核心挑战:如何让虚拟与现实对齐?
DISC团队的答案,便是SocioVerse的核心理念:通过社会环境引擎、用户引擎、场景引擎和行为引擎,使得模拟社会始终跟随着真实世界动态更新。
其中,社会环境引擎负责实时向模拟社会注入现实里的最新资讯(例如新规出台、油价调整等);用户引擎则提供真实世界人群画像,提供个体模拟的种子信息;场景引擎将现实社会互动抽象为标准化的模板,如问卷调查、深度访谈、社交媒体互动等;行为引擎是框架的大脑,负责综合信息,驱动智能体行动。
在社会模拟器的搭建过程中团队遇到了很多的技术攻关难题,其中核心的两个挑战在于,如何设计好的行为引擎,降低大规模个体模拟的推理成本?如何搭建用户引擎,达成规模化的高精度个体模拟?
团队在社会模拟方面的两项研究基础为此铺平了道路。早在2024年初,DISC 团队便提出了使用LLM和ABM进行混合智能体搭建,降低模拟成本的思路。他们将目标群体分成核心用户和普通用户,采用“LLM→核心用户、ABM→普通用户”的分层驱动机制设计行为引擎,并推出了国内首个开源的社交媒体仿真平台HiSim。该平台复现了X社交平台的互动环境与消息机制,支持公共与私域双通道信息传递、真实时间推动与离线事件触发,实现对用户互动、态度演化与群体行为扩散的动态仿真。
2024年底的DISC Open Day开放日交流会合影
平台针对1000个真实的社交媒体用户搭建孪生智能体,并进行了为期14天的行为预测,在三个真实事件构成的数据集上验证模拟表现,实验结果表明,模拟平台在用户行为一致性、情绪态度变化趋势等多项指标上,与真实行为数据高度吻合。研究成果在自然语言处理领域的顶级会议ACL 2024发表。
用户引擎中的种子用户建构是整个框架与现实人群对齐的核心驱动力,设计基础来自于团队开发的用于政治选情预测的ElectionSim框架。在该工作中,他们便开始了百万规模人口池的设计。


