返回作品列表

记忆未来模拟器

基于 LLM + RAG 的多人协作叙事模拟装置——玩家加入同一虚拟社会,集体决策,探索记忆技术的伦理边界。

类型
课程毕设 · TO C 产品(UQ DECO3801/7381,有真实客户方)
周期
2025 年 8 月 — 2025 年 10 月(约 12 周)
团队
6 人团队
成果
Distinction(6/7),团队阶段评估获 Exceeds Expectations
技术栈
React + Vite + TailwindCSS / Django + PostgreSQL / 本地 LLM + RAG + FAISS 向量数据库
我的角色
队长 Team Leader产品经理 Product Manager项目经理 Project Manager前端负责人 Frontend devUX 设计师 UX Designer

Demo 视频

项目演示视频 · 拍摄 + 剪辑:刘一开
一、

项目背景 & 目标用户(Why)

问题

真实存在的伦理真空

随着脑机接口和神经科学的发展,记忆操控技术正逐步从科幻走向现实——在未来,记忆可以被存储、编辑、交易甚至删除。然而,社会对其伦理边界缺乏深入讨论。传统教育方式多为单向传输,难以让公众深度参与思考。

机会

从「讨论」到「亲身经历」

课题导师提出了一个思辨性设计命题(Speculative Design Brief):能否用交互式的、参与式的方式,让人们不是在「讨论」记忆伦理,而是在亲身经历中感受选择的后果?

我们的方案

多人协作叙事模拟器

打造一个多人协作叙事模拟器——玩家扫码加入同一个虚拟世界,在 5 年的时间跨度里,共同面对记忆技术引发的社会事件,集体做出选择,实时看到选择对社会属性的影响。不是「看」一个故事,而是「活」在一个故事里。

目标用户

用户群体特征核心需求
大学生 / 研究生(18-30)好奇心强、数字原生代沉浸且互动性强的反思性体验
桌游爱好者 / 科幻迷(20-40)重视逻辑深度和策略性超越纯娱乐的思辨型游戏体验

使用场景

互动科技展览、高校课堂教学辅助、线下社交聚会。

二、

产品设计(What)

系统架构

系统由四个核心组件构成一个三端的结构:

前端:玩家手机端 + 大屏展示端 (React) 后端:后端(Django)运行在服务器端 AI 端:LLM + RAG 运行在服务器端

核心功能模块

01

扫码入场 & 等待匹配

  • 玩家扫描二维码进入游戏,选择角色头像
  • 后端通过 Django 管理 Session 初始化,检测到 3-5 名玩家后自动开始游戏
扫码入场界面(手机端)
扫码入场界面(手机端)
等待匹配大屏
等待匹配大屏
02

事件生成 & 集体决策(核心循环)

  • 每一轮,AI 模块基于当前世界状态 + RAG 检索的世界观语料,生成一段叙事事件和 4 个选项
  • 大屏展示事件背景和社会属性的实时数值变化
  • 手机端展示 4 张选项卡片 + 倒计时,玩家讨论后各自做出选择
  • 系统统计所有玩家选择,计算对四大社会属性的影响,驱动下一轮叙事
事件叙事大屏
事件叙事大屏
手机端选项卡片
手机端选项卡片
03

社会属性可视化

  • 四大属性:自主控制 / 记忆平等 / 技术管控 / 社会凝聚
  • 大屏通过雷达图 + 数值动态变化实时展示,配合生成式音效营造沉浸氛围
04

人格结果生成(类 MBTI)

  • 10 轮结束后,系统根据每位玩家的历史选择倾向,生成个性化人格标签
  • 例如:「记忆哨兵」(Memory Sentinel)、「自主创新者」(Autonomous Innovator)等 6 种人格
  • 玩家可以分享和讨论彼此的人格结果,进一步激发反思
05

历史时间线回顾

手机端提供可展开 / 折叠的时间线组件,回顾每一轮的事件、选择和世界状态变化。

MBTI 风格人格结果界面
MBTI 风格人格结果界面
时间线回顾组件
时间线回顾组件
06

结局生成

AI 根据 10 轮的全局数据,生成一段关于这个世界最终走向的叙事总结,在大屏上展示。

结局叙事生成大屏
结局叙事生成大屏
三、

迭代过程——从概念验证到展览交付

Sprint 1

框架搭建 → 基础功能(第 4-7 周)

目标:验证技术可行性,搭建前后端框架,实现基础交互流程。

  • 前端完成 React + Vite 框架搭建和组件库骨架,后端完成 Django API 路由与 PostgreSQL 数据库初始化
  • AI 模块完成 API 集成测试,故事库扩展至 10,000 条句子(用于 RAG 检索)
  • UI/UX 完成设计风格指南、交互草图和用户旅程地图
  • 团队定义了前后端 JSON 数据格式规范,确保各模块可以并行开发
关键技术决策:评估团队在前置课程中的技术经验后,决定从最初规划的 Sass 切换到 TailwindCSS,提升了响应式开发效率。
第 1 轮用户测试

发现核心问题

在基础功能可运行后,组织了 5 名用户的 Think-Aloud 可用性测试。这轮测试暴露了大量问题,成为后续迭代的核心驱动力:

① UI / 交互层面

  • 用户倾向于忽视手机端界面,缺乏明确的「该你选择了」的提示
  • 游戏进行中的状态提示不清楚,用户容易错过操作窗口

② 叙事内容层面(最严重)

  • 背景故事与游戏内事件缺乏连贯性——各轮之间的叙事断裂
  • 生成的选项与对应事件不相关——玩家选择后感觉「答非所问」
  • 故事内容出现重复和逻辑错误,破坏沉浸感
  • 各轮生成的内容长度不一致,体验不稳定

③ 游戏机制层面

  • 10 轮太长——用户明确建议减少至 5 轮
  • 四大社会属性的影响规则不透明——玩家不确定自己的选择如何影响世界状态
  • 整体概念偏抽象,新玩家需要较长时间理解

④ 技术层面

  • 移动端偶发加载失败,导致部分用户无法完成选择
Sprint 2

核心问题修复 → 完整集成(第 7-9 周)

  • 叙事质量提升:优化 LLM 提示词(Prompt Engineering),将「世界生成」和「问题生成」合并为单一 LLM 调用,解决了内容不一致和 JSON 输出格式错误的问题。在 28 核 CPU 上测试,响应时间显著降低
  • RAG 检索优化:完善 FAISS 向量数据库的世界观语料库,增强叙事与世界观设定的一致性,减少 LLM 幻觉
  • 多人同步完善:实现完整的多人逻辑,大屏与手机端数据实时同步
  • UI 打磨:加入动画过渡、音效设计、图标设计,增强沉浸体验
  • 交互提示强化:在手机端增加更明确的选择提示,解决用户「不知道该操作」的问题
第 2 轮用户测试

验证改进效果

组织第 2 轮 Think-Aloud 测试(5 名用户):

✅ 已解决

  • 故事生成和空白选项出错的问题
  • 叙事连贯性显著提升,选项与事件的关联性增强
  • 移动端交互提示更清晰

⏳ 仍需优化(纳入后续迭代)

  • 属性变化的可感知度仍然不够(用户仍反馈「不确定选择的影响」)
  • 大屏界面样式仍可继续增强
Sprint 3

最终优化 → 展览交付(第 9-11 周)

  • LLM 性能最终优化:合并调用模式稳定运行,确保展览现场的响应速度
  • 伦理设计完善:参考 CMU《设计伦理 AI 体验检查清单》进行自评,在界面中融入伦理反思引导
  • 展览准备:完善电梯演讲脚本,制作演示视频和用户指南,进行最终排练
  • 大屏可视化打磨:雷达图动态效果、数值变化动画的最终调整
四、

我的工作(How)

项目管理

Project Manager

作为 6 人团队的 PM,我负责项目从立项到交付的全流程管理:

  • Sprint 规划与进度追踪:使用 Jira 管理 3 个 Sprint 周期,每周六线下例会 + 每日 Slack 异步 Stand-up
  • Tutor 沟通主要对接人:作为团队与课程导师之间的核心沟通桥梁
  • 关键技术决策推动:评估团队技能后决定从 Sass 切换到 TailwindCSS,提高了开发效率
  • 团队协作工具迭代:初期推动 Jira,后调整为 Jira + Slack 双轨制,并在反思中认识到应更快适应团队实际节奏
  • 角色分配与协调:根据成员技能矩阵分配前后端和 AI 模块的开发任务
产品设计

Product & UX Designer

  • 需求分析与产品定义:基于课题 Brief,主导产品方向的定义——从「静态教育工具」转向「多人协作叙事模拟器」
  • 用户调研:研究现有方案(澳洲 National Science Week、QBI 课程、OECD 神经伦理指南等),发现市场缺乏「让用户亲身做出选择并看到后果」的互动式产品
  • 交互流程设计:设计了 Entry → Decision → Feedback → Cycle → Conclusion 的五阶段用户体验流程
  • 用户测试主导:组织了 2 轮可用性测试(Think-Aloud Protocol),各 5 名用户参与
前端开发

Frontend Dev

  • 基于 React + Vite + TailwindCSS 构建前端项目
  • 负责开场界面、游戏结局界面、宣传视频页面的设计与开发
  • 参与雷达图、数值动态变化的前端展示实现
  • 项目后期负责全前端的 Debug 和交互体验优化
  • 拍摄并剪辑了项目宣传视频
五、

展览与效果

展览数据

项目于 2025 年 10 月在 UQ 校内展览中进行了全天公开展示:

指标数据
展览时长全天(8:30 - 20:30,约 10 小时有效展示时间)
单次体验时长约 20 分钟 / 轮
每轮参与人数3-5 人
预估总体验人次80-120 人次

展览方式

  • 我作为主讲人向来访者介绍项目背景和玩法
  • 组员轮换介绍,我同时担任 NPC 角色参与游戏,引导用户完成体验
  • 通过实际参与的方式让访客快速上手,降低理解门槛

用户反馈

  • 大多数体验者给出正向评价,认为概念新颖、体验「很酷」
  • 类 MBTI 人格结果是最受欢迎的设计——用户对自己的人格标签非常感兴趣,主动与其他玩家分享讨论
  • 部分用户反馈希望选项对世界属性的影响更加可感知

导师 / 评委评价

Part A provides a clear and structured overview of the product's functions and design, with relatively clear visualisation and evaluation.

产品文档评分(Distinction)

The implementation is relatively robust and innovative, connecting multiple systems into a complete, locally runnable AI-driven interactive experience. It effectively delivers the intended Narrative-Driven Interaction and Generative Scenario Engine.

代码实现评分(Distinction)

Overall progress is strong; core features are mostly done. Team roles are clear, and members understand each other's work and progress.

团队评估(Exceeds Expectations)

As project manager, knows what self and other members are doing.

个人 PM 评价
UQ 校内展览全天公开展出现场
UQ 校内展览全天公开展出现场
六、

技术亮点

技术点实现方式解决的问题
本地 LLM 叙事生成Qwen2.5:14B-Instruct + Ollama 本地部署避免依赖云端 API,保证展览现场的稳定性和隐私合规
RAG 知识检索FAISS 向量数据库 + BGE-M3 Embedding + 自建世界观语料库保持叙事一致性,减少 LLM 幻觉,让设计师可通过语料库控制叙事方向
多人实时同步Django 后端 + WebSocket支持 3-5 名玩家同时在线决策,实时同步游戏状态
双端交互大屏(数据可视化 + 叙事)+ 手机端(选择 + 历史回顾)创造「共同注视大屏 + 各自手机操作」的社交体验
七、

反思与收获

做得好的地方

  • 产品概念到落地的完整闭环:从思辨性设计 Brief 到可体验的多人交互产品,3 个月内完成从 0 到 1
  • 跨职能协作:作为 PM 同时参与产品设计和前端开发,能在需求、设计、实现之间快速沟通和决策
  • 用户测试驱动迭代:2 轮用户测试的反馈直接推动了产品关键改进

可以改进的地方

  • 展览表达:展览环节获得 Credit 而非 Distinction,导师反馈指出团队 presentation 时「缺乏对产品目的和功能的清晰上下文」,成员间有时互相打断。这让我认识到产品 demo 的「讲」和「做」同样重要
  • PM 工具的推行:初期推动 Jira 使用时遇到阻力,应更早识别团队的实际协作习惯并做出适应性调整
  • 选择反馈的可感知度:用户测试中多次反馈「不确定自己的选择造成了什么影响」,这是产品核心体验的薄弱环节

对我的成长

这个项目让我第一次真正体验了从 0 到 1 带领团队交付产品的全过程。作为 PM,最大的学习是:好的项目管理不是让团队按你的方式工作,而是找到团队自然的节奏并在其中建立结构。这也是我决定走产品经理方向的重要转折点——我发现自己最享受的不是写代码本身,而是「发现一个真实的问题,设计一个方案,带着团队把它做出来」的整个过程。
返回所有作品