课程 ID: 19171
描述:
话题概述:
随着大模型应用从“能回答问题”走向“能持续协作”,系统瓶颈正在从单纯的模型能力,转向记忆如何被生产、组织、召回、更新和治理。越来越多团队发现,仅靠更长上下文、Prompt 拼接或传统 RAG,仍然难以解决跨会话记忆丢失、知识更新成本高、个性化状态难持续、多人多 Agent 之间记忆难共享又难隔离等问题。MemOS 的核心思路,是把“记忆”从外挂能力升级为 AI 系统中的一等资源:统一管理明文记忆、激活记忆与参数记忆,并以 MemCube 作为核心容器,通过 MemReader、MemScheduler、MemChat、MemFeedback 等模块,形成“写入—组织—召回—纠错—演化”的完整闭环。
本次分享会重点展开 MemOS 本身,而不是泛泛讨论 Agent 热点。我们会从“面向 AI 的基础设施”视角,讲清楚 MemOS 的核心抽象、分层架构、存储与调度机制;同时结合 API / Handler 体系、多 cube 读写隔离、反馈修正与平台化接入方式,讨论如何把分散在 Prompt、向量库和业务代码里的“记忆逻辑”,沉淀成可复用、可治理、可扩展的基础设施能力。听众可以借此建立一套区别于“RAG + Prompt 拼装”的系统化记忆工程方法,用于个性化助手、跨会话任务连续性、团队知识沉淀和知识问答等场景。
演讲题纲:
1. 一、为什么 AI 应用需要“记忆平台”,而不只是“更长上下文”
长上下文、Prompt 拼接、传统 RAG 分别能解决什么问题。
为什么这些方案依然难以支撑跨会话、跨任务、跨角色的长期记忆。
记忆问题为什么本质上是一个“数据生产 + 数据组织 + 数据服务 + 数据治理”的平台问题。
二、MemOS 的核心抽象:把记忆变成一等系统资源
MemOS 的基本定位:从“外挂式记忆”走向“系统级记忆管理”。
三类记忆的统一视角:明文记忆、激活记忆、参数记忆。
MemCube 的设计思想:如何把用户、Agent、会话、任务等记忆空间组织成可管理的容器。
从单一 memory store 到多 cube 视图:记忆的隔离、组合与复用。
三、写入链路:记忆是怎样被生产出来的
MemReader 如何把聊天、文档、图像等输入解析成可写入的 memory item。
AddHandler 如何承接外部写入请求。
MemScheduler 如何把写入、建索引、记忆整理等耗时操作异步化。
生产环境里“什么该写、什么不该写”的工程判断:如何避免脏记忆、噪声记忆和错误归因。
四、服务链路:记忆如何被召回、增强与纠错
SearchHandler 与语义召回:从“搜文本”到“搜可用记忆”。
MemChat 的闭环:retrieve → generate → write。
MemFeedback 如何把自然语言反馈转成安全更新,形成可修正的记忆系统。
多 cube 读写范围控制:面向用户记忆、公共记忆、团队记忆的服务边界设计。
五、不同记忆模块的工程选型与取舍
GeneralTextMemory:适合会话型助手、FAQ、轻量知识场景。
TreeTextMemory:适合层次化知识管理、研究型助手、多跳推理场景。
KVCacheMemory:适合稳定背景知识复用、低延迟、多轮交互场景。
选型维度:召回质量、更新成本、推理延迟、数据组织复杂度、运维复杂度。
六、把 MemOS 做成“平台能力”的落地经验
如何通过 API / Handler 体系,把记忆能力从业务代码中抽离出来。
如何与向量库、图数据库、模型后端解耦,形成可扩展架构。
如何支撑个性化助手、跨会话任务连续性、团队知识沉淀、知识问答等典型场景。我们对未来 AI 记忆基础设施演进方向的判断:从“记忆能不能用”,走向“记忆是否可治理、可迁移、可演化”。
话题亮点:
1. 不把“记忆”简化成向量检索,而是系统性展开明文记忆、激活记忆与参数记忆的统一框架,帮助听众建立完整的 AI 记忆分层认知。
2. 以 MemCube 为核心单元,完整拆解从输入解析、异步写入、检索增强到反馈纠错的工程闭环,而不是只讲一个检索接口。
3. 会具体讲到激活记忆,参数记忆,明文记忆的调度机制,以及稳定背景知识如何通过激活记忆复用来减少重复编码、优化低延迟场景