把记忆做成 AI 基础设施:MemOS 的架构设计与平台化实践

课程 ID: 19171

描述:
话题概述: 随着大模型应用从“能回答问题”走向“能持续协作”,系统瓶颈正在从单纯的模型能力,转向记忆如何被生产、组织、召回、更新和治理。越来越多团队发现,仅靠更长上下文、Prompt 拼接或传统 RAG,仍然难以解决跨会话记忆丢失、知识更新成本高、个性化状态难持续、多人多 Agent 之间记忆难共享又难隔离等问题。MemOS 的核心思路,是把“记忆”从外挂能力升级为 AI 系统中的一等资源:统一管理明文记忆、激活记忆与参数记忆,并以 MemCube 作为核心容器,通过 MemReader、MemScheduler、MemChat、MemFeedback 等模块,形成“写入—组织—召回—纠错—演化”的完整闭环。 本次分享会重点展开 MemOS 本身,而不是泛泛讨论 Agent 热点。我们会从“面向 AI 的基础设施”视角,讲清楚 MemOS 的核心抽象、分层架构、存储与调度机制;同时结合 API / Handler 体系、多 cube 读写隔离、反馈修正与平台化接入方式,讨论如何把分散在 Prompt、向量库和业务代码里的“记忆逻辑”,沉淀成可复用、可治理、可扩展的基础设施能力。听众可以借此建立一套区别于“RAG + Prompt 拼装”的系统化记忆工程方法,用于个性化助手、跨会话任务连续性、团队知识沉淀和知识问答等场景。 演讲题纲: 1. 一、为什么 AI 应用需要“记忆平台”,而不只是“更长上下文” 长上下文、Prompt 拼接、传统 RAG 分别能解决什么问题。 为什么这些方案依然难以支撑跨会话、跨任务、跨角色的长期记忆。 记忆问题为什么本质上是一个“数据生产 + 数据组织 + 数据服务 + 数据治理”的平台问题。 二、MemOS 的核心抽象:把记忆变成一等系统资源 MemOS 的基本定位:从“外挂式记忆”走向“系统级记忆管理”。 三类记忆的统一视角:明文记忆、激活记忆、参数记忆。 MemCube 的设计思想:如何把用户、Agent、会话、任务等记忆空间组织成可管理的容器。 从单一 memory store 到多 cube 视图:记忆的隔离、组合与复用。 三、写入链路:记忆是怎样被生产出来的 MemReader 如何把聊天、文档、图像等输入解析成可写入的 memory item。 AddHandler 如何承接外部写入请求。 MemScheduler 如何把写入、建索引、记忆整理等耗时操作异步化。 生产环境里“什么该写、什么不该写”的工程判断:如何避免脏记忆、噪声记忆和错误归因。 四、服务链路:记忆如何被召回、增强与纠错 SearchHandler 与语义召回:从“搜文本”到“搜可用记忆”。 MemChat 的闭环:retrieve → generate → write。 MemFeedback 如何把自然语言反馈转成安全更新,形成可修正的记忆系统。 多 cube 读写范围控制:面向用户记忆、公共记忆、团队记忆的服务边界设计。 五、不同记忆模块的工程选型与取舍 GeneralTextMemory:适合会话型助手、FAQ、轻量知识场景。 TreeTextMemory:适合层次化知识管理、研究型助手、多跳推理场景。 KVCacheMemory:适合稳定背景知识复用、低延迟、多轮交互场景。 选型维度:召回质量、更新成本、推理延迟、数据组织复杂度、运维复杂度。 六、把 MemOS 做成“平台能力”的落地经验 如何通过 API / Handler 体系,把记忆能力从业务代码中抽离出来。 如何与向量库、图数据库、模型后端解耦,形成可扩展架构。 如何支撑个性化助手、跨会话任务连续性、团队知识沉淀、知识问答等典型场景。我们对未来 AI 记忆基础设施演进方向的判断:从“记忆能不能用”,走向“记忆是否可治理、可迁移、可演化”。 话题亮点: 1. 不把“记忆”简化成向量检索,而是系统性展开明文记忆、激活记忆与参数记忆的统一框架,帮助听众建立完整的 AI 记忆分层认知。 2. 以 MemCube 为核心单元,完整拆解从输入解析、异步写入、检索增强到反馈纠错的工程闭环,而不是只讲一个检索接口。 3. 会具体讲到激活记忆,参数记忆,明文记忆的调度机制,以及稳定背景知识如何通过激活记忆复用来减少重复编码、优化低延迟场景