All Of My Life.
11
22
01
Mem-α: Learning Memory Construction via Reinforcement Learning Mem-α: Learning Memory Construction via Reinforcement Learning
论文提出了Mem-α,一个用强化学习搭建的智能体记忆框架,用以解决直接使用语言模型处理工具所带来的信息丢失、效率低下等问题。传统方法过于依赖预设指令与工具,Mem-α通过交互与反馈,采用GRPO训练智能体有效管理复杂记忆系统。
2025-11-01 Cyan.
10
28
MemoryBench MemoryBench
论文旨在解决现有大模型系统在持续学习、记忆机制评估上的空白。已有bench主要关注模型对长文本的理解能力,缺乏实际反馈,无法衡量系统从长期交互中持续改进的能力。为此,论文通过“LLM-as-user”批量生成反馈日志并检验系统吸收反馈、更新记忆后的持续表现。
2025-10-28 Cyan.
25
Function Calling and MCP Function Calling and MCP
Function Calling 是让大模型具备工具调用能力的关键。通过 SFT 等 post-train 手段,我们可以让大模型遵循指令生成一个特定格式的 tools 调用文件(xml, json),并通过代码解析该文件来确定当前对话轮次要调用的 function 信息。而 MCP 对这一过程做了标准化,提供了统一的接口与服务。
2025-10-25 Cyan.
20
18
Build an Agentic RAG System Build an Agentic RAG System
Agentic RAG 相比传统的一步检索式 Native RAG 有了更卓越的表现,通过牺牲了一些推理时间来换取了更令人满意的效果。本质上就是利用 Agent 多步决策的思路,使模型在检索相关文档时能够有思考、回退、改写等等决策,而不是简单地根据相似度直接得到结果。
2025-10-18 Cyan.
16
2025年(26届)四非CS保研经验帖 2025年(26届)四非CS保研经验帖
一切尘埃落定,三年的生活交上了一个答案。于是简单记了一个经验帖,总结了一下半年来的心路历程。总之,是时候在新的起点向前继续迈进了。
2025-10-16 Cyan.
12
10
02
18
1 / 3