项目介绍
SuperAgent 是一个 企业级 的 AI 智能体对话平台,覆盖了智能对话、文档知识问答、联网搜索、RAG 详细检索、MCP 工具协议、Skills 能力扩展、文档全生命周期管理等完整能力。
真正的 RAG 系统要考虑的问题多得多:文档怎么切分效果最好?检索召回率不够怎么办?多路召回怎么融合排序?幻觉怎么控制?这些才是面试官会追问的点。跑通 Demo 和做出能上线的系统之间,差的不是代码量,是对每个环节的深入理解。
RAG 不只是 "检索 + 生成" 两步走
Retrieval-Augmented Generation 这个名字容易让人觉得就是检索加生成。但实际工程中,一个能用的 RAG 系统至少涉及这些环节:
- 数据处理 :PDF、Word、PPT,格式五花八门,光是解析成干净文本就是一堆脏活
- 分块策略 :切太大检索不精准,切太小上下文丢失。不同文档可能需要不同策略
- 问题改写 :用户问"那它怎么配置?",不补上下文系统根本不知道在问啥
- 检索策略 :纯向量检索对精确匹配很弱,用户问一个订单号,向量检索可能完全找不到。混合检索怎么融合、要不要重排序,都是取舍
- 会话记忆 :20 轮对话全塞给模型?Token 成本扛不住。只带最近几轮?可能丢关键上下文
RAG 项目的核心竞争力不在于你用了多强的模型,而在于工程化能力。同样的模型,检索策略不同、Prompt 设计不同、分块粒度不同,最终效果可以天差地别。
举个例子:用户问 "打印机墨盒怎么换" ,文档里写的是 "墨盒更换步骤" 。关键词搜索直接匹配不上,但向量检索能理解它们是一回事。这背后是 Embedding 模型的选型、向量数据库的调优、检索结果的重排序——每一步都是工程决策 ,不是换个更贵的模型就能解决的。
项目精华点
项目精华总计
-
大模型原理
掌握大模型相关的核心概念,例如 mcp,skills,agent;大模型的迭代,市面上主流大模型介绍等;