• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

灵犀一体机如何配置RAC知识库

16小时前提问
  • 0关注
  • 1收藏,53浏览
粉丝:0人 关注:0人

问题描述:

组网及组网描述:

官网的4种手册都没有提到RAC模型配置流程和注意事项 能否提供个参考案例或者相关文档

3 个回答
已采纳
粉丝:8人 关注:2人

灵犀一体机(LinSeer Hub)RAG 知识库完整配置指南

你遇到的弹窗 「RAG 模型当前没有配置,请配置后使用」,核心原因是:RAG 功能依赖「嵌入模型 (Embedding)+ 大语言模型 (LLM)」双模型,必须先完成模型配置,才能创建知识库,你截图里只填了知识库参数,没配置底层 RAG 模型,所以无法使用。

一、先纠正一个笔误

你写的「RAC 知识库」是笔误,正确是 RAG(Retrieval-Augmented Generation,检索增强生成),下面按标准 RAG 流程说明。

二、完整配置流程(按顺序执行,缺一不可)

🔴 第一步:先配置 RAG 依赖的核心模型(解决弹窗报错的关键)

RAG 需要 2 个模型,必须先在系统中部署并配置:
  1. 嵌入模型(Embedding Model):负责把文档 / 问题转成向量,用于检索
  2. 大语言模型(LLM):负责根据检索到的知识库内容生成回答

1.1 部署 / 导入模型(首次使用必做)

  • 登录灵犀使能平台(LinSeer Hub)→ 进入 「模型管理」 页面
  • 确认已部署 / 导入 2 个模型:
    • 嵌入模型:推荐 bge-large-zh-v1.5(中文最优,一体机预装)
    • LLM 模型:如 DeepSeek-R1LinSeer 等(一体机预装)
  • 若未部署:点击「新增模型」→ 选择本地模型包导入 → 部署推理实例(分配 GPU)

1.2 配置 RAG 全局模型关联

  • 进入 「系统设置」→「RAG 模型配置」(部分版本在「模型管理→RAG 配置」)
  • 绑定 2 个核心模型:
    • 嵌入模型:选择 bge-large-zh-v1.5(默认预装)
    • LLM 模型:选择你要使用的大模型(如 DeepSeek-R1-32B
  • 点击「保存」,完成后弹窗报错会自动消失,才能创建知识库

🟠 第二步:创建 RAG 知识库(你截图的页面)

模型配置完成后,回到「知识库」→「新增」,按以下规范填写参数(附最佳实践):

2.1 基本信息

表格
字段填写示例说明
知识库名称杨柳青测试自定义,唯一标识
知识库分类技术文档 / 内部制度用于分类管理,可选
描述地球站知识库备注说明,可选

2.2 知识库配置(核心参数,直接照填)

表格
字段推荐值说明
默认召回条数5-10一般设 5-10,太多会冗余,太少信息不足
召回文本块大小500-1024中文场景 500-800 最佳,平衡语义完整性和检索精度
未命中处理策略正常模式未检索到内容时,用 LLM 直接回答;选「拒绝模式」则直接提示无答案
是否返回文件信息返回回答时附带来源文档,方便溯源
同义词库可选有行业专属术语时绑定,否则留空
检索阈值0.7-0.8相似度阈值,0.8 适合精准检索,0.7 适合泛化检索
推理总结(Prompt)你截图的模板可直接用,优化版如下:核心 Prompt,决定回答质量
开启提问理解开启自动优化用户问题,提升检索准确率
开启多轮会话开启支持上下文关联问答
✅ 优化版 Prompt(直接复制)
plaintext
已知信息:{context} 根据上述已知信息,回答用户的问题。请注意: 1. 答案必须严格基于已知信息,不得添加猜测、编造内容 2. 完整覆盖关键信息,不遗漏核心要点 3. 答案使用中文,语言通顺、逻辑清晰 4. 若无法从已知信息中得到答案,请直接回答「根据已知信息无法回答该问题」,无需额外说明 问题是:{question}

2.3 点击「确定」,完成知识库创建


🟡 第三步:上传知识库文档并索引

  1. 进入刚创建的「杨柳青测试」知识库 → 「文档管理」→「上传文件」
  2. 支持格式:PDF、Word、Excel、TXT、Markdown 等(一体机全支持)
  3. 上传后系统自动执行:文档解析 → 文本分块 → 向量化 → 存入向量数据库
  4. 等待状态变为「已完成」,知识库即可使用

🟢 第四步:测试与验证

  1. 进入「会话测试」页面 → 选择「杨柳青测试」知识库
  2. 提问知识库内的问题(如「地球站 XX 流程是什么」)
  3. 验证:
    • 回答是否基于知识库内容(无编造)
    • 是否正确返回来源文件信息
    • 未命中问题是否按策略处理

三、关键注意事项(避坑指南)

1. 弹窗「RAG 模型未配置」的解决

  • 99% 的原因是没绑定嵌入模型 / LLM 模型,必须先在「系统设置→RAG 配置」完成模型关联
  • 若找不到配置入口:升级灵犀使能平台到最新版本(E0208 及以上),旧版本入口在「模型管理」

2. 检索效果优化技巧

  • 文本块大小:长文档(如手册)设 800-1024,短文档(如制度)设 300-500
  • 检索阈值
    • 高精准场景(如合规问答):设 0.85,只返回高度相关内容
    • 泛化场景(如内部问答):设 0.7,覆盖更多相关信息
  • 召回条数:一般 5 条足够,最多不超过 10 条,避免信息过载

3. 权限与安全

  • 可在「对象组」中配置知识库访问权限,限制不同用户访问不同知识库
  • 敏感文档建议开启「水印」,防止泄露
  • 定期更新知识库文档,重新索引保证内容最新

4. 常见问题排查

表格
问题原因解决方法
上传文档后索引失败文档格式损坏 / 过大拆分大文档,修复损坏文件
检索不到内容阈值过高 / 文本块过大降低阈值(0.7),调小文本块
回答不基于知识库Prompt 错误 / 模型未绑定检查 Prompt 模板,重新绑定 LLM 模型
会话卡顿模型 GPU 资源不足减少并发,调整模型实例 GPU 分配

四、官方参考文档

新华三官方《H3C 灵犀使能平台 工作流配置指导》中,第 3 章「知识库」有完整 RAG 配置说明,下载链接:
https://www.h3c.com/cn/Service/Document_Software/Document_Center/AIGC/Catalog/SNPT/LXSN/Configure/Operation_Manual/H3C_CG-31889/

五、一句话总结

先配置 RAG 依赖的「嵌入模型 + LLM 模型」,再创建知识库、上传文档,最后测试验证,按这个顺序操作,就能彻底解决弹窗问题,正常使用 RAG 知识库。

粉丝:2人 关注:9人

配置前请先备份现有知识库配置、语料数据,避免训练异常丢失数据。
### 前置条件
灵犀一体机版本需为V500R005及以上,已完成RAC一段知识库配置、训练且准确率≥90%。
### 关键配置步骤
1. 登录WEB管理端,进入「智能对话开发>知识库管理>知识库列表」,找到对应一段知识库,点击右侧「扩展配置>二段RAC配置」。
2. 开启二段RAC开关,配置触发阈值:建议一段召回置信度低于0.6~0.7时自动触发二段召回。
3. 上传二段专属语料:格式为<细分问句,关联标准问ID,跳转优先级>,需和一段语料无重复,量级不超过一段的30%避免过拟合。
4. 选择「RAC二段专属训练」模式发起训练,训练完成后沙箱测试准确率≥92%再上线。
### 注意事项
跨场景跳转的二段语料需提前配置场景联动权限,上线后观测7天错误率,超5%需回滚重训。
完整官方案例/操作手册可联系H3C 4008100504转智能产品线,或当地办事处获取。

粉丝:9人 关注:1人

参考:https://www.h3c.com/cn/Service/Document_Software/Document_Center/AIGC/Catalog/SNPT/LXSN/Configure/User_Manual/H3C_AppBuilder_UM_E0501-28746/?CHID=1211952


在新华三灵犀一体机上配置RAG知识库,主要是在其软件平台(LinSeer Hub)的“模型推理”模块中,通过“RAG模型配置”和“挂载知识库”这两个步骤完成的。


配置知识库前,需要先确保大模型服务已就绪。

  1. 模型部署:在平台的“模型推理” -> “模型部署”页面,完成大模型的部署。

  2. 服务发布:模型部署成功后,在“服务发布”页面将其发布为可用的推理服务。

  3. 服务确认:在“模型服务”页面,可以看到已发布的推理服务列表,并在此进行后续的增强配置


核心配置:RAG知识库挂载

这部分是配置的关键,分为“配置RAG模型”和“挂载知识库”两个前后依赖的步骤。

1. 配置RAG模型

RAG(检索增强生成)模型负责处理知识库中的文档,并将其转化为大模型可以理解的向量数据。在“模型服务”页面,选择目标推理服务。点击“RAG模型配置”或类似选项,选择或配置用于知识库增强的模型。

2. 挂载知识库

完成RAG模型配置后,即可进行知识库挂载。同样在“模型服务”页面,找到知识库挂载的功能入口。

    1. 点击“挂载知识库”或“添加知识库”按钮。

    2. 选择需要挂载的知识库。如果还没有知识库,平台通常也支持在此步骤中上传文档来创建新的知识库。

    3. 确认挂载,使大模型在回答问题时能参考这些私有知识。


主要就是推理部署> 新增这一步 选择服务类型为向量化或者排序时不知道部署类型是选择基础模型还是模型API 如果选择基础模型那么灵犀推理平台的部署的模型只能给向量化或者排序其中一个使用 选择模型API的话不知道这个模型API该如何调用

zhiliao_Hy5wTH 发表时间:15小时前 更多>>

主要就是推理部署> 新增这一步 选择服务类型为向量化或者排序时不知道部署类型是选择基础模型还是模型API 如果选择基础模型那么灵犀推理平台的部署的模型只能给向量化或者排序其中一个使用 选择模型API的话不知道这个模型API该如何调用

zhiliao_Hy5wTH 发表时间:15小时前

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明