Skip to content

脱敏词库

脱敏词库用于保护文档中的敏感信息。当需要翻译含有机密内容的文档时,系统会在调用大模型翻译前,先将敏感词汇替换为占位符,翻译完成后再将占位符还原为原始内容,确保敏感数据不会暴露给外部模型。

工作流程示例:

原文包含敏感内容 → 脱敏替换 → 交给大模型翻译 → 还原敏感内容 → 输出最终译文

例如,文档中包含邮箱地址 zhangsan@company.com,系统先将其替换为占位符 [EMAIL_1] 再送入模型翻译,翻译完成后再将 [EMAIL_1] 还原为 zhangsan@company.com,确保邮箱地址全程不经过外部模型。


创建脱敏词库

进入翻译助手的自定义词库页面,点击右侧词库对照表面板,切换到脱敏词库标签页,点击新增按钮,填写词库名称后点击确认完成创建。

创建脱敏词库

页面各操作说明如下:

标注操作说明
编辑 / 删除对当前选中的词库进行重命名或删除
脱敏词库标签切换至脱敏词库列表,与常规词库分开管理
新增新建一个脱敏词库
词库名称输入框填写新词库的名称,如 测试脱敏词库
保存 / 删除保存当前词库名称或删除该词库

添加脱敏词条

词库创建完成后,点击添加词库按钮,在弹窗中填写需要脱敏的原始内容及其对应的占位符描述,点击确认保存。

词条以表格形式展示:

字段说明
源文件描述需要被替换的敏感内容,如邮箱地址 zhangsan@company.com、手机号 13800138000
译文描述翻译后对应的还原内容(通常与源文相同,系统在还原阶段使用)

说明: 脱敏词库的"译文描述"填写的是还原后的内容,与语料库的用途不同——语料库是指定译文,脱敏词库是保护原文不被模型处理。


使用场景

场景示例
邮箱地址zhangsan@company.com → 占位符 → 翻译 → 还原
手机号码13800138000 → 占位符 → 翻译 → 还原
公司内部代号项目代号、合同编号等不希望被模型识别的内容
人名 / 机构名涉及保密的人员姓名或组织名称

提示: 脱敏词库与语料库可同时使用。系统会先执行脱敏替换,再进行翻译,最后还原敏感内容,三个步骤按序自动完成。