脱敏词库
脱敏词库用于保护文档中的敏感信息。当需要翻译含有机密内容的文档时,系统会在调用大模型翻译前,先将敏感词汇替换为占位符,翻译完成后再将占位符还原为原始内容,确保敏感数据不会暴露给外部模型。
工作流程示例:
原文包含敏感内容 → 脱敏替换 → 交给大模型翻译 → 还原敏感内容 → 输出最终译文
例如,文档中包含邮箱地址 zhangsan@company.com,系统先将其替换为占位符 [EMAIL_1] 再送入模型翻译,翻译完成后再将 [EMAIL_1] 还原为 zhangsan@company.com,确保邮箱地址全程不经过外部模型。
创建脱敏词库
进入翻译助手的自定义词库页面,点击右侧词库对照表面板,切换到脱敏词库标签页,点击新增按钮,填写词库名称后点击确认完成创建。

页面各操作说明如下:
| 标注 | 操作 | 说明 |
|---|---|---|
| ① | 编辑 / 删除 | 对当前选中的词库进行重命名或删除 |
| ② | 脱敏词库标签 | 切换至脱敏词库列表,与常规词库分开管理 |
| ③ | 新增 | 新建一个脱敏词库 |
| ④ | 词库名称输入框 | 填写新词库的名称,如 测试、脱敏词库 |
| ⑤ | 保存 / 删除 | 保存当前词库名称或删除该词库 |
添加脱敏词条
词库创建完成后,点击添加词库按钮,在弹窗中填写需要脱敏的原始内容及其对应的占位符描述,点击确认保存。
词条以表格形式展示:
| 字段 | 说明 |
|---|---|
| 源文件描述 | 需要被替换的敏感内容,如邮箱地址 zhangsan@company.com、手机号 13800138000 |
| 译文描述 | 翻译后对应的还原内容(通常与源文相同,系统在还原阶段使用) |
说明: 脱敏词库的"译文描述"填写的是还原后的内容,与语料库的用途不同——语料库是指定译文,脱敏词库是保护原文不被模型处理。
使用场景
| 场景 | 示例 |
|---|---|
| 邮箱地址 | zhangsan@company.com → 占位符 → 翻译 → 还原 |
| 手机号码 | 13800138000 → 占位符 → 翻译 → 还原 |
| 公司内部代号 | 项目代号、合同编号等不希望被模型识别的内容 |
| 人名 / 机构名 | 涉及保密的人员姓名或组织名称 |
提示: 脱敏词库与语料库可同时使用。系统会先执行脱敏替换,再进行翻译,最后还原敏感内容,三个步骤按序自动完成。