通过 Google Cloud 控制台管理 infoType

本页面介绍如何通过 Google Cloud 控制台在检查配置中添加和修改 infoType。

使用敏感数据保护功能inspect分析数据时,您可以使用检查配置指定要扫描的信息类型 (infoTypes)。您可以通过 Google Cloud 控制台中的以下敏感数据保护操作设置检查配置:

Google Cloud 控制台中的这些操作具有 InfoTypes 部分,您可以在该部分选择 infoType、修改内置 infoType 的设置,以及添加自定义 infoType。包含 InfoTypes 部分的步骤因您要执行的操作而异。下表显示了每项操作的相关工作流步骤。

操作 相关步骤
创建检查模板 配置检测
创建检查作业或作业触发器 配置检测
创建发现扫描配置 选择检查模板

选择内置 infoType

  1. InfoTypes 部分中,点击InfoTypes
  2. 如需缩小 infoType 的选择范围,请在过滤条件字段中应用过滤条件。选择要过滤的属性名称,然后输入属性值。例如,如需过滤与澳大利亚相关的所有 infoType,请将属性名称设置为 Location。对于属性值,选择或输入 Australia

    如果您知道 infoType 名称,也可以直接在过滤条件字段中键入。

  3. 如需查看 infoType 的所有类别标记,请点击该 infoType 的 切换完整单元格内容

  4. 如需隐藏或取消隐藏列,请点击 列显示选项,然后选择要显示的列的名称。

  5. 选择要包含在检查配置中的 infoType。

  6. 点击完成

修改内置 infoType 的设置

在设置要包含在检查配置中的 infoType 时,您还可以修改其中一���或������ infoType 的设置。您可以修改敏感度级别,对于某些 infoType,还可以修改 infoType 版本。

  1. 选择要包含在检查配置中的内置 infoType,包括您无需修改的 infoType。请勿点击完成
  2. 点击修改所选 infoType

    “修改所选的 infoType”按钮的位置
  3. 对于要修改的每个 infoType,使用下拉列表选择敏感度级别或检测器版本。

  4. 点击确认

  5. 点击完成

添加自定义 infoType

本部分介绍如何根据基础数据集添加自定义 infoType。底层数据可以是以下任意一种:

  • 您在检查配置中以内嵌方式提供的字词或词组的列表。
  • 您存储在 Cloud Storage 文本文件中的字词或词组的列表。
  • 您存储在 Cloud Storage 的大型文本文件或 BigQuery 中的一列中的字词或短语的庞大列表。

    对于此类型,您必须先创建一个指向大型自定义字典的存储 infoType,然后再执行此任务。

  • 您在检查配置中以内嵌方式提供的正则表达式。

是否可以重复使用新的自定义 infoType 取决于您创建自定义 infoType 时执行的操作:

  • 如果您在创建检查作业或作业触发器时创建自定义 infoType,则自定义 infoType 仅适用于该作业或作业触发器。

  • 如果在创建检查模板时创建自定义 infoType,则自定义 infoType 可用于任何使用该检查模板的操作。

  • 如果您在配置性能剖析时创建自定义 infoType,敏感数据保护会基于检查配置创建新的检查模板。自定义 infoType 可用于任何使用该新检查模板的操作。

如需详细了解自定义 infoType,请参阅自定义 infoType 检测器

如需添加自定义 infoType 检测器,请执行以下操作:

  1. InfoTypes 部分中,点击InfoTypes
  2. 自定义标签页上,点击添加自定义 infoType
  3. 类型部分,选择要创建的自定义 infoType 检测器的类型:

    • 字词或短语:与您在此字段中输入的一个或多个字词或短语匹配。您最多可以输入 128 KB 的数据,相当于数千个条目。

      选择此类型后,系统会显示字词或短语列表字段。 输入您希望敏感数据保护与之匹配的字词或词组。如需匹配多个字词或短语,请在输入每个条目后按 Enter。如需了解详情,请参阅创建常规自定义字典检测器

    • 字典路径:与存储在 Cloud Storage 文本文件中的单词或短语匹配。如果您要搜索数十万个字词或短语,请使用此自定义 infoType。如果您的列表包含敏感术语,并且您不想以内嵌方式将它们存储在检查配置中,此方法也很有用。

      选择此类型后,系统会显示字典位置字段。 输入或浏览到用于存储字典文件的 Cloud Storage 路径。如需了解详情,请参阅创建常规自定义字典检测器

    • Regex:根据正则表达式匹配内容。

      选择此类型后,系统会显示 Regex 字段。输入正则表达式格式以匹配字词和短语。如需了解详情,请参阅支持的正则表达式语法

    • 存储的 infoType:匹配存储在 Cloud Storage 中的大型文本文件或 BigQuery 中的单个列中的字词或短语。

      此选项会添加一个大型自定义字典检测器。如果您需要搜索数百万个字词或短语,请使用这种自定义 infoType。

      对于此类型���您必须已创建指向底层大型自定义字典的存储 infoType

      选择此类型后,系统会显示存储的 infoType 名称字段。 输入存储的 infoType 的完整资源名称。

  4. 对于 InfoType,为要创建的自定义 infoType 输入名称。

    如果要创建类型为存储的 infoType 的自定义 infoType,请输入与底层存储的 infoType 的名称不同的名称。

  5. 对于可能性,选择要分配给与此自定义 infoType 匹配的所有发现结果的默认可能性级别。您可以使用热词规则进一步微调单个发现结果的可能性级别。如果您未指定默认值,则默认可能性级别会设置为 VERY_LIKELY。如需了解详情,请参阅匹配可能性

  6. 对于敏感度,选择要分配给与此自定义 infoType 匹配的所有发现结果的敏感度级别。如果您未指定值,这些发现结果的敏感度级别将设置为 HIGH

    敏感度得分用于数据分析文件。剖析数据时,敏感数据保护使用 infoType 的敏感度分数计算敏感度级别

  7. 点击完成

  8. 可选:如需再添加一个自定义 infoType,请再次点击添加自定义 infoType

  9. 点击完成

后续步骤