【文件属性】:
文件名称:project-matt:马特计划
文件大小:849KB
文件格式:ZIP
更新时间:2021-05-17 09:20:28
redis elasticsearch machine-learning scala aws-s3
项目Matt:AWS S3 PII扫描仪
创建该项目是为了帮助您扫描AWS S3存储桶中的PII数据。 该应用程序利用了AWS服务的规模和成本,确保您只为使用的商品付费。
部署后,它将扫描您的AWS S3存储桶(您也可以设置前缀以将扫描限制为特定路径),并自动检测文件类型并使用正则表达式提取可能的PII。
扫描摘要已加载到您的Elasticsearch群集中,您可以使用该群集创建Kibana仪表板来报告DLP暴露。
分类器
正则表达式:当前,该应用程序检测到一些关键的欧洲个人数据正则表达式模式。 但是,您可以派生项目并添加更多正则表达式。 您可以在阅读更多关于可用分类器的。
关键字匹配:目前正在开发中。 尚未发布。 这是因为在此主题上需要大量的领域专业知识。
卷积神经网络:这是一个积极的开发,将在下一个主要更新中发布。 该项目将使用CNN来检测扫描文件中的敏感词或PII词。
支持