【翻译】什么是元数据

时间:2024-01-28 14:42:26

本文是翻译稿,原文见:https://dataedo.com/kb/data-glossary/what-is-metadata

元数据是关于数据的数据。元数据是数据的描述和上下文。它有助于组织,查找和理解数据。

典型的元数据类型有

  1. 标题和说明,
  2. 标签和类别,
  3. 谁创造的,何时创造的,
  4. 谁最后修改时间,什么时候修改,
  5. 谁可以访问或更新。

下面来举列不同场景下的元数据。

一张照片

img

每次使用当今的相机拍照时,都会收集并保存一堆元数据:

  • 日期和时间,
  • 文档名称,
  • 相机设置
  • 地理位置。

一本书

img

每本书的封面和内部都有许多标准元数据。这包括:

  • 一个标题,
  • 作者姓名,
  • 发布者和版权详细信息,
  • 背面的说明
  • 目录,
  • 指数,
  • 页码。

博客文章

img

每个博客文章都有标准的元数据字段,通常在第一段之前。这包括:

  • 标题,
  • 作者,
  • 发布时间
  • 类别,
  • 标签。

电子邮件

img

您发送或接收的每封电子邮件都有许多元数据字段,其中许多隐藏在邮件标题中,而您在邮件客户端中看不到。该元数据包括:

  • 学科,
  • 从,
  • 到,
  • 发送的日期和时间,
  • 发送和接收服务器名称和IP,
  • 格式(HTLM的纯文本),
  • 反垃圾邮件软件详细信息。

Word文件

img

每个文字处理软件都会收集一些标准的元数据,并使您可以为每个文档添加自己的字段。典型的字段是:

  • 标题,
  • 学科,
  • 作者,
  • 公司,
  • 状态,
  • 创建日期和时间
  • 上次修改日期和时间,
  • 页数。

电子表格

img

电子表格包含一些元数据字段:

  • 标签名称,
  • 表名,
  • 列名,
  • 用户评论。

关系型数据库

img

关系数据库(最常见的数据库类型)在称为数据字典或系统目录的结构中不仅存储数据而且还提供元数据访问。它包含有关以下内容的信息:

  • 桌子
  • 列,
  • 数据类型
  • 约束
  • 表关系

电脑档案

img

您在文件资源管理器中每个文件看到的所有字段实际上都是元数据。实际数据在这些文件中。元数据包括:

  • 文档名称,
  • 类型,
  • 尺寸,
  • 创建日期和时间
  • 最后修改日期和时间。

网页

img

每个网页都有许多元数据字段:

  • 页面标题,
  • 页面说明,
  • 图标。

纸质档案

img

纸质文档文件通常具有有助于管理文档的管理元数据。这可能包括:

  • 用于按字母顺序组织的文件的字母,
  • 访问控制信息(例如“分类”),
  • 徽标。

概括

这些就是我的例子。我希望到目前为止,您对元数据是什么有了很好的了解。