那么什么是元数据呢?

2021年2月23日20:16:00 发表评论 20 次浏览

关于元数据的写作是有风险的, 因为每个帖子和每条推文都可能引发相同的讨论:元数据到底是什么?因此, 这是我雄心勃勃的尝试, 试图追逐并再次打开蠕虫罐头。

无论如何, 你为什么要在乎呢?这不只是一些高度技术性或理论性的争论吗?是的, 在某种程度上是这样, 但是事实仍然是, 对于任何内容技术, 元数据必不可少。首先, 元数据使我们能够使用系统来管理内容。即使你采用使用企业搜索的强力方法, 而不是使用元数据来精心标记所有内容, 你也会发现结果充其量是令人失望的。 (实际上, 如果没有可用的有用元数据, 搜索引擎将不得不自己创建它。)元数据非常重要, 以至于我们现在甚至可以法院裁决定义它。

当然, 本质很容易定义。元数据是关于数据的数据。问题在于, 最后, 你无法真正定义数据和元数据之间的区别。

示例很多:文档的作者, 创建或发布日期的内容, 数据库列的名称, 甚至文件名都是元数据。你可以在任何处理内容的系统中看到它, 并且通常, 有用的是, 它实际上会被标记为"元数据"。对于可以拥有哪些元数据(例如Dublin Core或EXIF)或如何将其存储在文档本身(例如XMP)中, 存在一些标准。如果你仅想了解这些, 现在可能是停止阅读的好时机。因为从那里开始, 它开始变得棘手。

有人认为元数据的概念不是很直观, 因为它是人为的, 我们不习惯的事情"在真实的生活里。"我对此表示怀疑。 (你只需阅读本书的封面即可了解其原因。)实际上, 我们已经习惯了看事物的那些元层次。我们需要他们进行沟通。 ("我的汽车的颜色是绿色的。")因此, 他们习惯了它们, 实际上, 你可以说任何种类的内容都是元数据, 因为它总是描述其他内容。 (即使一张椅子的图片也不是真正的椅子, 只是对椅子的引用;并且此博客文章不只是文本, 而是关于...的。)

在内容管理中, 我们倾向于根据内容的用途或目的而不是其性质来定义元数据。之所以说元数据, 是因为我们想将其用作元数据。 CMS将把该元数据用作"钩子", 以激发操作, 例如以某种方式在特定页面上显示内容。开发人员可能希望根据日期进行排序, 信息架构师或知识管理者可能希望根据内容的分类来显示内容, 或者用户需要使用方面来完善其搜索界面中的结果。这些用途截然不同, 有时彼此矛盾。

你的记录管理员可能希望将所有元数据与数据一起保存为一个"文档"。开发人员通常更喜欢系统像处理任何数据一样对待元数据(因为这样就可以通过API以统一的方式对其进行访问, 而开发人员则无需为此而烦恼)。另一方面, 出于性能目的, 你可能希望将元数据和数据分开(将"关于"内容存储在数据库中, 并将巨大的视频本身存储在文件系统上-DAM系统经常这样做)。但是Web编辑器通常会想知道为什么某些重要字段(它们的区别通常看起来完全是任意的)被标记为"元数据", 并且隐藏了两个选项卡和数次单击。

你不太可能通过争论谁是对的来解决那些冲突。这些辩论中有一些已经激怒了数千年。柏拉图会说你应该将元数据视为其描述的外部。亚里士多德会告诉你, 这些是文件或记录的固有属性。拉斐尔(Raphael)在梵蒂冈的画作很好地说明了这一点, 柏拉图(Plato)左侧指向云, 很明显, 亚里斯多德(Aristotle)控制着文件。

在实际管理内容的过程中, 你可能需要聘请一些专业的哲学家代表你进行辩论。因为最终, 每个人​​都将对元数据是什么持不同意见, 而没有人会是"正确的"。对于任何内容管理项目, 你都需要明确每个人的需求以及系统如何使用内容。那应该定义你的元数据。

(顺便说一句, 如果你对此完全不同意-请与你的哲学家联系我的哲学家, 他们可以得出认识论和本体论的精美印刷品。)

CMSWatch.com"趋势"博客中与社交软件相关的博客文章。

链接到原始帖子

一盏木

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: