解释元数据
元数据是 Web 2.0 的重要组成部分,其特点是 电话号码库 从静态的、所有者生成的网站转变为具有用户生成内容、动画等的动态网站。Web 2.0 是万维网的第二阶段,它还开创了社交媒体,其中网站的全部焦点可能是用户生成的信息 – 用户的帖子、其他人的评论、共享、复制和重新发送对象。万维网已经是一个庞大而混乱的地方,包括教育、商业和政府网站以及偶尔出现的恶作剧。需要有一种方法来定义、定位和管理已经不断增长的信息海洋 – 更不用说错误信息了。
使用标签
输入标签。标签并不新鲜。事实上,标签早已成为博物馆、零售商和其他任何需要查找信息的人的做法。标签可以指示一种信息,并指出它在其他信息中的位置。自亚历山大图书馆以来,图书馆就一直在这样做——创建指向图书馆书架上某个位置的标签。标签可以帮助用户理解独角兽应该放在神话部分,不太可能与马一起出现——尽管马的形态对两者都很常见。由于这种共性,图书馆研究可能会通过关键词找到独角兽,不仅与马有关,还与飞马——另一种具有马形态的神话生物——交叉引用。但是,如果您在实体图书馆中搜索信息,您可能需要从两个或三个不同的书架部分中抽出书籍才能找到您要查找的信息。
元数据和标签云
元数据和标签云使查找相关信息比使用图书馆索引和在 BZB 目录 精装书中搜索所需的信息更加容易和快捷。事实上,标签云有时被显示为一种艺术形式,其驱动力来自网站上各种搜索的流行度。回到我们的图书馆类比,如果我们在 Google 中搜索术语“马”,我们将获得一个定义以及一个网站列表。通过访问网站 TagCrowd 并输入搜索结果的 URL,我们将得到本段旁边显示的以下标签云。
我们也会得到一些惊喜。虽然我们一直认为“马”应该与独角兽和飞马有关,但事实并非如此。为什么?因为“马”这个词更常与普通马联系在一起。让我们再试一次。
扩大搜索范围
如果我们添加关键词搜索词“马神话生物”,我们会得到一个更有希望的结果,其中不仅包括独角兽和飞马,还包括其他神话中的马。现在让我们重新审视一下该标签云。
现在你可以看到“horses”仍然是图表中最大的单词,其次是“mythological”和“mythical”。Pegasus 的字体比 unicorn 稍大,而 hippocampus 则相对较小且模糊。这里发生了什么?
答案是,Tag Crowd 图形生成器利用每个单词的 使用 Folderit 的 DMS 将文件同步到您的云存储 出现频率赋予它们一定的权重。顺便说一句,这是一种查看搜索中最常使用的关键词的有效方法——这对那些试图优化博客或其他网络文档以便搜索引擎能够找到它们的作者来说非常有用。
在您的业务中使用元数据和标签现在,您可能会认为这很漂亮,但它可能对您的业务或项目没有多大用处。但很快您就会发现它确实非常有用,并且您可以在存储自己的文档时使用带有元数据的云存储。
您可能不会对神话中的马有太多的需求,但同样的原则适用于任何类型的数据。让我们假设您正在与一家云存储公司(例如 Folderit)建立新帐户。
使用 Folderit
Folderit 最近被评为世界上最用户友好的文档管理系统,这是有原因的。设置帐户后,您的信息将输入到文件夹中 – 就像您在个人计算机硬盘上保存数据一样。每个文件夹都以对您有意义的方式标记 – 应付账款、应收账款、投资储蓄、扩展项目或任何适合您的方式。当您有业务交易时,您可以将它们输入正确的文件夹中。
跨文件夹标签
但是,如果您需要通过多笔交易来跟踪某项商品,该怎么办?假设您经营一家建筑公司,并已签约为三栋房屋安装瓦片。碰巧的是,每栋房屋都将使用相同类型和颜色的瓦片,因此您批量订购材料。瓦片被添加到您购买材料的公司的应付账款中。已完成的工作条目进入应收账款,以便从客户处收取。在所有这些过程中,当您对供应品进行实物盘点时,您发现缺少五捆瓦片。您如何追踪丢失的瓦片?
答案是带标签的云存储。如果您分配了零件编号,则可以为瓦片贴上标签,然后可以将该编号以及使用的瓦片数量输入到工作订单和收据中。这样,您就可以轻松跟踪购买和转售给客户的情况,并跟上库存。
为特定样式和颜色的瓦片分配标签后,使用该标签搜索云就变得很容易了。它的工作方式与我们在搜索引擎中输入“神话中的马”并得出具有马特征的神话生物的方式相同。同样,通过使用分配给瓦片的标签,您可以找到记录中输入它们的每个位置。搜索瓦片标签会找到您丢失的瓦片。它们正在等待卡车,因为您的三个客户中有一个要求用瓦片覆盖一个小棚子以匹配房屋。
为什么这样做有效?因为算法设置为当您输入标签时,它不仅会搜索一个文件夹,还会搜索所有文件夹。这样,您可以将信息记录在与其最相关的文件夹中,但您也可以使用标签将多个文件夹中的信息连接起来。
使用标签
一个好的云程序会列出你正在搜索的标签出现的所有位置。这是一种检测一组用品从购买到使用的旅程的好方法。但标签搜索还有其他用途。它可以帮助您跟踪客户的订单、处理工资单,并跟踪多个员工跨部门互动的项目文件夹中的活动。
总结元数据和标签
让我们重新整理一下,回到开头。元数据是关于数据的信息。它可以是文件夹标题、描述或关键字。它可以是分配给特定类别的数据或对象的标签。在这种情况下,对象不必是像瓦片这样具体和有形的东西。它可以是仅以数字格式存在的东西——一个想法或一组可以标记或标记的想法。当您在 Facebook 或其他社交媒体上为图片中的某人添加标签时,您正在创建一种元数据,因为 您正在连接信息片段。
面部识别是目前备受争议的事物,它依赖于一种类型的数据。事实上,它需要大量数据才能有效。计算机的面部识别更多地取决于照片中关键点的位置,而不是鼻子或耳朵的形状——尽管这些可能是人类识别的关键特征。想象一下一个数据库,其中包含数百万条关于这些关键点在脸上的分布方式的记录——想象一下为每个关键点想出不同的标签有多难。这说明了计算机信息科学仍处于起步阶段,以及元数据和标记对于高效信息管理的重要性。
您的操作不太可能像面部识别那样复杂——除非您安装需要面部识别的软件。即便如此,元数据和标记也是有效管理业务交易的重要组成部分。