人工智能时代的元数据方法论

元数据是关于数据的数据,随着技术的进步,元数据获取逐渐成为信息系统数据建模和实现功能的关键性步骤,发展起一套包括实体定义、关系描述、对象分析、属性提取、本体建模,以及数据清洗、消歧、对齐、映射、关联、丰富、导入、导出乃至服务部署、注册发现、运行监测等一系列操作的方法论体系,旨在帮助实现任何信息体的结构化描述、语义编码和机器理解。这些不仅是语义技术 (包括关联数据) 和知识图谱技术必需的应用,而且已成为信息系统建立独立的、基于知识的内容架构的基本操作和主要方案。文章把与元数据相关的一系列方法体系统称为元数据方法,相关的最佳实践基本体现于语义万维网已经制定、正在制订或正在考虑制订的各项标准规范中。元数据方法在未来基于 Web 3.0 的多模态元宇宙建设中会继续起到多方面的重 要作用,如利用知识模型构建数字孪生,甚至支持对整个虚拟世界的建模等。当然基于人工的描述和编码显然不能适应元宇宙时代用户生产内容 (UGC) 和 ChatGPT 带来的人工智能生成内容 (AIGC) 的内容生产方式,必须有一套方法论帮助自动实现语义形式化。这应该是元数据方法适应未来智慧时代需求的必由之路。

云瀚联盟-智慧图书馆技术应用联盟