肖珑《数字人文、数字出版与文化遗产智慧数据建设》——“智慧图书馆技术应用讲座”2024年第8期(总第34期)

肖珑《数字人文、数字出版与文化遗产智慧数据建设》——“智慧图书馆技术应用讲座”2024年第8期(总第34期)

10月12日上午10点,2024年第8期云瀚“智慧图书馆技术应用讲座”(总第34期)在线上举办。本期讲座邀请澳门科技大学图书馆执行副馆长肖珑担任主讲嘉宾,报告标题为《数字人文、数字出版与文化遗产智慧数据建设》。1000余人在线参加了本次讲座。

公共数字文化研究报告从文化遗产智慧数据的概念和属性谈起,介绍阐述了数字人文、数字出版在文化遗产智慧数据建设中的作用。报告特别选取了山西数字人文研究院的三个典型实例项目案例,详尽而生动地展示了数字人文方法如何被有效应用于文化遗产智慧数据建设的过程之中,从而促进文化遗产的保护与传承。

互动交流

在讲座的交流互动环节,线上观众提问踊跃,部分精彩内容摘记如下。

问:案例2主要是用什么工具进行图片标引、图片切分?切分的图片元素修饰词之间是否建立关联?

肖珑:目前,针对案例所提及的建设工作,仍处于进展阶段,我无法确保所提供的回复具备绝对准确性。挑战之一,在于图片分割过程中的机器学习训练,鉴于五台山壁画的复杂性,制定一个有效且理想的自动分割方案尤为困难。因此,在别无选择的情况下,我们或将采取人工切割的方式作为备选。当前正处于项目实施过程中,计划首先借助机器生成初步的分割结果,随后引入人工干预以优化结果。人工干预是必要的,这也是为什么前期需要制定元数据规范,及进行细致标引,这些工作将为后续的人工干预奠定坚实基础。目前,我们正稳步推进这一流程。数据关联是可以的,也需要先做好关联模型。正如我前面提到的,为了实现这一目标,我们的工作不减反增。构建云冈学本体关联模型就非常不容易。经过数年努力,我们两个项目终于形成了一套具备深度关联能力的解决方案。  

问:图像元数据标引工作有什么标准可以借鉴?

肖珑:早期的图像元数据的研究确实存在专门的规范。然而,我们逐渐认识到,单一的规范难以全面适应各类文化遗产图像的复杂性。应根据文化遗产的类型,选择参考不同的元数据规范。例如,拓片、石窟和壁画等都有其成熟的元数据标准。敦煌提供了比较成熟的古代壁画元数据做法,北大图书馆和国家图书馆也为拓片和石窟提供了标准化的元数据模板。因此,如今我们不再追求使用统一的元数据规范来整合所有内容。现在,我们更加注重选择与特定文化遗产类型相匹配的元数据规范,通过在不同元数据规范之间建立有效的映射和对应关系,我们能够在不将所有数据集中于单一平台的情况下,实现数据的互通和共享。在AI技术日益成熟的今天,我们更应该强调数据的特色化和差异化,以保持文化遗产的独特性和丰富性。

问:对于中小型图书馆做文化遗产资源服务平台有什么建议?

肖珑:对于文化遗产资源服务平台的考虑,应当依据其具体的对象来进行。这里所指的文化遗产并不仅限于文博领域,还涵盖了图书馆的古籍、拓片,以及具有强烈地域特色的方志、家谱等。我认为,并不存在一个能够全面覆盖所有文化遗产的平台。因此,我们应根据不同文化遗产对象的特点,参考已经相对成熟的数字化平台。例如,在家谱研究方面,可以借鉴上海图书馆的家谱平台;在古籍研究方面,则有国家图书馆、CALIS和上海图书馆的古籍平台可供参考;而在石窟寺研究方面,敦煌和云冈学文献知识库可供参考。在数字图书馆背景下,我们不是期待通过一个平台来囊括所有内容,相反,随着研究的不断深入和细化,我们应追求在更细致、更深入的领域进行探索和研究。

发表评论

云瀚联盟-智慧图书馆技术应用联盟