开放、合作、智慧的图书馆未来——2024年世界开放图书馆基金会(WOLFcon)会议综述

开放、合作、智慧的图书馆未来——2024年世界开放图书馆基金会(WOLFcon)会议综述

2024年11期【本期推荐】

本文来源:周纲,朱雯晶,张磊.开放、合作、智慧的图书馆未来—2024年世界开放图书馆基金会(WOLFcon)会议综述[J].《图书馆杂志》

网络首发.https://z.library.sh.cn:443/http/80/net/cnki/kns/yitlink/kcms/detail/31.1108.G2.20241031.1809.008.html

开放、合作、智慧的图书馆未来——2024年世界开放图书馆基金会(WOLFcon)会议综述

【摘要】世界开放图书馆基金会(WOLFcon)2024年年会在英国伦敦大学成功举办,会议重点讨论了基金会项目的进展及未来发展方向。与会者深入交流了FOLIO、ERM、VuFind、GOKb等项目以及图书馆联盟解决方案(如ReShare、OpenRS)的应用经验,以及国家图书馆在这些项目中的探索和部分图书馆的实施经验。本次会议突出了未来图书馆的三个核心特征:开放性、合作性和智慧化。作为开放科学运动的核心推动者,图书馆将在全球知识共享中发挥关键作用。通过开源技术、联盟合作与数据开放等多维度合作,未来图书馆将加速全球知识共享与开放科学的进程。人工智能技术也逐渐成为提升图书馆智慧服务与优化运营的重要手段。

0 引言

开放图书馆基金会(Open Library Foundation,简称 OLF)成立于 2016 年,致力于 支持图书馆界的协作与创新,确保开源和开放获取项目的可用性、可访问性和可持续性。作为一个独立的非营利组织,OLF 提供了一个开放的协作平台,鼓励图书馆员、技术人员、设计师、服务提供商和供应商分享专业知识和资源。基金会托管的软件免费开放,适用于个人、 机构和商业用途。

WOLFcon(World Open Library Foundation Conference)是OLF 的年度盛会,旨在促进社区成员和对开源软件感兴趣的各方进行深入交流与学习。每届 WOLFcon 不仅汇聚了各利益相关者,还举行了 FOLIO 等社区的开发者会议和特别兴趣小组(SIG)会议。自 2018年起,WOLFcon 已在美国、德国等多地举办,举办会议的机构有杜克大学图书馆(2018年)、德克萨斯农工大学图书馆(2020年)、德国汉堡法学院(2022年)、芝加哥大学图书馆(2023年)等知名学术机构。2024 年 WOLFcon 会议在英国伦敦大学举办。

1 WOLFcon 2024 和 OLF 项目进展

WOLFcon2024年度会议于2024 年9月24-26日在英国伦敦大学参议院大厦举行,主题涵盖了从普遍议题到 OLF 项目的多层面话题。普遍议题围绕开放科学、开源软件及包容性知识共享的实现展开,展示了图书馆在推动全球知识共享、跨系统资源整合及人工智能应用等方面的创新进展。此外,会议深入探讨了OLF 的开源项目,强调了其在未来图书馆发展中的重要作用。本次大会共设置近 100 场会议和活动,包括讲座、研讨会及工作会议,议程涵盖了FOLIO的元数据管理、电子资源管理、开放获取、用户管理、报告分析、 API、人工智能、自动化测试、工作流和系统迁移等领域。大会还安排了多个 OLF 项目会议,如GOKbVuFind、OpenRS、ReShae 和 LDP,并举行了 OLF 董事会会议、FOLIO 各委员会会议、产品负责人(POs) 及特别兴趣小组(SIGs)会议。WOLFcon 2024 为 200 余位与会者提供了一个全面的交流平台,包括现有用户、开发者、项目运营和治理团队,以及对开源图书馆项目感兴趣的潜在用户。会上,与会者积极交流、分享经验与知识, 激荡思想火花,并对未来的发展方向展开了深入探讨。

在WOLFcon 2024主旨报告上,OLF主席、斯坦福大学图书馆副馆长Tom Cramer 详细阐述了基金会的使命和最新发展。OLF的核心任务包括“培养、连接、支持”三个方面,致力于推动开源项目及其社区在图书馆领域的成长与创新。基金会秉持全球化发展理念, 汇聚了来自世界各地的项目和志愿者,通过孵化和支持富有远见的小型项目,帮助它们实现规模化,并逐步构建了一个支持图书馆及其社区的生态体系。目前OLF已汇集了多个开源项目,包括 ARC、FOLIO、GOKB、OpenRS 和 VuFind 等。值得关注的是,ReShare 在2024 年正式成为 OLF 的关联项目,Library Data Platform(LDP)也从孵化项目晋升为正式项目,向图书馆提供新一代的数据报告与仓储服务。一个引人注目的里程碑是运行近 25 年的开源集 成图书馆系统 Koha 加入了OLF。这一举措标志着 OLF 在支持和促进全球开源项目发展方面迈出重要一步,进一步丰富了图书馆技术生态。

1.1 图书馆服务平台 FOLIO

1.1.1 FOLIO路线图

FOLIO 是一个开放的图书馆服务平台,其使命是通过开放的社区合作,开发并维护一个能够持续适应全球图书馆需求的平台。FOLIO 的开发由全球多个团队协作完成,并获得了不同机构的资助。FOLIO 路线图主要包括未来 18 个月内的发布计划与优先级设定。FOLIO项目采用固定的发布周期,每年发布 2-3 个版本,每个版本由一种花卉名称(如 Iris 等) 和年度、周期编号(如 2021 R1 等)共同命名。最近的版本 Ramsons 计划于2024年12月发布,后续版本Sunflower预计于2025年4月发布。

FOLIO 产品委员会介绍 FOLIO 路线图的最新进展,主要包括:(1)功能开发与改进:包括增强批量编辑功能、改进财务报告、采编请求工作流程的优化等。特别是在 ERM(电子资源管理)和 GOKb(全球开放知识库)上的持续改进,以及对电子资源使用度量标准COUNTER 5.1的支持。(2)元数据管理:重点集中在MARC规范控制、搜索和浏览的改进。新引入的 MARC 实例映射模块能够简化实例更新,并支持基于关联数据的导出和集成。(3)联盟支持:进一步增强对联盟的支持,特别是在联盟报告和借阅功能方面,如Poppy 版本中引入的联盟借阅支持。(4)功能优先级排序与开发管理:提出了更加灵活的优先级管理方法,用户可以通过JIRA投票、SIG 小组讨论和 PO 的反馈确定功能优先级,开发团队将以此为 参考进行功能的实施。(5)技术与架构更新:通过Eureka 平台的模块化设计优化 FOLIO 架构,MetaDB平台增强了报表与数据管理中的实时数据处理和查询能力。

FOLIO 产品委员会还提到了一些挑战和未来规划,包括如何更好地协调不同团队的协作和功能优先级管理。此外开发团队正在探索如何将人工智能(AI)技术集成到 FOLIO 的开发与管理流程中,以进一步提升平台的智能化水平。

1.1.2 FOLIO新一代技术架构 Eureka

FOLIO技术委员会在多个会议中介绍了FOLIO 新一代技术架构的关键组成部分 ——Eureka(如图1)。该架构可以提升系统的安全性、可扩展性和灵活性。Eureka 通过引入一系列开源的单一职责组件(如Kong和 Keycloak),取代部分传统的OKAPI功能,分担系统中的不同任务。该架构设计确保与现有 FOLIO 模块的兼容性,还引入更多功能和改进来满足更高级的图书馆服务需求。目前 Eureka 的代码已在社区仓库中,但尚未成为正式构建的一部分。

Eureka架构的核心组件包括:(1)Kong API 网关:用于管理平台的 API 流量和路由, 具备插件机制,可以灵活扩展功能。(2)Keycloak 身份验证和授权管理:负责用户身份验 证和授权管理,支持多种单点登录(SSO)协议及多身份提供者配置。(3)Sidecar 容器: 为每个模块配备 Sidecar 容器,负责模块间的通信、授权和租户检查,避免单点故障。(4)应用管理服务:通过“应用描述符 ”对模块进行逻辑分组,简化模块启用、升级和管理。(5)租户授权管理:提供复杂的异步工作流,确保模块在授权后能立即投入使用。

Eureka 架构的优势包括:(1)安全性:通过 Keycloak 提供更强的身份验证和授权管  理,支持多身份提供者和细粒度的权限控制。(2)高可靠性和可扩展性:采用 Sidecar 架构,避免 OKAPI 成为单点故障,提升系统稳定性和可扩展性。(3)灵活扩展:Kong API 网关通过插件机制管理流量,支持不同规模的应用需求。(4)模块化和易集成:应用描述符  简化了模块管理,提升系统的灵活性。(5)自定义能力:无需重构前端即可通过 Keycloak  动态调整 UI 设置和权限,增强定制化能力。(6)兼容性和平滑迁移:与现有 FOLIO 模块的兼容性,降低迁移成本和风险。(7)精细化权限控制:Eureka 引入“能力 ”和“策略 ” 模型,确保系统管理员能够精确控制用户权限,提升系统安全性。

图1 FOLIO Eureka

1.1.3 FOLIO应用程序规范化

FOLIO 目前拥有超过 220 个模块,包括前端、后端、插件、边缘模块以及一些非正式模块。为提升平台的结构性、模块化和效率,FOLIO 技术委员会提出了应用程序规范化(Application Formalization)过程,旨在对这些模块进行组织和整合,将其划分为更具 逻辑性的应用单元,能够独立发布。

应用程序规范化主要包含以下步骤:(1)选择领域(Domain)进行分析:确定要分析 的领域(如采购、用户、馆藏等),优先选择模块数量适中、依赖关系较少的领域。(2) 识别相关模块:通过 FOLIO 的 GitHub 仓库及 Wiki 页面,识别与领域相关的所有模块, 包括前端、后端、插件和边缘模块。(3)分析模块间的依赖关系:使用模块描述文件(module descriptors)确定模块之间的关联性,识别直接和间接的依赖关系。(4)模块组合和拆分:根据功能和依赖关系将模块组合成应用程序,避免循环依赖,确保依赖关系合理。(5)定义应用程序边界:每个应用程序应提供一个“完整但最小 ”的解决方案,能够独立处理特定功能(如采购、财务或流通),详细案例见图2。(6)迭代与调整:随着模块和领域的演变,应用程序的结构需不断迭代优化。(7)处理插件和跨应用功能:针对多个应用共享的 功能(如插件),需制定跨应用的管理策略。

图2 FOLIO应用程序边界(以采访应用为例)

应用程序规范化将对 FOLIO 社区、图书馆和开发者产生深远影响,提升模块管理的效率、增强平台的可扩展性和灵活性,并降低开发与维护成本(详见表1)。

1.2 联盟方案 OpenRS、ReShare、FOLIO ECS

本次会议中,多个图书馆联盟解决方案被广泛讨论。OpenRS是一个由图书馆和联盟组成的开源项目,致力于通过标准化和合作增强馆际互借的效率。ReShare 遵循 ISO 18626 馆际互借标准,通过与战略合作伙伴的合作,已被美国超过150 家图书馆和五个联盟采纳。与此同时,FOLIO 推出了增强联盟支持功能(Enhanced Consortia Support,简称 ECS),专门为满足复杂的图书馆联盟需求而设计。具体比较见表 2。

这些解决方案增强了图书馆联盟的协作能力,使图书馆能够提供更为高效和用户友好的跨系统服务,并且通过标准化和自动化流程的引入,提高了馆际互借的效率和可靠性。

1.3 资源发现VuFind

VuFind 是由图书馆为图书馆设计和开发的开源发现系统。VuFind 团队介绍了其在技术创新、用户体验提升以及社区合作方面的持续进展,具体体现在:(1)VuFind 9.1 和 10.0版本发布:9.1 版本新增了 EBSCO Publication Finder和LibGuides 的 A-Z 列表作为新的搜索功能,提升了用户检索图书馆资源的便捷性。10.0 版本引入了基于 Bootstrap 5框架的全新主题,重构了搜索结果界面,提供更具动态响应的用户体验,显著提升了页面加载速度和交互效率。(2)持久登录与速率限制功能:“记住我”功能允许用户长时间保持登录状态。新增的速率限制功能能够有效防止同一 IP 地址过多请求,维拉诺瓦大学认为该功能在应对爬虫行为影响时显得尤为关键。(3)增强的推荐模块与 API 集成:新的推荐模块为 Reshare 系统设计,允许在本地目录中嵌入第三方系统的资源,优化了 VuFind 的共享目录功能。该模块能够将 Reshare 资源与本地资源集成并展示在同一搜索界面。增强的数据库推荐模块能够根据用户的搜索词自动推荐相关的订阅数据库,这一功能可以与LibGuides 集成使用、也能独立运行,为用户提供更多精准的搜索建议。

1.4 电子资源管理 FOLIO ERM 和开放知识库GOKb

ERM 作为 FOLIO 平台的重要组成部分,使馆员能够更好地跟踪、维护和决策与电子资源 相关的工作,包括:(1) 集中管理电子资源:ERM 系统使图书馆能够在一个平台上集中管理 所有电子资源的信息,包括许可、采购、合同和访问权限等。通过预定义的工作流程,ERM 简化了电子资源的获取和管理。 (2) 集成知识库:ERM 系统与本地知识库或外部知识库(如EBSCO Knowledgebase,GOKb 等)集成,实现了数据的同步与资源比对, 自动化处理协议跟 踪和访问权限管理。 (3) 提升透明度与可访问性:图书馆可以在一个平台上查看所有电子 资源的相关数据,便于馆员做出明智的决策。

ERM 团队介绍了其在技术创新和外部系统整合方面的最新进展:(1)技术与工作流程 优化:ERM 系统已在多个图书馆中广泛应用,特别在 FOLIO 平台上的集成和优化得到了显著提升。通过 FOLIO 中的协议(Agreements)和许可证(Licenses)模块,图书馆能无缝地将 电子资源管理嵌入现有的工作流程中。这简化了资源采购和管理过程, 确保有效监控资源的 订阅期、供应商合同信息等关键数据。(2)与 GOKb 的整合:ERM 与 GOKb 的整合进一步加 强了图书馆电子资源管理的能力。作为一个全球化的元数据交换平台,GOKb 帮助图书馆获取准确且高质量的元数据,如图书、期刊和多媒体资源。通过与 FOLIO 的紧密集成,图书馆 可以定期同步本地知识库与 GOKb 的数据,确保电子资源的最新状态,使得图书馆能够优化资源管理和数据分析,有效支持资源采购、续订和使用情况的跟踪。(3)数据质量与自动化工作流程:GOKb 通过其自动化接口和标识符系统,确保导入的电子资源数据经过严格的语法和语义检查。这种自动化工作流程减少了手动管理资源的负担,使图书馆在处理大规模 电子资源时更游刃有余。

2  OLF项目经验分享

2.1 国家图书馆的探索

澳大利亚国家图书馆和瑞典国家图书馆等多个国家图书馆代表出席了本次会议,分享了他们在开放源代码、数据共享和系统开发方面的积极探索,强调开源技术在支持其未来发展的关键作用:(1)构建基础设施:瑞典国家图书馆为国内图书馆提供联合目录、开放获取服务以及SwePub2开放科学平台等基础设施,推动学术出版物的聚合与共享。(2)扩大数字化收藏:澳大利亚国家图书馆强调其数字化战略,重点收集和保存国家的数字化资源,拥有57000小时的口述历史和.au 域名网络档案,致力于保存互联网资源。(3)开放获取和开放数据:这些国家图书馆大力支持开放获取和开放数据,瑞典国家图书馆开发了开放期刊系统,免费提供学术期刊出版服务。

这些国家图书馆正在利用 OLF 的开源项目 FOLIO 进行元数据管理工作:(1)瑞典国家图书馆通过 FOLIO 进行编目和描述工作,将元数据集中管理,并通过 FOLIO 推送数据至各地方图书馆。(2)芬兰国家图书馆将 FOLIO 视为共享元数据存储库的潜在工具,侧重于元数据的集中管理。(3)澳大利亚国家图书馆在使用 FOLIO 时强调数据自主性和隐私控制, 利用开源解决方案在预算有限的情况下实现可持续发展。

2.2 FOLIO项目上线经验

斯坦福大学图书馆、密苏里州立大学图书馆和康塞普西翁大学图书馆分享了各自的FOLIO 项目经验(详见表3)。这些图书馆此前使用不同的图书馆管理系统,但由于 FOLIO 的灵活性、开放性和高度可定制性,他们最终选择了 FOLIO 作为新的图书馆服务平台。在实施过程中,各馆采用了不同的托管模式和合作伙伴支持。斯坦福大学图书馆选择了本地托管方式,确保对系统的完全控制;密苏里州立大学图书馆则通过外部托管合作伙伴进行迁移和运行管理;康塞普西翁大学图书馆也依赖于第三方提供的托管服务。这些图书馆的经验展示了 FOLIO 在灵活部署和多样化支持方面的优势,证明其适应不同图书馆需求的能力。

2.3 ERM项目上线经验

德国柏林州立图书馆、德国柏林伊比利亚-美洲研究所和密苏里州的图书馆联盟分享了他们上线 ERM 的成功经验(详见表 4),指出ERM 系统提升了电子资源管理的效率,还增强了数据的一致性和可用性。

3 图书馆的未来是开放、合作、智慧的

与2023年的年度会议相比,WOLFcon 2024 在与会人数和项目议题上都有了显著增长。从近百场会议中可以看出,与会各国图书馆和开发商对于未来图书馆的共同愿景是更加开放、 合作与智慧化。这表明图书馆行业正朝着全球协作和技术驱动的方向迈进,致力于构建一个  更加开放和智能化的知识共享环境。

3.1 开放的图书馆未来

3.1.1 图书馆和开放科学

1993 年,欧洲核子研究组织(CERN4)通过开源万维网(World Wide Web)的源代码, 为开放科学(Open science)和知识开放获取奠定了技术基础。2000 年代初的《柏林宣言》 和布达佩斯开放获取倡议推动了开放获取运动的发展。2014 年,CERN 发布了开放获取政策,要求所有研究成果以开放方式发表,并启动了全球最大的学科开放获取项目之一 SCOAP35。2022 年美国白宫发布了尼尔森备忘录,要求所有联邦资助的研究成果和数据必须开放获取。开放科学涵盖了开放数据、开源软件和开源硬件,促进了知识的民主化,使科学研究更具包容性和公平性。开放科学加速了研究成果的传播,并鼓励全球范围内的合作。尤其是在发展中国家,开放获取为其提供了更多的科学资源,缩小了全球知识鸿沟。开放科学强调研究的透明性和可重复性,增强了科学研究的可信度。开源软件已成为科学研究的重要组成部分,许多研究依赖于特定的软件工具。因开放科学强调科学研究的生产工具和基础设施也应是开放的,确保更多人能够参与到科学研究中。

图3 开放科学

Tom Cramer 在 WOLFcon 2024 中探讨了开放科学与图书馆的交集和实现包容性知识共享的途径。他指出(1)开放科学通过全球化和网络化的方式推动科学研究与知识共享(图3)。这不仅包括科学成果的开放获取,还强调数据集和研究工具(如开源软件)的可用性,以确保研究的透明性和可重复性。在此背景下,图书馆作为知识基础设施,承担着至关重要的角色。图书馆不仅应继续提供传统的学术资源(如文章和专著),还应负责保存软件和数据集,以确保未来的科研能够重现和验证过去的发现。未来的图书馆需要更加深入参与开放科学,收集、存储和传播各种知识资源,推动科学的开放与共享。(2)开源软件在图书馆未来发展中的重要性。开源软件是知识生产和科学研究的关键工具。图书馆应积极采用这些技术,构建科研的基础设施,保障知识的自由生产与传播。图书馆还需要考虑如何保存和运行这些开源软件,以确保其能够支持未来的科学研究和持续的知识探索。

CERN、约翰内斯堡大学图书馆、斯坦福大学图书馆交流了各自在开放科学运动中的工作。作为学术交流和知识传播的基础设施,图书馆承担着提供开放获取服务、管理研究数据和培训研究者的多重职责(详见表 5)。

3.1.2 图书馆和关联开放数据

关联数据(Linked Data)和关联开放数据(Linked Open Data)是推动互联网数据互 联与共享的重要模式。关联数据通过标准技术(如 RDF、HTTP、URI)发布和连接结构化数据实现跨领域的数据互操作性,通过唯一的 URI 标识资源将不同数据集连接形成全球化的数据网络,其核心技术包括 RDF(资源描述框架)和 SPARQL(RDF 查询语言)。关联开放数据符合关联数据的技术标准,还强调数据的开放性,要求数据免费开放、允许公众自由访问与使用。

在关联开放数据研讨会上,与会者一致认为传统的 MARC 元数据标准将逐渐被基于关联开放数据的技术所取代。图书馆资源通过关联开放数据融入全球知识网络,显著提升资源的可发现性和互操作性,但图书馆从 MARC 到关联开放数据的转型是一个复杂的多维过程,涉及技术、人员和文化等方面的深刻调整。瑞典国家图书馆和理海大学在实施关联开放数据过 程中遇到了一系列挑战。图书馆社区亟需加强合作,开发更加完善的技术工具,推动关联开 放数据的广泛应用并充分挖掘其潜力。

理海大学图书馆认为从 MARC 到关联开放数据的转型是技术上的挑战,也是人力资源和文化的转型。MARC 作为一种封闭的记录格式,与基于开放语义网的关联开放数据系统有本质区别,这要求图书馆重新设计数据存储系统,并决定是否使用内部或外部的数据存储。像 OCLC WorldCat 这样的数据源并不完全开放,图书馆在访问这些数据时还需应对授权和许可问题。图书馆工作人员需要重新学习关联开放数据相关工具与技术,特别是对 MARC 系统已经非常熟悉的工作人员,适应新的关联开放数据工作流程需要更多的时间和支持。瑞典国家图书馆通过 BIBFRAME标准与FOLIO系统的集成,探索在关联开放数据环境下运行的全新工作流程,涵盖从数据创建、编辑到共享的各个环节。FOLIO 为关联开放数据的实现提供了基础支持,但在数据标准化和自动化流程方面仍有待完善。

研讨会上还讨论了现有关联数据编辑器工具(如FOLIO的Linked Data Editor、Sinopia和 J.Cricket)为关联开放数据实践提供了基本支持,但在用户体验、数据标准兼容性和自动化程度方面仍有较大的改进空间。图书馆面临的核心挑战是如何在现有系统基础上实现关联开放数据的无缝集成,同时确保数据的准确性和完整性。

3.2 合作的图书馆未来

WOLFcon 2024 的讨论揭示了未来图书馆合作模式的核心,将围绕开源技术、联盟共享与数据开放进行深入发展。这种多维度的合作能提升图书馆的运营效率和降低成本,还将大力推动全球知识共享与科学研究的开放性与透明性。

开源项目的持续合作与创新是未来图书馆发展的关键。FOLIO、ReShare、VuFind和GOKb 等项目在提升服务效率、降低技术成本与实现资源共享方面展现了巨大潜力。未来图书馆需 要进一步深化这些项目间的协作,形成更加开放、协作的技术生态系统, 确保不同图书馆间 的信息无缝互通和数据资源共享。这种合作不局限于技术的共建, 还包括项目管理、社区治 理及行业标准的制定,更紧密的开源社区将加速图书馆技术迭代。

图书馆联盟将在未来扮演愈加重要的角色,尤其在资源共享与馆际互借的合作方面。图书馆通过联盟实现跨系统、跨机构的资源共享,有助于本地服务的优化,也能在全球范围内提升服务质量。OpenRS、ReShare等解决方案的应用,表明通过标准化流程与资源共享,联盟能够显著提高运营效率并扩大资源获取渠道。未来的图书馆联盟应进一步采用标准化解决方案,通过技术与资源的共享,确保联盟内部资源的高效流通。

在开放科学与知识共享的框架下,图书馆将成为全球知识基础设施的重要组成部分。图 书馆需与科研机构、政府和国际组织密切合作, 建立开放的数据基础设施,包括开放数据的 存储与管理,以及知识共享政策的制定与执行。通过积极参与全球开放获取与知识共享运动, 图书馆将进一步发挥在数据保存、管理与传播中的核心作用, 提升科学研究成果的可获取性与可重复性。

3.3 智慧的图书馆未来

未来的智慧图书馆将以人工智能为核心,通过大语言模型和开源技术推动知识管理的自

动化。FOLIO 社区和澳大利亚国家图书馆分享在领域做出的积极尝试,展示人工智能在图书馆中的广阔应用前景。

澳大利亚国家图书馆在人工智能方面的工作:(1)数据实验室与 AI 模型:该馆设立了数据实验室,专注于开发与人工智能相关的功能,包括开放模型、文本处理和语音转文本功能。该实验室基于开源框架进行开发,避免依赖专有人工智能模型,主要用于研究探索。(2)利用AI 解锁馆藏:该馆通过人工智能技术处理未转录的口述历史和缺乏描述的历史照片,语音转录和图像识别显著提升了研究人员对这些藏品的访问效率。(3)语义化搜 索与数据分类:Trove 是由澳大利亚国家图书馆维护的免费在线搜索平台,汇集了澳大利亚各地图书馆、大学、博物馆、美术馆和档案馆的丰富藏品,涵盖了报纸、地图、杂志、书籍、图片和音乐等多种内容。目前该馆正在探索利用人工智能实现语义搜索和数据自动分类,来提升用户在 Trove 搜索系统中的信息获取效率。

FOLIO 社区成员(如斯坦福大学图书馆)在元数据生成和实例创建方面展开了初步尝试:(1)通过 ChatGPT 实验生成元数据,并实现SinopiaBIBFRAME到FOLIO Inventory的转换。(2)结合工作流查询,利用 AI 模型与 FOLIO 系统的实例进行匹配和生成,进一 步提升元数据管理和自动化处理的能力。

瑞典国家图书馆利用过 AI 技术对其收藏的超过 500 年的瑞典文本数据进行深入处理 [14],推动了瑞典语言的人工智能研究,成为多个学术领域发展的重要工具。该图书馆收藏了 超过 26PB 的瑞典文本资源,涵盖书籍、报纸、广播、互联网内容、博士论文、明信片、菜单和视频游戏等,全面记录了 500 年来瑞典的文化与历史。KBLab(图书馆数据实验室)基于 NVIDIA DGX系统开发二十余种开源 Transformer模型,每月被 17 万至 20 万名开发 者下载,广泛应用于历史、语言学、媒体研究等人文学科。KBLab 的核心目标是帮助研究人 员创建高度专业化的数据集,以便快速收集与特定历史人物相关的内容,如报纸文章、书籍 和广播内容。KBLab 还与哥本哈根大学合作开发支持语言研究的应用程序,助力瑞典学院现代化瑞典词典的制作方式,为学术和语言研究提供数据驱动的支持。

4 结语

2024 年 IFLA 趋势报告描绘了一幅未来图书馆的蓝图,指出在技术进步与社会发展交汇点上,图书馆将发挥不可替代的作用。例如:(1)图书馆应推动开放获取的出版模式,支持数据公开以促进资源共享,确保数字信息基础设施的开放性与稳定性,防止因商业平台失效而导致的信息丢失。(2)图书馆将构建多方参与的协作模式,发挥连接政府、企业和社区服务的枢纽作用,通过国际间的经验交流推进联合国全球数字契约,实现数字包容。(3)数字素养和人工智能技术的引入将重塑图书馆的服务方式。图书馆需要帮助用户培养信息评估能力,同时利用人工智能实现自动化任务管理,并创新信息交互模式。通过数据驱动决策,图书馆能够精准识别用户需求、优化服务质量并进行有效评估。

WOLFcon 2024 会议为全球图书馆提供了一个开放的交流平台,展示了图书馆在开放科学、跨系统资源共享以及人工智能技术应用等领域的创新进展。会议所倡导的开放、合作与智慧化理念将深刻影响未来图书馆的发展方向。随着开源项目的日益成熟及人工智能技术的广泛应用,图书馆将在知识生产与传播中扮演更加重要的角色。未来图书馆不仅是知识存储的中心,更将成为智能化、全球化的知识服务枢纽,推动全球学术研究和知识共享的进一步发展。通过技术进步与跨国协作,图书馆将为全球知识生态带来前所未有的创新与变革。

(参考文献略)

发表评论

云瀚联盟-智慧图书馆技术应用联盟