康奈尔图书馆FOLIO案例研究

康奈尔图书馆FOLIO案例研究

2022年01期【案例介绍】

作者:Jenn Colt,Debra Howell

编译:嵇婷,张春景

本文选自:Colt, M., & Howell, D. (2021). Cornell Library FOLIO Case Study. International Journal of Librarianship, 6(2), 13-20. https://doi.org/10.23974/ijol.2021.vol6.2.205

导 读

康奈尔大学是一所拥有公共使命的私立大学。在使用了20年Ex Libris的Voyager作为图书馆的集成图书馆系统(ILS)后,康奈尔大学图书馆于2021年7月1日完成了向开源平台FOLIO的迁移。这个案例研究记录了图书馆从选择FOLIO到上线的历程。

一、介绍

康奈尔大学是一所拥有公共使命的私立大学。康奈尔大学的学生人数约为25,000人,是一所私立捐赠大学,是常青藤盟校/古八校的成员,也是纽约州立大学的合作伙伴。康奈尔图书馆秉承康纳尔大学的使命,拥有20个不同的实体和数字图书馆,850万册藏书和170万本电子书,约有400名员工。

在使用Ex Libris公司的图书馆集成系统(ILS)Voyager20年后,2021年7月1日,康奈尔图书馆迁移到新的开源平台FOLIO——Future of libraries is open,意为图书馆的未来是开放的。

通往FOLIO之路

 康奈尔大学在2010年代早期就开始探索替换Voyager系统的选择。由当时的首席技术战略家Dean Krafft领导的一个委员会,与我们在哥伦比亚大学的同事一起分析了可选的ILS环境。这被称为2CUL项目。2CUL还包括其他一些前瞻性的想法,如共享馆藏开发和技术服务整合。我们想要一个能够促进深度合作并能引领新方向的系统。在评估了Alma之后,我们决定避免过度依赖单一的供应商,因此我们开始关注Kuali开放图书馆环境(OLE)。我们认为OLE最契合我们对开源的承诺,以及我们直接参与开发的希望。在我们决定加入Kuali OLE后不久,社区做出了一个重要的决定,从根本上改变项目的方向,停止Kuali平台,重建代码库。这个变更诞生了FOLIO,它是“Future of libraries is open”的缩写。因此,康奈尔图书馆在2016年初开始参与到FOLIO社区。

Jason Kovari(编目与元数据服务主任)指出:“我们决定实施OLE是因为我们对开源有信心。我们厌倦了与供应商绑定在一起,更厌倦了在系统开发中缺乏代理,这对实现图书馆的功能至关重要。而且,我们认为这是支持一个不断发展的系统的一种手段和方法,该系统将随着我们的需求而发展。FOLIO就是建立在这种理念之上的。我们不是因为为任何一组具体的功能而去实施FOLIO;相反地,我们选择FOLIO的原因是我们能决定开发的方向和拥有一个非常优秀的同行社区。”

FOLIO提出后不久,康奈尔大学就开始贡献人力、物力和财力来帮助FOLIO的建立。我们持续努力发展和实施FOLIO的最大因素包括:开放获取的愿景、微服务架构、核心的图书馆管理功能、批量生产流程、能够访问和修改源代码、多种元数据选项(MARC、非MARC,关联数据等),以及电子资源管理(ERM)功能的集成。

二、实施

经过几年的FOLIO开发,2019年康奈尔大学成立了一个团队来管理FOLIO的实施,目标是在2020年7月上线。我们组建了一个实施团队,成员来自图书馆各个关键部分,包括:报告、财务、元数据管理、访问服务、用户测试、采访、丛书处理、编目、电子资源管理(ERM)、培训、基础设施、集成、发现和数据迁移。除了这些领域的“引领”之外,许多图书馆工作人员成为主题专家(SME),帮助培训,或参加FOLIO社区特别兴趣小组(SIGs)。图书馆还聘请了一名信息技术项目经理来领导这个项目。

我们需要做的第一个决定就是决定是否与供应商签订托管合同还是我们自己管理FOLIO。在适当的资源条件下,图书馆可以自己管理、维护和升级FOLIO。然而,很明显,我们没有足够的人员来自行管理。经过多方分析,康奈尔大学选择了EBSCO提供托管和迁移服务。EBSCO的实施顾问是我们迁移和实施过程中宝贵的合作伙伴。FOLIO最大的好处之一是,它可以通过设置完全定制,而FOLIO最困难的事情之一也是它可以通过设置完全定制。实施顾问在整个过程中提供了支持、指导和解决方案,帮助我们选择最适合我们操作的功能、设置和选项。

实施一个处于开发中的系统需要应对特有的一系列的挑战。系统实施是否成功依赖于FOLIO的发展是否保持正轨。2019年12月,我们意识到,需要评估2020年7月上线FOLIO的可能性。FOLIO开发使用Jira来跟踪所有开放的功能特性(features),因此我们创建了一个Jira仪表盘,它对管理我们的实施至关重要。Jira仪表盘显示了我们在上线时、上线后一季度、上线后两季度时需要的功能排名。为了评估我们在2020年7月上线的决定,我们遍历了上线时需要的所有功能排名,并决定它们是否是必需功能,还是短期内可不上的功能,或者是可用其他方案代替的功能。我们的指导原则是我们可以处理涉及图书馆工作人员方面的一些难点,但所有面向用户的功能必须正常工作。2019年12月,我们确定了2020年7月之前有22项无法提供的必备功能,因此决定推迟一年至2021年7月上线。

与此同时,康奈尔还将ERM系统从ProQuest Intota迁移到了FOLIO ERM。这个项目由康奈尔的Peter McCracken(采访和电子资源战略图书馆员)和主题专家(SME)Emma Raub(电子资源图书馆员)主持。这个项目能够继续推进的原因是它是完全独立的,而当条件成熟时,它可以被完全整合到FOLIO中。2020年1月,康奈尔成功实施了FOLIO ERM。 

在决定将上线推迟到2021年之后,我们集中精力解决这些必备功能项。许多必备功能都在FOLIO计划的开发中。我们密切跟踪这些功能特性,如果需要重新排序这些功能,我们就会指出它们的重要性。对于其他的必需功能项,我们会开拓思路找一些其他的方法。我们与芝加哥大学、德克萨斯农工大学和杜克大学合作,开发了在线计算机图书馆中心(OCLC)-单记录-导入功能。我们承担了会计系统自动输入和流通日志自动导出功能,并将代码贡献给了FOLIO社区。

康奈尔图书馆已经定制集成了许多其他应用程序,包括:

其中许多集成功能需要开发。有些是由FOLIO项目开发的,有些是由供应商开发的,还有一些是内部开发的。我们分配了大量的时间来测试系统的集成。然而,我们计划上线的FOLIO发布版本推迟了两个月。这给我们留下了大约三周的时间来完成集成并测试它们。因此,当我们进行系统切割时,一些集成组件不能工作。例如,BorrowDirect适用于借书,但不适用于还书。我们在上线后的几周内完成了集成工作。

2020年3月,全球新冠疫情让大多数图书馆员工在接下来的一年里只得呆在家中。FOLIO的其余实施工作和上线切割将远程进行,或者在某些情况下,在混合环境中进行。因为FOLIO是一个全球社区,在很多情况下,我们已经习惯了远程工作。其他方面,例如员工培训与参与方面,我们也深刻地感受到了影响。

考虑到我们大部分的培训是线上进行的,从2021年2月开始,我们开始了一种分层的培训方法,为上线做准备。作为每个发布周期的一部分,FOLIO开发社区会举办一次捉虫大会(Bug Fest)。在捉虫大会期间,对发布的所有特性功能进行测试。康奈尔将捉虫大会作为一种让员工参与FOLIO的方式。许多早期的捉虫大会测试人员已经成为我们的FOLIO主题专家,他们帮助图书馆中的其他人解决问题。我们创建了一个培训团队,负责进行FOLIO演示和举办特定功能的培训课程,由于疫情,所有这些都必须通过Zoom完成。每个环节都进行了记录并在网上提供。我们创建了包含常见问题和趣闻趣事的Confluence 网页,并每周发送电子邮件传递项目新闻和培训信息。最后,我们决定在上线前10天停止大多数流通功能,让Access Services的工作人员有机会休息,并不断进行FOLIO培训。

数据迁移

在康奈尔大学开始使用FOLIO的两年前,数据迁移工作就开始了。我们采取了一个团队导向的方法,数据迁移作为康奈尔更大的实施团队的一部分。有两名程序员也在数据迁移团队工作,一名专注于书目数据,另一名专注于采访、用户和流通数据。因为康奈尔与EBSCO合作,他们作为托管商使我们能够专注于从Voyager提取数据映射到FOLIO,而EBSCO则负责将数据加载到FOLIO这一过程,因为他们能更有效的直接访问数据库。

下面列出了我们在项目的数据迁移工作中的一些经验与教训。

从清理数据开始

在迁移过程初期,图书馆技术服务部门的一个小组负责开始进行数据清理工作。该小组专注于清理书目、馆藏和条目记录。由于FOLIO在典藏中有一个分面导航和检索系统,因此清理书目和馆藏数据以增强其检索能力以及改善其在FOLIO典藏中的展现能力是很重要的。

书目信息是需要清理的最大的数据池,其他领域也有相应工作。财务部门简化了图书馆的资金结构,公共服务部门简化了流通规则,采购部门清理了不必要的采购订单。这些清理工作带来了更多的收益和机会。例如,作为财务清理的一部分,将单个基金合并到团队基金中,使得CUL在移动分配方面具有了更大的灵活性。

与数据用户密切合作

康奈尔大学的数据迁移团队定期与图书馆的各个部门会面,了解他们的工作。虽然用户体验可能看起来不像是数据迁移的一部分,但深入研究使用数据的人员的工作流和行为,就可以做出关于数据应该如何在FOLIO框架下迁移的明智决定。

理解由数据支撑的工作流有助于确定以何种形式迁移哪些数据。通过与用户广泛接触,我们也鼓励他们探索FOLIO。我们帮助他们了解在新系统中他们的工作将会是什么样子,这样他们就可以向我们提供基于数据需求的更多更好的信息。

除了揭示哪些数据需要迁移以及迁移到哪里之外,我们还与用户讨论了哪些数据不需要迁移。例如,在采访中,我们决定不迁移已关闭的购买订单,这减少了需要迁移的数据量,并减少了所需的清理量。在流通数据方面,我们只迁移开放借阅以及涉及罚款和费用的借阅数据。

因为FOLIO的流通规则将会大大简化Voyager中的规则,迁移团队还研究了在迁移期间如何更改构成流通规则的数据碎片(如借阅政策和条目类型),以使FOLIO流通规则起作用。

在这项工作的过程中,参与FOLIO社区也是非常有必要的。我们参加了数据迁移特别兴趣小组,并组织了几次与其他从Voyager迁移到FOLIO的图书馆的对话。FOLIO社区是我们数据迁移成功的关键支撑,就如同它在项目中的其他领域一样。

文档数据映射

数据迁移自然需要大量的文档。我们创建了从Voyager迁移数据到FOLIO的数据映射电子表格。

我们在FOLIO中保存了每个实体的电子表格,然后将数据元素从Voyager字段映射到FOLIO字段。我们还记录了如何从Voyager中提取每个数据点。这是必要的,因为虽然FOLIO中的一些字段是一个实体的一部分,但它们是从Voyager中的多个实体中提取的。还有一些字段在Voyager中根本不存在,因此它们的内容必须基于Voyager中的各种数据点来推断,以便映射到FOLIO中。

做好多次迭代的迁移计划

我们在上线前几个月就开始测试将数据迁移到FOLIO。这样做可以让我们发现遗漏的数据问题。将我们自己的数据迁移到FOLIO也是帮助员工了解FOLIO的关键一步,因为他们能看到数据中的漏洞或问题。

当托管商为我们的员工配置了可以访问的沙盒系统,我们就将数据加载到沙盒中,然后让员工进行测试和检查,并给予我们反馈。虽然我们自己的报告和日志让我们了解数据中的模式和问题,但实际用户对数据的手工检查在发现忽略问题和在初始映射中发现数据点是极其有用的。

提供迁移的报告和日志记录

EBSCO为我们提供了每次迁移迭代的报告,这让我们能够在出现问题时进行修复。日志记录需要包含允许用户提取、转换和加载过程的跟踪数据信息。我们确保在FOLIO的所有数据中嵌入来自Voyager的标识符,这样我们既可以维护数据之间的关系,也可以跟踪可能发生的问题。

每次迁移迭代都会产生大量需要分析和处理的数据然后进行评估。有时日志所显示的FOLIO软件中的bug需要向FOLIO社区报告和处理。有时,日志记录会指出Voyager数据中存在的问题,需要加以纠正。还有一些情况,FOLIO所需的数据点Voyager没有提供便需要特别为迁移生成。在某些区域,当Voyager没有提供所需的数据点时,需要设置字段的默认值。

仔细计划系统切割前的日子

迭代迁移过程让我们有机会计算将数据加载到FOLIO所需的时间。这帮助我们计划停用Voyager和开启FOLIO之间的时间间隔。我们创建了一个操作顺序,它告诉我们在转换期间各种类型的数据何时加载,并确保在我们开放新系统给员工和公众使用之前,将这些数据准备到位。一些数据迁移工作甚至在上线后仍在继续,特别是那些不属于流通或发现的数据。

在FOLIO上线后,我们花了大约6周时间继续迁移和清理数据。当时我们的数据迁移已经成功了,但可以继续在FOLIO中优化我们的数据。我们的方法包括仔细倾听FOLIO用户的需求,仔细考虑Voyager和FOLIO数据模型之间的差异,以及与我们的托管商合作。

三、项目管理的挑战和建议

在实施开源系统时,沟通是最重要的项目管理工具;尤其是一个仍在发展和进化中的系统。有必要在无条件支撑项目和不要带来太多负面作用之间取得平衡。康奈尔大学实施项目负责人每月举行一次“FOLIO周五”会议,包括项目更新、时间表和提问环节。我们发现,工作人员更加欢迎对项目健康状况的诚实评估,以及那些受影响领域的事实细节。

此外,有效的风险管理是必不可少。你可能会觉得自己在不断地灭火。然而,这是管理实施仍在开发中的系统所不可避免的。使用一特性列表和需求列表来进行差距分析是不可能的。FOLIO实现是一个大型的、复杂的项目,有很多变动的部分。根据我们的经验,我们建议培育一种去中心化但统一的方法。我们为每个功能领域确定了一个引领者,项目负责人必须相信每个领域的引领者都为康奈尔大学和社区做出了最好的决定,并且会提出每个重大问题。

上线

2021年7月1日上线前的几周是一片混乱。几个问题特性处于无法上线发布的边缘,员工们对超过一年的疫情感到疲劳,对ILS的切割排在最高优先级有一定的情绪,而和康纳尔一样原计划同时上线的大型图书馆都推迟了上线。实施小组不断对项目进行重新评估,图书馆执行小组评估项目影响,并给予了持续的指导和领导。

一个接一个地,我们解决了一项项关键问题,完成了集成和数据迁移。我们通过Zoom会议、电子邮件和康奈尔图书馆Slack频道与图书馆工作人员保持着持续的沟通。

图书馆完成向FOLIO的变迁不仅是康奈尔大学的一个里程碑,也是全球图书馆社区的一个里程碑。康奈尔大学是世界上第一个使用FOLIO的大型研究图书馆,其他图书馆正在从我们的经验中学习。在实现这种规模和复杂性的软件系统时,我们获得了非常流畅的上线体验。这要归功于图书馆各个部门的工作人员的奉献。

上线之后

上线后,我们专注于保持员工士气,并确保所有面向用户的功能正常运行。我们理解、接受并交流我们的系统切割使得一些员工的职能将会受到影响。例如,在上线后,技术服务人员报告说,他们的工作效率约为20%。几周后,这个比例上升到40%。我们预计今年剩下的两个FOLIO版本将会在功能和生产力上有一个剧增。

我们在“已知问题和状态”Confluence页面上跟踪所有的bug和功能缺陷,所有工作人员都能访问到,这样才能继续保持透明度。实施团队正在减少,但仍继续举办每周的会议,让工作人员询问有关FOLIO的问题。我们的康奈尔图书馆Slack频道已经成为图书馆工作人员发布问题和接受同事帮助的一个充满活力的地方。

上线后我们对实施过程中的反思主要要点有:透明沟通的重要性,灵活与迭代的重要性,以及让所有员工参与到过程中的价值。

截至2021年11月,康奈尔大学仍在运行FOLIO Iris版,这是我们7月上线的版本。如果测试显示没有关键的功能bug,我们会升级到FOLIO未来发布后的各版本。

开源图书馆平台的可持续性

负责信息技术的大学图书馆副馆长Simeon Warner说,社区支持和合作对图书馆来说比以往任何时候都重要,特别是在共享日益增长的电子资源方面。“像康奈尔这样的图书馆从来都不是单独运作的,认识这点很重要,”他说,“现在,FOLIO为我们提供了一个基础,以图书馆合作的方式向前迈进——这令人兴奋。”

随着FOLIO与我们一起成长和发展,我们可能永远不会迁移到另一个ILS。

参考文献(略)

关于作者:

Jenn Colt是康奈尔大学图书馆技术服务自动化与元数据系统负责人,已在图书馆工作了超过15年,担任各种IT和元数据角色,长期以来一直致力于提高用户的发现能力,并使开源软件社区更吸引用户。

Debra Howell是康奈尔大学大学图书馆的IT运营总监,拥有超过20年的信息技术所有领域的项目管理和战略指导经验。她是经过认证的项目管理专业人士(PMP),是康奈尔大学FOLIO实施项目负责人,同时也是是国防部长办公室认证的培训师,并担任纽约州美国教育委员会妇女网络理事会信息官。

发表评论

云瀚联盟-智慧图书馆技术应用联盟(筹)