
NISO发布《生成式人工智能与网络级发现服务》调研报告
2025年08期【本期推荐】
文章编译自:https://www.niso.org/press-releases/niso-open-discovery-initiative-publishes-results-survey-ai-and-discovery-systems

2025年8月,美国国家信息标准组织(NISO)正式发布题为《生成式人工智能与网络级发现服务》(Generative Artificial Intelligence and Web-Scale Discovery)的调查报告。该报告呈现了2024年NISO开放发现计划(Open Discovery Initiative,ODI)常设委员会开展的“AI在图书馆网络级发现服务中的应用”调研成果。
图书馆网络级发现服务基于索引检索系统,包含出版商提供的全文,以及第三方文摘、索引服务及出版商自身提供的元数据。其主要内容来源为期刊、电子书及其他学术类电子资源,涵盖商业数据库、开放获取资源、机构知识库等多种信息提供商及产品。ODI通过制定NISO实践标准,致力于提升网络级发现服务各参与方——图书馆、内容提供商和发现服务提供商——之间的透明度。
2020年,ODI最新一次更新了其推荐的实践标准《促进发现服务透明度》(Promoting Transparency in Discovery,RP-19-2020),时隔五年,生成式人工智能(Generative AI)工具的崛起与爆发式增长,为网络级发现服务及学术资源传递机制带来全新命题。ODI希望深入了解图书馆、内容提供商和发现服务提供商对这一新兴技术所关切的问题。为此,ODI于2024年9月下旬启动专项调研,以探析网络级发现服务生态系统中各参与方的期待与担忧。这份报告包含了此次调查的结果,以及 ODI为此而将开展的具体工作。
本文根据原调研报告节选编译而成,重点呈现研究问题与关键结论,特别介绍针对图书馆受访者的专项问题,旨在为行业实践者提供决策参考与行动启示。
研究问题
此次调研创建了针对三方受访群的在线问卷调查:图书馆、内容提供商以及发现服务提供商。所有受访者都能看到相同的初始问题和结束问题。
初始问题要求受访者提供组织名称及其在该组织中的角色。为了衡量受访者对AI工具的熟悉程度,受访者须回答使用生成式AI工具的频率。随后,受访者选择其所属的群体:图书馆、内容提供商、发现服务提供商,还是其他。
针对各群体的具体问题包括:
- 其所在机构是否已开始研究将生成式AI工具应用于自身提供或授权的发现服务中
- 对AI驱动的发现服务可能带来的一系列益处进行优先级排序
- 对AI驱动的发现服务可能产生的一系列负面影响进行危害等级评估
- 对三项AI驱动的发现服务功能对其机构员工和用户的价值评估问题
- 其所在机构是否已就生成式AI工具的使用,对内(员工)和对外(用户)提供了指导规范
- ODI在确保生成式AI用于发现服务中的透明度与效力方面应发挥何种作用
- 对生成式AI驱动的发现服务的最大期望和最深担忧(开放式问题)
关键结论
此次调研共发放236份问卷,绝大多数(72%)受访者来源于图书馆机构。内容提供商约占受访者的五分之一(18.2%)。仅有23名(9.8%)受访者选择了“其他”或“发现服务提供商”选项,在“发现服务提供商”的9份回复中,只有4份回答了具体的详细问题。由于样本量过小,未对其反馈进行单独分类分析。通过数据分析,得出以下关键结论。
- 图书馆和内容提供商的受访者对生成式AI在内容发现中的应用持有一些共同的期望。三大共同期望包括:提高内容的可见性、更精准的内容推荐以及节省员工时间。
- 不同群体对风险的担忧呈现显著差异,其关注点往往与自身利益密切相关。
图书馆受访者最担忧的三大问题:(1)内容被篡改或捏造;(2)输入数据缺乏透明度;(3)AI生成摘要的质量问题。
内容提供商受访者最担忧的三大问题:(1)版权侵权问题;(2)内容被篡改或捏造;(3)输入数据缺乏透明度。
- 图书馆受访者普遍认为,生成式AI工具将提升网络级发现服务对用户和馆员的价值,尽管展现这一积极态度的并非压倒性多数。
- 内容提供商受访者对生成式AI的影响持审慎乐观态度:多数情况下期待其能提升自身内容的可见度,但对改善内容可及性的效果则持相对保留态度。
- 图书馆受访者尤其担心,生成式AI模型的开发和查询处理需要大量数据中心支持,这可能带来环境问题。
图书馆受访者的专项问题
01 对生成式AI工具的研究
问卷向图书馆受访者询问是否已开始研究其订阅的发现服务中的生成式AI功能。超过三分之二(69%)的受访者给出了肯定回答。
02 对生成式AI应用于发现服务的期望
受访者对生成式AI在发现服务中可能带来的7项优势功能按需求程度进行排序(1为最期望,依次递减),受访者需要至少对5个选项进行排序,但并非所有人都完成了全部排序。表1显示了每个选项的综合评分,前五项最多选择的功能以白色背景显示,根据计分原则,分数越低表示需求程度越高。
表1 图书馆对AI在发现服务中的期望功能汇总

在填写“其他”选项的受访者中,其关于生成式AI在检索应用的期望可归纳为四大类:检索功能优化、内容生成、伦理考量,以及对生成式AI检索应用的悲观预期。其中,填写数量最多的期望功能为内容生成,受访者表达了以下期望:超越简单摘要的优质内容综合能力、促进用户头脑风暴和提升创造力、即时外语翻译能力以及内容推荐等。
在搜索改进方面的期望包括:为用户提供搜索策略辅助、避免AI幻觉产生的错误信息、采用更接近自然对话的友好界面、增强发现和检索结果间关联的能力,以及实现可实时调整搜索策略的迭代式检索流程。
有一条评论涉及伦理考量,强调了透明度的重要性;另有两位评论者认为AI不应被应用于发现服务。
03 对生成式AI应用于发现服务的担忧
受访者需对发现服务中生成式AI可能带来的10项潜在负面影响,按照担忧程度从高到低进行排序(1表示最担忧,依次递减)。表2显示了每个选项的综合评分,分数越低表示担忧程度越高,计分规则同表1。
表2 图书馆对AI在发现系统中的主要担忧汇总

在19条标记为“其他”并附有相应评论的回复中,主要涉及以下四个方面:环境问题、对用户的负面影响、搜索结果的错误和/或不精确性,以及经济成本。
最主要的担忧集中在AI应用相关的环境问题上。7位受访者担心运行AI所需的计算能力会加剧环境问题,其中一位特别提到了气候变化问题。另一个频繁提及的担忧是AI在发现服务中可能对用户(特别是学生)产生的负面影响,包括阻碍学生发展批判性思维能力和构建自己的检索策略,以及用户可能因对AI技术理解不足而无法有效使用AI增强的发现系统。
其他受访者则表达了对搜索结果不准确的忧虑,包括引用信息不精确、结果与用户查询相关性不足,以及搜索结果可能存在偏见等问题。还有受访者指出,出版商有时会限制其内容在检索系统中进行AI处理,经济成本也被指出是AI应用于发现系统的潜在担忧。
04 生成式AI功能对馆员与用户的价值评估
为探究图书馆受访者如何评估生成式AI技术对馆员和终端用户的不同价值,本研究分别就三项生成式AI功能服务展开调研:要求受访者评估每项服务为馆员和用户创造价值的预期影响。
结果显示,图书馆受访者普遍表现出更强的信心,认为这三项指定的生成式AI功能对终端用户的价值提升幅度将大于对馆员的价值提升;相应地,他们也认为这三项功能对馆员价值的降低程度将大于对终端用户的降低程度。
表3 图书馆受访者价值评估分析

05 在科研中使用生成式AI工具的信息资源
调研组向受访者提出以下问题:“贵馆是否为用户提供了关于如何在科研中使用生成式AI工具的信息资源?”(参见表4)。针对回答“是”的受访者,进一步要求他们从建议主题列表中选择这些信息资源所包含的内容(参见表5)。
表4 是否提供使用生成式AI工具的信息资源?

表5 AI原则/政策声明涉及内容(可多选)

06 是否明确禁止AI爬虫抓取其内容?
调研组向受访者询问:“贵机构是否明确禁止为网络搜索和/或生成式AI大语言模型(LLM)开发而抓取您的内容?”表6汇总了相关答复。
表6 是否明确禁止爬虫抓取内容

07 图书馆受访者对ODI的行动建议
该问题旨在了解受访者对ODI应参与的行动领域的期望,具体为:“您对ODI在确保发现服务中生成式AI的透明度和有效使用方面有何期待?ODI应在以哪些领域推动透明度建设?”调研结果汇总见表7。
表7 ODI应在以下领域推动透明度建设(可多选)

ODI行动指南
调查结果显示,生成式AI在网络级发现服务的应用既展现出令人期待的可能性,也引发了合理的担忧。具体而言,一方面期待这项新技术能够革新既有的实践体系、重塑科研工作环境、改进传统研究方法,另一方面也对这些变革可能带来的不确定性深表关切。
正如这项技术本身尚处于发展初期,行业对其的应对也仍在探索期。为了更好地理解并适应生成式AI在发现服务中的应用,许多受访者明确表示,希望更清晰地了解其具体应用场景和运作机制,这正是ODI的传统工作范畴,也为推动新时代发现服务的透明度工作指明方向。即便技术日新月异,厘清其“基本运行规则”仍至关重要。
基于调研结果及ODI常设委员会的讨论,NISO ODI计划将在以下领域推进工作:
- 成果传播与反馈征集:通过学术会议演讲及NISO网络研讨会公布研究发现,并邀请业界对结果提出反馈;
- 开发透明度指南:制定一份或多份指导文件,促进图书馆、内容提供商与发现服务商之间关于生成式AI应用的透明度;
- 利益相关方持续协作:围绕内容提供商与图书馆的共同关切与交叉诉求展开进一步探讨,深化合作领域。