上海图书馆AI兴趣小组探索与实践:AI赋能图书馆的问题与前景——“智慧图书馆技术应用讲座”2024年第7期(总第33期)
8月30日上午10点,2024年第7期云瀚“智慧图书馆技术应用讲座”成功举办。本期讲座是图书馆3.0应用研讨系列之一,主题为“上海图书馆AI兴趣小组探索与实践——AI赋能图书馆的问题与前景”。本期讲座采用视频播客形式呈现,邀请了上海图书馆副馆长刘炜、上海图书馆系统网络中心副主任张磊、资深工程师陈晓扬三位专家,以及来自上海图书馆AI兴趣小组的国外大模型研究(API应用探索)组组长蔡丹丹、本地化大模型应用实践组组长王诗卉、AI应用数据准备组组长刘倩倩、领域应用需求调研组组长嵇婷、AI多模态应用组组长周江纯5位老师深入探讨了人工智能与大模型应用的话题。讲座推出后,反响热烈,约1500人收看了直播。
上海图书馆AI兴趣小组自去年5月份成立以来围绕大模型相关技术与实践进行了一系列探索。5位小组长分别分享了小组的工作进展和实践成果,内容涵盖了国外大模型研究、本地化部署、AI数据应用准备、领域应用需求调研以及AI多模态应用等多个方面。张磊主任和刘炜副馆长随后进行了补充交流。
上海图书馆AI兴趣小组
1.国外大模型研究(API应用探索): 专注于追踪新技术的发展动态,旨在提升技术理解,并基于理论研究,探索与业务流程相契合的应用落地路径。
2. 本地化大模型应用实践小组:致力于探索和实践图书馆定制化大模型应用的落地。
3. AI应用数据准备小组:负责收集和整理图书馆及相关领域的原始文本数据和语料库,以支持模型的训练和应用,并根据项目需要进行数据的准备和处理。
4. 领域应用需求调研小组:主要任务是调研和整理以大模型为代表的生成式AI在图书馆领域的应用需求。
5. AI多模态应用小组:目标是探索文本、图像、音频、视频等各种多模态大模型在图书馆业务中的应用实施。
话题研讨
讲座随后围绕“如何评估AI当前的技术发展及应用阶段?”“如何评价图书馆行业智慧化转型现状?图书馆在数字化、智慧化转型中有哪些优势和挑战?”以及“AI时代图书馆的岗位设置和馆员技能如何满足新的需求?”三个主题进行了深度探讨。
陈晓扬老师从模型、应用、研发三个角度介绍了当前AI技术的进展。陈老师探讨了AI技术在算力、算法和数据三大要素上的发展现状,分享了AI这一年的应用进展。陈老师表示,这一年,尽管对话问答、AI搜索成为风潮,但行业内仍在期待一个突破性的“杀手级”应用;开发方面,模型框架和应用模式层出不穷,但尚未成型。蔡丹丹、王诗卉老师补充分享了观点。
在探讨图书馆行业智慧化转型的议题中,张磊老师深入分析了图书馆在数字化和智慧化转型过程中所遭遇的挑战,包括IT基础设施的现代化、图书馆信息系统的集成化,以及数字资源服务的多元化和个性化。他强调了人工智能等前沿技术在促进图书馆服务模式创新中的作用,并指出AI技术在提供参考咨询等读者服务方面取得了初步成果,但图书馆仍需深化AI与业务流程的融合,实现服务创新的潜力。嘉宾们随后讨论了当前在AI实践中遇到的挑战,比如数据整合、数据治理、应用落地场景等问题,但同时也展望了AI技术在未来图书馆服务以及后台业务流程中的潜力。刘倩倩、嵇婷等老师补充分享了观点。
在讨论AI时代图书馆岗位设置和技能需求的议题中,刘炜副馆长提出了图书馆行业可能面临的颠覆性变化,其中公共图书馆和高校图书馆将面临不同的趋势性特点。未来随着智能化的发展,图书馆如果不能跟上生态变化和读者需求变化,将不再承担知识交流、信息交流的职能,逐渐边缘化,而成为一个纸媒载体的“博物馆”。图书馆未来在消除信息鸿沟、提升公众信息素养方面的价值将越来越得到体现。刘馆长提出了“图书馆员的五级素养体系”,以及图书馆业务流程可能向更加扁平化、以用户需求为中心的方向发展的趋势。周江纯、张磊老师补充了观点。
互动答疑
在互动答疑环节,线上老师积极提问,交流互动摘记如下。
问:在大量投入经费设备和算力提升后,产出是否有质量评估分级体制?训练时使用大量图片文本,可能涉及的知识产权保护有无双赢策略?
刘炜:目前图书馆行业在AI技术应用方面仍处于学习和跟踪阶段,尚未形成成熟的质量评估体系。我们目前正在尝试进行一些试验性开发和测试,以评估不同技术路线的效果。我们打算在即将到来的数字人文年会上提交一套评估体系,旨在专门评测适用于中文人文社会科学研究的大型模型性能。知识产权在大模型时代面临严峻挑战,传统版权架构正经历转型。我预见,版权制度将随着数字时代的利益再分配而演变。人工智能大模型的效益巨大,它们将推动生产关系的变革。我认为应以开放心态看待版权问题,新技术的发展将促成版权制度的适应性变化。
问:有什么古籍文献AI 方面的先进的应用案例?
陈晓扬:作为专注于数字人文领域的公司,我们一直在探索如何利用AI大模型提升产品和服务。自去年以来,我们尝试开发了多种AI应用,特别是与古籍相关的项目。我们与上海图书馆合作,开发了AI插件,实现文白翻译和实体提取等功能。今年,我们进一步利用AI大模型生成古籍数字应用,动态创建AI数据和摘要。目前,我们正致力于古籍智慧检索的开发,整合书目信息和全文数据,利用规范库作为背景知识增强大模型的输出能力,以更好地响应用户查询。同时,我们也在探索使用多模态大模型进行古籍OCR识别,尽管该技术仍在发展中,但我们期望未来能在这方面取得突破。
课件下载