
图书馆智慧媒资管理与服务: 广州图书馆的实践探索与未来展望
2025年10期【行业交流】
供稿:曾洁(广州图书馆)
编者按:广州图书馆申报的“广州图书馆智慧媒资管理和服务平台建设”案例,在“第一届智慧图书馆技术应用创新实践案例征集活动”中荣获“最佳管理创新案例”。该案例针对媒资资源管理痛点,构建智慧化的媒资资源知识组织与管理体系,为推动图书馆优质数据资源建设、深化资源智慧化管理与应用提供了新的路径。下文节选自根据该案例撰写的论文《图书馆智慧媒资管理和服务的实践与展望:广州经验与“十五五”深化路径》。
建设背景
广州图书馆广州纪录片研究展示中心(以下简称“纪录片中心”)是国内第一家设立在公共图书馆致力于纪录片收藏、整理、展示、研究、服务的公共文化平台,于2018年12月正式对公众开放。自开放以来,纪录片中心在馆藏和服务方面不断探索和实践,社会效益显著,2020年,广州图书馆被中国(广州)国际纪录片节组委会评为“中国十大纪录片推动者”。纪录片中心的大部分纪录片馆藏资源以DVD光盘为主要载体,另有一部分资源以数字格式存储在移动硬盘和服务器,因“物理光盘 + 移动存储 + 服务器”的混合存储模式,未形成全面的异地备份机制,所以任一载体出现问题,均可能导致数据丢失,加之介质格式和内容编目不统一,不利于资源的管理和开发利用。因此,建设专门的媒资管理和服务平台对纪录片中心馆藏资源的管理和应用尤为关键。
2021年,在国家大力实施公共文化数字化和智慧图书馆建设的背景下,广州图书馆抓住全国智慧图书馆体系建设机遇,历时三年建设完成智慧媒资管理和服务平台(以下简称“媒资平台”)。此平台基于智能技术深度挖掘包括视频、图片、文字在内的多媒体资源价值,满足读者通过多应用终端检索和浏览纪录片等多媒体文献资源的需求,为向公众提供优质、高效、精准的纪录片等视听资源服务奠定了坚实的基础,推动图书馆向精准满足用户信息利用的多元化需求的知识服务转型。
建设目标
广州图书馆智慧媒资管理与服务平台建设,旨在通过智能技术推动图书馆从传统的媒资仓储向知识服务中心转型。该平台通过建立涵盖元数据与版权信息的规范化治理体系,解决异构、多源媒体资源的统一管理问题,依托人脸、语音及文字识别的多模态人工智能技术,对媒资进行自动分析与语义提取,实现精准的自动化标引;对标引后的资源进行基于语义的聚类与专题重组,形成结构化的知识体系,从而实现对隐性知识的显性化揭示与主动服务,赋能媒资管理流程的智能化变革。
建设内容
1、采取超融合架构,适配高效处理媒资综合业务的需求
为构建面向媒资高效管理与智慧应用的综合平台,本系统采用超融合基础架构作为核心支撑,以媒体内容资源、元数据信息、业务缓存文件(如在线预览而生成的低码率文件、用户浏览素材列表时看到的缩略图)为关键数据对象,通过底层统一的数据存储机制与灵活的资源编排策略,实现了在数据层面上对媒体存储、内容生产与发布全流程的有力保障。该设计不仅能够有效支撑系统在资源规模与业务负载两方面的弹性扩展需求,也为未来媒资业务形态的持续创新与功能拓展奠定了基础。
本平台旨在构建一个集软件应用层、平台服务层与基础资源层于一体的智能化媒资管理体系(见图1),并通过“平台 + 工具 + 服务”三位一体的技术架构,灵活整合多种功能组件与服务模块,以更好地适配并响应多种媒体业务场景与运行需求。超融合架构数据引擎层可适应不同类型元数据的文档数据库、关系数据库、内存数据库以及图数据库。平台可通过开放接口,为不同业务应用提供标准化的应用工具和服务,开放接口层,对外提供统一的应用程序编程接口及软件开发工具包,便于系统各种业务应用的顺利接入。

图1 平台框架设计
2、突破媒体介质局限性,解决不同格式资源采集和存储问题
媒资平台具备对多种存储介质(如光盘、网络磁盘、移动硬盘及本地硬盘等)中所存媒体资源(涵盖视频、音频、图像与各类文档)的采集能力,此类资源可作为标签标引建设的基础素材。在采集过程中,平台会同时提取媒资所包含的元数据描述信息及其原生EXIF信息,并将这些数据完整存储至系统数据库中。与此同时,采集流程还将自动启动视频质量检测机制,该机制能够有效识别媒体文件中可能存在的黑场、静帧、彩条等因文件损坏导致的异常现象,并对检测出的各类质量问题做出明确标记。
在视频格式兼容性方面,该平台不仅能够处理VOB、DAT等常见于光盘载体的专有文件类型,还可支持WMV、MP4、MPG等广泛使用的数字视频格式。同时,系统也具备对MOV、AVI、MXF等专业级视频的良好适配能力,并可兼容 4K、8K级别的超高清视频资源。在采集过程中,平台可自动生成高、低两种码率的素材文件:高码率版本适用于长期归档保存;低码率副本则用于支持用户的编目检索与预览操作。从资源采集上载到最终发布的全流程自动化管理,不仅可有效节省管理成本、人力成本与时间成本,还能较好地保障资源存储的安全性。
3、智能生成标签标引,实现对媒资内容的精细化检索
标签标引是媒资平台的核心功能,利用语音识别、文字识别、人脸识别等智能技术,对视频内容中的人物、机构、地点等进行智能识别分析并生成标签,通过抽取关键词来对标签进行标引(见图2)。语音识别功能模块首先对视频内音频实施连续语音转写,将其转化为文本数据并进行语义理解分析,进而自动提取生成关键词、标记出入点位置、创建内容摘要以及完成智能分类等关联信息。目前,该系统可支持普通话与粤语两种方言的语音转译。文字识别功能模块针对视频帧或图像中的文本区域进行检测与解析,所获结果不仅包含视觉媒体内嵌的文字内容,还可捕获字符所在位置的坐标数据,识别信息能够以文本内容或时码标识两种形态输出。

图2 智能分析生成标签标引页面
人脸识别功能模块首先是通过构建人脸特征模型形成标准化人脸数据库,在媒体素材入库过程中,系统调用AI大数据平台的分析引擎,随后在内容库预览界面中将素材内检测到的人脸与库中记录进行自动化比对匹配,同时对人物出现的相应关键帧加以提示,从而实现对视频画面内特定个体面部位置的标引与注释(见图3)。

图3 人脸识别功能页面
经由语音、文字及人脸识别所生成的结构化数据,允许馆员根据需要进行人工校正,修正后的结果将作为样本自动回传至数据处理流程中。在数据结构设计上,每个标签可关联多组入点和出点信息,这些信息能够以时码区段的方式呈现。当用户检索到目标视频资源后,可借助时码定位迅速跳转至指定画面帧,从而实现基于智能标引的视频内容的精细化检索与浏览。例如,馆员要对视频资源进行汇编剪辑,就可通过智能标引来提升工作效率。
4、融合编目规则,解决视听资源著录不统一问题
因纪录片中心除了收藏纪录片之外,还与广播电视台共享了2万多小时的新闻节目、专题片等纪实影像资料,图书馆传统的著录规则无法满足内容多样化的视频资源编目需求。因此,媒资平台在《中国文献编目规则》和《中国图书馆分类法》的基础上,融合了《广播电视音像资料编目规范第1部分:电视资料》《广播电视音像资料编目规范第2部分:音频资料》的相关标准,共设置了48个元数据项(见图4)。还可对所选媒资内容进行内容结构识别和拆分,即将连续的音视频流转化为 “节目”“片段”“场景”“镜头”四层内容结构化的单元,以实现视听资源的精准检索、规范复用和长期归档。在媒资编目体系构建中,系统支持为不同用户配置相应操作权限,从而实现多层次、差异化的编目任务管理与内容控制。如需对一段30分钟的新闻节目进行编目,不仅可以按相对应的元数据项进行详细著录,还可将节目按不同的主题板块进行拆分(如头条、国内快讯、国际新闻、天气预报等),也可同时按不同的现场画面景别(某个事件现场的特写、近景、中景、全景)拆分。通过这种从整体到局部的分层拆分,提升检索、管理与利用的效率。


图4 平台部分元数据显示页面
5、自动化版权管理和内容安全分级,有效控制版权和内容风险
纪录片中心的馆藏资源类型多元、版权来源复杂,不仅增加了版权合规管理的难度,也对资源使用的安全性、规范性提出了更高要求。若仅依靠传统人工台账记录版权信息,不仅易出现信息遗漏、更新不及时等问题,还可能因对授权边界的误判导致侵权风险。因此,依托技术手段构建系统化、精细化的版权管理机制,已成为纪录片中心保障资源合规使用的核心需求。为此,专门设置了版权管理的功能模块,覆盖了版权管理的关键维度,馆员可对使用年限、次数、授权区域、版权所有者、版权使用者、版权使用方式等版权信息的选项进行浏览、勾选和修改(见图5),实现对视听资源从授权到使用的全生命周期信息的结构化记录与实时调取,降低了版权使用风险。在资源安全管控层面,媒资平台结合版权授权的敏感程度与资源内容的保密需求,建立了公开、非公开、机密等权限的密级管理机制,通过权限划分实现对资源访问与使用的精准管控,有效规避敏感内容泄漏风险。

图5 平台版权管理页面
6、智能聚类的知识组织,提升资源使用价值
媒资平台能够基于已完成的智能标签标引与著录信息,对媒资内容实施自动化聚类分析,形成具有主题特征与专题导向的结构化分类呈现,从而推动智能化知识发现目标的实现。在后台管理端,馆员可根据预设的视频归类规则,结合具体业务需要设定关键词条件,系统将自动关联资源已有的标引数据,对符合要求的素材执行主题化整合与多维度展示,只要是满足预设条件的所有媒体片段或独立文件,均可被自动聚合生成特定内容专辑。以具体场景为例,若馆员需要策划一个“抗战”主题的展映或做相关的研究,可通过后台界面启动创建流程并选用智能汇聚服务,系统即会自动提取所有带“抗战”相关标签的视频资源,并将其统一归类至该专题集合之内。这一过程显著提升了媒体资源在专题分类管理与聚类揭示方面的效率,极大提升了馆员的工作效率。
7、提供多元读者服务端,拓展用户使用场景
在广州图书馆内,用户可通过局域网在不同终端使用有效读者证登录媒资平台,然后进行关键词检索,即可观看相关视听资源;还可通过广州图书馆官方微信接口统一认证,在移动端在线检索、观看、收藏纪录片视听资源(见图6)。广州图书馆馆外用户通过外网使用有效读者证登录媒资平台或是访问微信端,则可以查看馆藏资源的编目元数据、内容标签以及三分钟预览视频片段(见图7)。由此,在保护媒资版权的前提下,也让更多用户了解到广州图书馆馆藏资源的信息内容。

图6 广州图书馆内媒资平台访问页面

图7 广州图书馆馆外微信端访问页面
建设成效
媒资平台自建成并对外开展服务以来,围绕视听资源“长效保存、高效利用、安全管控”三大核 心目标持续发力,在管理与应用层面取得多维度突破性进展,为图书馆视听资源的价值释放与公共文化服务升级奠定坚实基础。
其一,构建“全流程智能化管理体系”,实现多载体视听资源从物理存储到智能应用的跨越式升级。平台极大地推动了DVD、磁带等传统载体影像的保护性转化,同步整合元数据标准化编目与智能标签标引功能,形成“资源本体—描述信息—标签索引”的一体化管理模式;同时,嵌入版权规范管理模块,精准记录授权年限、使用范围、权利主体等核心信息,从制度与技术层面双重保障资源合规使用。截至2025年8月,平台已生成1 600余万个覆盖主题、人物、场景、时间等维度的智能标签,4万余用户已通过智能标签进行精细化检索,为学术研究、主题内容创作提供高效支撑,推动视听资源从“静态存储库”向“动态服务源”转变。
其二,打造“人脸识别赋能的资源治理机制”,兼顾历史资源价值挖掘与内容安全防控。一方面,通过持续扩充人脸数据样本库,平台可精准识别馆藏视听资源中的历史人物影像,成功定位多段蕴含重要历史事件、人物活动的珍贵素材,这些曾因检索困难而被淹没的片段,如今重新进入研究视野,助力历史研究的细节补充与视角拓展;另一方面,依托人脸识别技术建立敏感人物人脸数据样本库,针对政论片、新闻影像、城市历史素材中可能出现的落马官员、劣迹艺人等,馆员可依据敏感人脸数据,精准定位其出镜画面,实时完成风险标注与资源密级调整,从源头规避资源误用引发的舆论争议风险,筑牢平台内容安全防线。截至2025年8月,累计加工人脸标本5万余个,其中敏感人脸标本有3000余个。
其三,创新“分场景版权适配服务模式”,在严守版权边界的前提下,为不同场景用户提供公益化、便捷化的影像资源服务。针对广州图书馆馆内用户,平台开通多端口访问通道,实现视听资源的在线观看、精准检索与收藏管理,满足即时化、碎片化的观看需求。而对于馆外用户,平台则采用“信息开放+内容受限”的服务策略,在避免版权侵权的同时,让更多公众了解馆藏资源全貌,有效扩大广州图书馆纪录片资源的社会知晓度与文化影响力。2024年,粤港澳大湾区图书馆联合服务平台专题链接广州图书馆智慧媒资平台,使其成为粤港澳大湾区影像文献资源的重要组成部分。广州图书馆依托媒资平台推动建立总分馆的资源版权管理和使用机制,有效推动优质资源直达基层,从而有效实现“版权保护”与“公共服务”的平衡发展。
面向“十五五”的媒资智慧化应用发展
基于广州图书馆媒资平台现有的建设实践,面向“十五五”,还可从“深化资源利用、提升人工智能水平、打造人文枢纽”三个维度深化完善媒资智慧化应用,进一步释放平台在公共文化服务、学术研究支撑等领域的潜在价值。
1、以“数据筑基+精细加工”深化资源利用
高质量、大规模、细粒度、强逻辑的数据知识资源已成为适配智慧图书馆优质数据资源建设的核心基础。迈入“十五五”,媒资平台将聚焦视听资源的数据化升级,推进数据的细颗粒度加工,强化数据间的关联性构建(如影像与历史事件、人物、地域文化的语义关联),让数据资源具备智慧化检索、可视化呈现等特征,最终构建立体化、高可用的智慧资源体系,为后续馆藏资源的开发与服务提供坚实数据支撑。在合规框架下推进资源加工从“基础处理”向“高附加值开发”升级。针对已获汇编权的视听资源,可通过内容重组、主题提炼、多形态转化(如生成专题纪录片、知识短视频、图文解读等),打造兼具文化性与传播性的信息产品;同时建立“加工—确权—服务”全流程管控机制,在优化馆藏资源体系的同时,从源头规避知识产权风险,让沉淀的视听资源转化为可高效服务的文化资产。
2、以“人工智能+立体服务”提升用户体验
吴建中曾提出 , 智慧图书馆将通过智能化的连接和增值方式,建立惠及全民的互联互通、开放共享的图书馆知识服务体系。因此,通过人工智能技术,突破现有管理与服务局限,强化知识与知识的关联、人与知识的关联,提供立体化的知识服务,对提升用户体验尤其重要。一方面,可通过进一步完善智慧数据体系,推动多源知识内容的“细颗粒度揭示”与“语义关联”,实现影像、文本、实物等资源的跨类型集成管理;另一方面,可基于AI用户画像,提供立体化、个性化的分众服务。如针对专业研究人员,可为其推送“专业文献+专题讲座视频+相关主题纪录片”的个性化媒资包;针对视障群体,可提供“AI语音朗读+ 触觉反馈”的盲用媒资服务;针对中学生的课程学习,可通过AI技术发挥主题媒资的研究助手作用,如开展“地方非遗文化保护”学习,AI可筛选生成“媒资研究框架”,包括看非遗传承人访谈视频、读非遗历史文献、听非遗传承人故事音频,帮助中学生快速提取研究素材,提升学习效率,支撑图书馆“进校园”的场景化服务。
3、以“知识图谱+价值拓展”打造人文枢纽
智慧图书馆是图书馆在新时期、新环境下为满足用户新需求而产生的新形态,是图书馆发展的新目标,是智能技术和人文智慧的融合。未来,媒资平台将充分激活馆藏资源精细化内容揭示与专题化资源聚类能力,通过深度挖掘数据内在关联,构建包括视听、图片在内的纪实影像文献知识图谱。这一图谱将打破传统影像传播的局限,把静态的历史记忆、地域文化转化为动态可感知的内容形态,实现文化传承从“保存”到“活化”的升级,助力地方文化基因的永续传递。在价值拓展层面,可向科研机构开放经授权的细颗粒度影像数据,为人文社科领域的研究提供历史影像素材支撑,填补传统文献研究在“视觉化证据”上的空白,推动学术研究与影像资源的深度融合,打造服务学界的专业知识供给阵地。同时,聚焦“一老一少”群体需求,开发差异化定制服务,如针对青少年群体,精准提取影像中的研学知识点,让纪实影像成为青少年感知历史、了解文化的生动教材;针对老年群体,优化界面交互逻辑,打造适合老年人的观看体验。通过覆盖多元群体、延伸服务场景,最终将智慧媒资平台构建为连接学界、业界与市民的“人性化、专业化、智慧化”人文枢纽。
从实践层面看,广州图书馆的探索验证了全媒体知识组织体系在破解媒资管理困境、提升服务效能中的关键作用。它不仅实现了视频、音频、图像等多元媒资的高效整合与安全管理,而且通过智能技术让“沉睡”的媒资资源转化为支撑公共文化服务普惠化、学术研究精准化的“活资产”。面向“十五五”,图书馆媒资建设需跳出“技术工具化”的局限,以优质数据资源为根基,以智能技术为引擎,以人文价值为内核,让媒资服务深度融入公众文化生活与学术创新过程,真正成为图书馆从“智能化”迈向“智慧化”的重要支撑。
.png)