AI绘画应用：二月二龙抬头，学AI展龙图 – 云瀚联盟-智慧图书馆技术应用联盟

AI绘画应用：二月二龙抬头，学AI展龙图

2024年03期【行业交流】

3月10日下午，上海图书馆东馆少儿区举办了一场名为“二月二龙抬头，学AI展龙图”的少儿AI体验活动。现场少儿在听完关于二月二习俗和生成式人工智能相关的介绍后，上手体验了由上海图书馆员工打造的文生图模型应用。随后他们还在首次对外开放的POD区域（Print On Demand，按需印刷）体验了个性化印刷，拿到独属于自己的活动纪念品。

活动策划和开发小组基于开源的图像生成模型Stable Diffusion二次开发了本次活动的专用应用。Stable Diffusion是一种基于扩散过程的图像生成模型，可以生成高质量、高分辨率的图像。它通过模拟扩散过程，将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性，可以生成具有多样化效果和良好视觉效果的图像。

开发人员针对本次活动对象简化了操作界面，保留了正向提示词和反向提示词的输入，以及画风和快捷提示词选择，让少儿可以在不打字的情况下快速选择自己想要生成的图片内容。此外，应用还提供了11个预选提示词组合，可以生成特定内容的高质量图片。

技术详解

本次服务用到的是Stable Diffusion XL版本，部署在上海图书馆内部的GPU服务器之上，通过IP配置共享内网访问使用。该服务器配备了2张16G NVIDIA-Tesla T4显卡，在迭代步数为20、采样方法为DPM++2M Karras、生成数量为单张、生成像素为512*512的情况下，生成时间不超过10秒。因此，本次活动在单台本地GPU服务器的支持下提供了5台终端的同时访问使用。

在原生Stable Diffusion开源项目做了二次开发，目的之一是为了降低面向用户的交互界面学习成本，其次是更灵活的调用微调后的LoRA模型，从而实现一键式切换生成不同的画风，画风包括但不限于龙年新春、卡通盲盒、工笔、动漫二次元等。同时，因为这次是试验性活动，所以在后台只配置了4种画风，但后台已经支持快速添加更多种类的画风。

未来展望

图书馆或其它公共文化场馆可以利用本地或云端的算力资源，部署开源的多模态大模型，通过二次开发的形式提供个性化的AI体验服务。随着开源大模型生成效果的不断增强和部署门槛的日益降低，未来的文化场馆必将为用户带来更加丰富多彩的AI服务。

日前，Stable Diffusion 3已正式对外发布，增强了多主题处理能力，提升了图像质量，改善了拼写和文本处理能力，并提供了从800万参数到80亿参数的不同版本，进一步降低了使用门槛。期待其正式开源后为读者用户带来更为理想的AI体验。

最后感谢嘉兴市图书馆提供的灵感来源！

发表评论 取消回复

发表评论取消回复