刘炜等《数字人文的未来20年》

刘炜等《数字人文的未来20年》

2024年12期【本期推荐】

作者:刘炜,嵇婷

来源:刘炜,嵇婷.数字人文的未来20年[J/OL].信息与管理研究.https://link.cnki.net/urlid/31.2118.G2.20241202.1502.002.

数字人文的未来20年*

* 本文根据“文理融通:AGI时代的数字人文”学术研讨会暨第六届中国数字人文年会闭幕式发言《数字人文 未来廿年》修改整理成文。

【摘要】我们正在迈入一个技术能力以指数级速度发展的时代,预计在未来二十年,“奇点”将会到来。大模型技术为“奇点”的到来创造了可能的路径。随着人类进入“数技人”(Homo Technicus)时代,人类与技术深度融合、共生发展,传统“以人为中心”的人文主义面临挑战:新人类通过与技术融合强化,人性可能发生显著异化;机器智能经过自我加速与迭代,可能发展出自主意识;AI发展带来了各类风险与伦理问题,甚至关乎生存或毁灭。当前必须采取行动,将AI发展所带来的问题纳入新人文的研究范畴。在未来二十年,数字人文需要实现一次新的转向,跟随扩展的新人文主义,利用数字人文研究的第五范式(AI4DH)向智慧人文发展。

关键词:数字人文 新人文 人工智能 大模型 奇点 数技人(Homo technicus) AI4DH

0 引言

二十年前,信息技术浪潮汹涌而至,推动了以个人计算机和互联网为标志的数字化时代的到来。在此背景下,数字人文实现了从“人文计算”至“数字人文”的学科化蜕变。数字人文连接了“数字”与“人文”,在技术进步与社会发展的双重推动下,理论框架与研究方法不断演进。凭借技术手段的有效运用,数字人文为艺术、历史、文学等传统人文学科的既有研究方法注入了创新活力,赋予了传统人文全新的研究视角与广阔的探索潜能。

当下,数字人文正置身于新一轮技术所掀起的革命性浪潮之中。人工智能正从狭义人工智能(ANI)向通用人工智能(AGI)阶段跨越。从GPT-3到GPT-4、GPT-4o、o1,大模型在模拟人类认知、推理以及多模态能力方面取得了飞速进步。仅仅两年,人工智能在药物研发、辅助教育、艺术创作, 自动驾驶、智能制造等领域得到了广泛应用,覆盖了社会生活的方方面面。

OpenAI在其“通用人工智能(AGI)路线图” 中描述了美好的技术愿景:推动全球经济发展、改变新兴科学知识的发现、提高人类生活水平、赋予每个人不可思议的新能力。奥特曼坚信AI将推动社会迈入“智能时代”,带来社会的共同繁荣。然而,人工智能技术的迅猛发展也引发了关于如何平衡技术进步与社会风险、伦理道德等问题的广泛讨论。人工智能教父杰夫·辛顿和约书亚·本杰奥联合全球众多专家发出了对人工智能风险的警告, 强烈呼吁关注AI技术与人类“对齐”,以确保AI的行为能够符合人类的道德、伦理和利益。这些人工智能技术的顶尖专家在坚信人工智能巨大潜力的同时,对技术失控的潜在危机表达了深切的忧虑。

有专家预测,在接下来的二十年,机器将产生自主意识,全面超越人类智能,到达“奇点”。如果机器发展出与人类匹敌的智能,继而获得情感和自我意识,那么以人为本的传统人文主义将面临前所未有的危机。与此同时,人类自身也在与技术深度交融的进程中朝着 “新人类” 的方向不断进化演变。未来二十年,技术将如何改变人类社会?我们将如何应对由技术进步带来的风险和伦理挑战?机器是否会与人类竞争支配地位?人工智能对数字人文有什么影响?人文主义如何应对挑战?数字人文未来何往?

奇点纪临近:大模型革命

1.1 大模型开启奇点时刻

人类文明的演进,从新石器时代开始到现在大约一万年,从金属时代算起约是数千年,从利用电能到现在一百多年,原子能的利用则是最近几十年。近半个世纪以来,科技发展的节奏显著加快, 电脑普及大约用了十余年,互联网与智能手机的推广仅在数年间,而自ChatGPT问世至当下AI技术的大规模普及应用刚刚过去两年。技术的发展日益加速,我们越来越感觉到,那个被广泛讨论的“奇点” 时刻似乎正在逐渐临近。

奇点这里指科技奇点(Technological Singularity),指未来某一时刻,科技以极其快速且不可预测的方式加速发展、自我改进和增强,致使在这个时间点以后的世界无法预测,带来人类社会、经济和生活的方方面面的彻底重塑。奇点的核心假设是技术进化的不可逆性和加速性。奇点来临的关键条件是超级智能(ASI)的产生,而人工智能及其高级形态——通用人工智能(AGI)被认为是通往奇点纪的触发关键。

奇点概念其实是对技术发展历史趋势的一种总结性观点。冯·诺依曼最早提出奇点概念,“技术正以其前所未有的速度增长……我们将朝着某种类似奇点的方向发展,一旦超越了这个奇点,我们现在熟知的人类社会将变得大不相同”。美国计算机科学家、未来学家雷·库兹韦尔是奇点主义的代表人物,他在《奇点临近》(The Singularity Is Near)一书中对奇点进行了精确量化阐述,判定奇点将在2029年到2045年之间发生,在2024年新出版的续集中,他再次强调了这一时间点。

回看计算机的发展历史,早在1950年计算机诞生之初,艾伦·图灵就前瞻性地提出了“机器是否可以思考”这一命题,并大胆预言机器将企及人类大脑的能力。从20世纪60年代到90年代,通用计算机的能力增长了十万倍,但人工智能可用的计算机能力几乎没有变化。进入20世纪,计算机性能依循摩尔定律以指数级速度快速增长。如果我们将计算机性能与生物智能对比,可以发现,90年代的计算机性能等同于诸如细菌和线虫之类的简单生物;到了2000年,已经接近蜘蛛和蜥蜴的大脑性能;2015 年时,计算机智能接近老鼠的水平;至2023年,则已接近人类智能。根据这一趋势,到2045年,也就是再过二十年左右,机器智能将超过所有人类智能的总和,届时人类将正式进入奇点纪。

大模型技术被认为是最可能实现通用人工智能(AGI)的有效路径。大模型第一次让智力活动可以脱离大脑而体外运行,它将海量的知识压缩存储在深度神经网络中,相当于智慧的编码存储,并将语言转化为数学表达。不同于传统的符号匹配方式,大模型基于词元(token),这些词元是衡量语义相似性的张量,使模型能够直接提供答案,而不仅仅是符号的排列组合。

当前,基于大模型的GPT-4在各种专业测试和学术评估中,表现与人类不相上下。在美国律师职业考试中,GPT-4超过90%的考生;在GRE语文考试中,它以接近满分的成绩打败99%的考生;在“美国高考”SAT考试中,GPT-4在数学科目也已排名11%。Kiela等人对人工智能的性能进行了功能性测试评分发现,在阅读理解、图像识别、语音识别等领域,机器在2015年就已经达到并超过人类的平均水平。在常识测试、复杂推理能力,数学问题解决、代码能力等方面,人工智能尚未胜过人类。其中,复杂推理能力与人类有一定差距,而其他能力根据趋势有望很快接近人类。

DIKW(Data-Information-Knowledge-Wisdom) 金字塔模型是信息领域的经典模型,它描绘了从数据到信息、知识和智慧的转化过程,而AI大模型的出现正重新定义这一路径(图1)。大模型能够在需要时即时生成知识,无需事先存储,它们只需保存模型参数权重,即可随时输出。大模型能够沿DIKW 模型自上而下地工作,即从知识层面出发,反向抽取信息。这意味着大模型可以根据已有的知识框架,识别和提取相关信息,甚至在某些情况下,生成新的数据来填补知识空白。大模型在处理数据时,能够发现新的模式和关联,这可能导致新知识的产生。此外,大模型的应用以端到端模型为最高形态,这意味着只需输入数据就能得到智能的输出,具备直接决策和执行的能力。虽然人类是知识链的起点,能够高效地生产知识,但与机器智能相比,这种方式显得低效和原始。大模型能够通过自我博弈和强化学习,在没有人类帮助的情况下不断自我迭代,迅速超越人类。一旦机器的自我学习能力超越整体人类,这种递归式的自我改进可能会引发智能爆炸,进而孕育出超级智能。这时, 奇点纪正式降临。

1.2 大模型技术发展现状

过去的两年,围绕AI大模型的各类发布与突破性进展的新闻频频出现,资本竞相涌入,大众翘首以盼。经过阶段性的沉淀,以客观的态度剖析大模型技术的发展现状,可以总结为:规模定律(Scaling Laws)“尚有余威”;模型的推出“高歌猛进”;AGI还处于萌芽期;应用模式正在形成,杀手应用尚未成型;科学研究的第五范式(AI4S)崭露头角;大模型的不可解释性带来幻觉、版权、隐私、虚假信息等问题暗藏风险,随时可能引爆。

自2022年以来,大模型发展一路高歌猛进,呈现出百舸争流的繁荣景象。OpenAI相继发布GPT-4、GPT-4o、Sora、o1等成果,朝着全面支持“眼耳鼻舌身意”人类感官的多模态人工智能全力迈进;Meta、xAI、阿里等公司不甘落后,发布了具有竞争力的开源模型;在HuggingFace、Langchain等专业工具的引领下,各类“副驾驶”、辅助工具和成千上万的插件层出不穷;越来越多的应用接入大模型,预训练大模型成为基础设施,以模型为中心的开发范式和新的AI产业生态正在逐渐形成。

新一轮AI技术与应用市场仍处于一种“混沌初开”的状态。尽管当前对话问答和AI搜索等应用已经广泛流行,但仍有不少垂直行业尚未真正落地AI 应用,市场仍在期待“杀手级应用”的出现。虽然模型框架和应用模式的创新不断,但成熟定型的模式尚未形成。包括扎克伯格在内的一些业界领袖表示,即使当前技术发展停滞,在现有技术的基础上构建消费者和企业产品的应用已经有很大想象空间。此外,泛化、涌现、迁移现象预示着人工通用智能存在很大的可能性,但由于大模型技术的机理尚无法完全解释,幻觉问题仍未解决,其实现路径仍然充满挑战。

当前AI的发展仅刚开始,远未到达顶点。有研究预计,在2028年左右,现有数据储量将被耗尽,大模型训练数据面临枯竭,规模效应(scaling laws)将会放缓。但自博弈训练和慢思考推理将继续为模型带来增益。在过去的两年中,推理、数学和代码能力的提升为多模态模型、智能体、具身智能的全面发展奠定了基础。人工智能在科学(AI4S)等领域的应用已经开始显现出巨大的潜力。AlphaFold模型在蛋白质结构预测方面的突破,为生命科学带来了革命性的影响。这些跨学科的探索为AI的应用开辟了新的领域,十分具有潜力。

不容忽视的是,大模型技术的飞速发展暗藏风险,“双刃剑”的另一面同时逐渐显现。AI创作引发诸多版权争议,深度伪造可能导致虚假信息的泛滥。AI在增强信息获取、挖掘和共享能力的同时,也增加了数据滥用和个人隐私泄露的风险。这表明AI技术在发展的同时需要法律与监管同步跟进。如果说大模型开启了奇点时刻,那么AGI和高度先进的自主AI很快到来,技术和社会发展将面临不可预测性,潘多拉魔盒正在打开,AI的驯化与对齐,已刻不容缓。

数技人时代:传统人文主义的挑战

2.1 新人类演进与人文主义的扩展

人类自诞生伊始,便与技术的联系密不可分。与凭借尖牙利齿、飞行求生的动物不同,大脑是人类强大的倚仗。人类通过大脑与自然的互动实现生存和进化,通过发明技术来适应环境以达到更好的生存。在农业时代,技术是人类改变生存模式的开端。步入轴心时代后,人愈发成为技术塑造的产物,二者的交融更为显著。从古至今,技术始终贯穿于人类的发展中,成为推动人类进化、优化生存境况的关键力量。

在历史的长河中,人类自我认知的演变经历了几次重大“祛魅”。500年前,哥白尼勇敢地告诉人类,地球不是宇宙中心,推翻了“地球中心说”;150多年前,达尔文胆战心惊地发表专著,论证人类是大猩猩和黑猩猩的至亲,摧毁了“人类独特说”;而在15年前,杰夫·辛顿以深度神经网络构建“体外大脑”,实现了媲美人类智能的机器智能,摧毁了“智能唯一说”。这一切进展不断都把人类从万物之灵、天之骄子的位置上拉下马。

我们或许正处于一种可与人类生命兴起相媲美的变革边缘。根据地质考古发现,约5亿年前的寒武纪,地球上产生过一次生物大爆发,起因据考古学家推测,是由于能够感知光线的器官——眼睛的出现,从而大大拓展了生命进化的方向。试想, 如果机器接入了感知能力,丰富的感知数据将促使多模态大模型成熟,正如寒武纪大爆发生命形式迅速多样化一样,人工智能技术将迅速扩散化发展, 智能设备和应用爆发式增长,机器和人类的能力都将极大增强。如同预示复杂生命出现的曙光,人工智能大爆炸也可能是在为一个变革性的时代奠定基础。

当技术参与到人类进化的过程,有很多“新人类”的描述方式。“Cyborg”(赛博格)表达人类与机械部件进行物理融合,例如通过假肢、人工耳蜗、心脏起搏器等增强生物能力。“Transhuman”(超人类)是指人类通过技术来改变和增强人类的认知和身体机能,例如通过基因工程来增强智力、力量或耐力。“Homo Digitalis”(数字人类)描述随着互联网和数字技术的发展,人类所呈现的越来越数字化的行为生活特征。此外还有“Homo Cyberneticus”(控制人类)“Homo Sapiens Tech- nologicus” (技术智人)等。“新人类”们利用技术改变他们的身体、思想和环境。

前谷歌CEO埃里克·施密特认为,人类已进入Homo technicus(数技人)时代,人类与技术的关系正在发生根本性变化。随着奇点的逼近,人类与技术将深度融合。当前,脑机接口技术已经取得重大进展,这项技术发轫于医疗应用,但未来却极有可能促进“硅基器件和碳基生命的有机融合,实现生命进化的新形式和新高度”。人类可以将自己的思想意识、记忆情感转化为数据植入机器中, 机器因为拥有了人类的记忆感知而加速进化,拥有了具备人类意识的“灵魂”。除此之外,合成生物学等先进生物技术也可能延长人类寿命,从根本上改变人类健康,并可能改变人类能力。随着人工智能的爆发,这些技术还可能与人工智能发展相结合, 创建生物混合系统,融合生物和机械元素。“超人” 不再只是幻想,而成为一种技术可能。

上述的各种新新人类,体现了人类不同的发展进化方向,是技术赋能人类之后产生的不同结果体现。这些概念的提出说明“人”的外延正在发生深刻变化。认可这些概念意味着需要扩展人文主义的范围,它涉及人类与技术的深度融合,这种融合不仅影响了人类的能力和生活方式,也重新定义了“人性”这一基本概念。传统人文主义的核心是关注人类的价值、尊严、自由和潜力,而在面对技术深刻渗透的社会中,传统人文主义需要进行调整, 以适应新的挑战和机遇。脑机接口、人工智能增强、基因编辑等技术正在模糊人类与机器、自然与人工的边界。这就促使我们重新审视什么是人性、自由、意志和个体价值,将这些核心概念融入新的技术环境中。

在新的数技人的世界中,人类与技术的关系已经演变为一种共生关系,技术不再是简单的外部工具,而是成为我们认知、决策和社交的一部分。数技人的出现代表了人类利用技术提升自我能力的愿望,例如增强身体的健康、提高认知效率等。然而,随着技术对人类的渗透,我们也面临着自由意志和个体尊严被技术侵蚀的风险。人类对技术的依赖与增强之间存在微妙的平衡。因此,我们需要扩展人文主义,以理解人类在技术主导的环境中的主体性,并平衡技术对人类行为的增强与对自由意志的潜在限制。人文主义需要扩展其关注点,不仅要考虑如何利用技术增强人类,还要关注如何避免技术对人类尊严、自由和个体独立性的威胁,以确保在技术时代维护人类的价值和尊严。

2.2 人工智能的风险与伦理挑战

进入数技人时代,技术发展提供了人类超自然进化的能力。碳基生命与其所创造的硅基生命经过融合而强化,人性高度异化。专家认为,当技术能力尤其是生物技术和人工智能到达极限,人便逐渐具有了上帝一般的能力,甚至能够实现对生命的控制和设计,人进化到一种“Homo Dues”(人神) 的状态。这种能力令人恐惧。尤瓦尔·赫拉利说:高智慧的机器人并不可怕,可怕的是造就他们的人类自身是无比的愚蠢和自私。人类驾驭了火,克服了瘟疫,摆脱了饥饿,控制了原子弹,现在,人工智能成为新的挑战,考验人类有没有足够的智慧应对。对未来的恐惧,人类需要在自己身上寻找解药。

与此同时,机器觉醒也成为可能。杰夫·辛顿相信机器在产生与人类匹敌的智能之后,将能继续获得情感和自我意识;马斯克认为“AI是对人类最大的威胁之一”;“AI末日论者”(“AI Doomer”) 则认为通用人工智能(AGI)会迅速发展成为“超级人工智能”(ASI),引发毁灭性后果,就像电影《终结者》里描述的那样。

上述讨论并非意在宣扬AI“宿命论”,而是强调人类在致力于发展AI的同时,更要重视AI的安全。高度智能的AI让人警惕,但拥有超级智能的人类同样令人担忧。对未来的恐惧,人类需要在自己身上寻找解药。从人类的角度来看,大脑是在基因之外,赋予了人类生命体更大的适应甚至改造环境的能力。而机器智能作为一种能够整合所有人类大脑的硅基大脑,又为我们带来了更强大的智慧。这意味着,在我们防范机器发展出自主意识之前,最大的威胁可能来自那些掌握机器智能却别有用心的同类。那些极端忽视风险、反对人工智能可能产生自主意识和情感的计算机专家,可能是其中最危险的。目前看起来机器智能还远未达到令人恐惧的程度,它们还存在很多问题和不足。例如当前的人工智能仍不具备情商与共情能力,不具有社交能力,没有多少创造性,缺乏物理协调性,缺乏系统的感官知觉,不具备立场、观点、价值观和想象力等。但我们需要防患于未然。

全球已经开始采取行动以确保AI技术负责任的发展。李飞飞创建了斯坦福大学人工智能研究所(Stanford HAI),倡导将哲学、伦理、社会科学融入AI研究中,以确保技术发展能够更好地服务于人类社会。欧盟迅速颁布了《人工智能法案》, 以控制人工智能带来的风险,显示了其对AI监管的决心。2023年,全球立法程序中有2175次提及人工智能,几乎是上一年的两倍。美国人工智能相关法规的数量在过去一年大幅增加。这些行动体现了全球对AI风险的重视和对监管的迫切需求。

当前已有不少专家对人工智能带来的风险进行研究,如《在快速发展的时代管理人工智能风险》(Managing AI Risks in an Era of Rapid Progress),系统表述了AI带来的社会规模风险,列出了包括自主AI、技术失控、技术安全等在内的六条风险。归纳来看,当前人工智能潜在的风险包括公平问题、违法犯罪、社会灾难三个层次,具体包括:信息过载和“信息茧房”可能导致公众视野狭窄;虚假信息与算法偏见可能加剧社会误导和不公;技术素养的不足与失业问题可能进一步扩大社会不平等。同时,人工智能的误用滥用、隐私侵犯、版权侵犯以及潜在的犯罪诱导行为,对现有的法律和道德体系提出了严峻挑战。此外,人工智能在军事和生物技术领域的不当应用,可能带来全球性安全风险。最终,人工智能的意识觉醒和情感欺骗问题, 更是触及了人类伦理的核心议题。这些挑战要求我们深思如何在享受技术红利的同时,确保社会的公正、安全与伦理底线。

在探讨人工智能的发展及其潜在的伦理和社会挑战时,我们不得不面对一个核心问题:如何确保人工智能的发展既符合人类的长远利益,又能够避免潜在的风险和威胁。这涉及技术层面的考量,还涉及法律、伦理和社会等多维度因素。遵循一个“可信赖的人工智能”开发框架,提出一个整体和系统的方法,指导人类开发、部署和使用人工智能系统十分重要。欧盟《人工智能法》的立法原则引用了《可信赖人工智能伦理指南》(Ethics Guide- lines for Trustworthy Artificial Intelligence),其对可信赖AI系统的描述值得参考。指南认为,一个“可信赖的人工智能”在合法、合乎道德、系统稳健三大支柱的基础上,满足七项关键要求,分别是:(1)人类主导与监督,确保AI系统不会完全自主运行;(2)AI系统稳定可靠,能够抵御错误和安全威胁;(3)处理个人数据时遵守隐私保护原则和法律;(4)AI系统的决策过程应该透明;(5)AI 系统在设计和实施过程中考虑多样性,避免歧视和不公平;(6)AI技术应促进社会福祉和环境保护;(7)AI系统的部署和操作有明确的责任归属,便于问题追溯。

3 迈向新人文:AGI时代的数字人文

3.1 AGI时代的数字人文

数技人的大量出现会不会对人类的定义带来挑战?人类的边界如何界定才能具有更大的包容性且不会引起剧烈的冲突?人文主义的外延需不需要拓展?我们作为弱势族群会不会丧失对人性进行定义的资格?这些因为AI发展而顺理成章带来的问题, 急切地呼唤对新人文进行系统深入的研究。李飞飞说,“现在是时候将人工智能与社会科学和人文科学结合起来,并了解人工智能对我们人类信仰、公平正义、社会生活和伦理道德等方面的深远影响了”。这些不仅是技术层面的挑战,也是人文学科必须面对的转型。

自工业革命尤其是二战以来,学科划分日益精细,人文学科因实用性欠佳呈现出衰落态势。传统人文学科的危机,带来人文学科转型的必然。这些新兴的人文问题已经超越了传统人文学科的覆盖范畴,更具有时代针对性的议题,将逐渐成为新人文的主体。当然,人文主义的整体意义并未因此而减弱,其重要性不容置疑。正在消失的,不是人文本身,而是那些难以契合时代的具体学科。

数字人文是人文学科应用了数字技术后的新形态,是“人文学科”的延伸和发展。从20世纪的索引技术、文本分析、文集编码、概念提取,到21 世纪的文献平台、人物研究平台、社交网络分析(SNS)、地理信息系统(GIS)、国际图像互操作框架(IIIF)、机器学习(ML)、人工智能(AI), 以及数字孪生和元宇宙的探索,数字人文的发展史鲜明地体现了IT技术的应用史。IT技术的应用不仅为人文学科的研究提供了新的工具和方法,而且建立了人文研究过程中知识生产和分析方法的新认知理论和新研究范式。远读(遥读)、文化分析学、文学模式识别、简化人文+、文本批评、词频查看器方法等都是IT技术在人文学科中应用的方法论创新。这使得数字人文研究科学性的提高和视野的扩大,使得研究者能够解决传统研究方法无法触及的问题,涌现诸如莫莱蒂等人原创性的学术成果和诸如中国历代人物传记资料库 ( CBDB )、数字敦煌等建设案例。

数字人文学科在不断的批判与自我反思中进步。很多学者提出的一些批判观点非常具有代表性,他们指出一些研究存在人文价值稀释、技术依赖与迷失等问题。这些批评辛辣到位,难以辩驳。然而,正是这些批评和反思推动数字人文在理论构建上取得进展,逐渐从方法、技术的大杂烩,开始形成具有一定理论结构和研究规律的独特领域。在此过程中,基于特色资源的数字人文项目彰显出风采,它们利用先进的IT技术,挖掘和展现文化资源的深层价值。同时,基础设施建设成为图博档(GLAM)机构的主力,它们构建了支撑数字人文研究的坚实基础。此外,理论批判和方法探索也在不断推进,确保数字人文领域的创新与深度并行不悖。

“数字人文”的产生以工具论为背景,但当所有数字活动都渗透到人文学科的各个领域时,要求我们重新思考人文学科的研究对象、方法和理论框架。数字人文应跟随人文主义,从数字时代、通用人工智能时代以及更广阔时代的人文精神、人文处境和前景作出界定。因而,数字人文应该具有“大数字人文”的概念,面向未来进行研究。未来二十年,如果仅仅将AI看作工具与技术,人工智能依旧是被使用和支配的客体。而新人文将扩展人文主义与人文精神,重塑伦理与道德的数字边界,指导人工智能的发展。对数字人文而言,人工智能已不仅属于“数字”领域,更是成为“人文”不可或缺的一部分了。

3.2 数字人文研究的第五范式:AI4DH

新人文该如何研究?库恩认为科学革命的本质是“范式转换”。进入人工智能时代,研究观和研究范式都需要转变,新人文研究可以从科学研究的最新范式——人工智能科学研究(AI for Science, AI4S)中找到借鉴。AI4S是科学研究继经验科学、理论科学、计算机科学、数据密集型科学之后的第五研究范式。经验科学以观察和实验为基础,理论科学通过数学建模和理论推演深化理解,计算科学利用计算机模拟复杂现象,而数据密集型科学则通过海量数据分析揭示模式。AI4S是将人工智能全面应用于科学研究,它将“机器猜想”应用于“科学智能”,通过不同的“算法思维”和“应用场景” 的对撞,推导出未知结论。

在AI4S研究范式下,人工智能全面融入科学研究。行为模式上,人与机器智能紧密融合,机器智能成为科研的组成部分。机器具有自动化、智能化、自主化的特征,能够大幅缩短研究周期。研究者可以利用先进的人工智能模型来预测和优化科学系统的行为,支持假设提炼、自主实验、反馈决策和自我评价等行为方式,并支持从数据收集到数据分析过程的端到端自动化流程。

从整个科学研究的过程来看,新研究范式中人的角色发生明显的变化。人作为研究的需求提出者和反馈者,可以远离研究过程本身,也可以作为某一角色融入实验过程。斯坦福大学近期推出的开源应用Co-STORM平台,引入了协作对话机制,通过大模型专家、主持人和人类用户,模拟出类似圆桌讨论的场景,使得人和多个智能体共同参与讨论, 实现了流畅的协作式AI学术研究,体现出新人机交互、人智协同的研究模式。

AI智能体在新的研究范式中发挥了重要作用, 它们承担起信息检索、数据处理、数据分析的重任,甚至进行自主学习。Sakana AI推出的“AI科学家”(AI Scientist)自动写出了10篇顶会级论文, 这些“科学家”们能够完全自动的、端到端生成论文,承包了从头脑风暴、生成创意,到执行试验、数据获取、实验迭代,以及到论文撰写、论文审查的全过程。AI智能体们帮助科学家实现数据自动化处理、模式识别与预测建模,为研究人员节省了宝贵时间,促进了创新发现。

由于生成式人工智能,人文社会科学的研究可以采用受控的实验方式进行,数据获取也不再是不可能任务。斯坦福的Smallville虚拟小镇项目是社会人文学科的一个著名的创新性研究,项目构建了一个包含25个AI智能体的虚拟小镇来模拟人类行为和社交互动。每个智能体有自己独特的个性和背景故事,可执行类似人类的日常行为,如制定计划,与人交流,进行思考反思。他们拥有自己的记忆和目标,会产生自发的社交行为,而无需程序预先设计。这种实验方法为人文社会科学的研究开辟了试验与模拟的新天地。通过人工智能技术,研究者能够对特定的社会科学理论进行精确的演绎、模拟和量化分析。这不仅增强了研究的实证基础, 而且为探索复杂的社会现象提供了更为严谨和灵活的工具。

上面描述的AI驱动的新研究方法,应用到数字人文研究中,我们可以称其为数字人文研究的第五范式(AI4DH)。AI4DH的核心特征是基于问题、基于数据、基于算法。

基于问题,指的是无论范式如何变化,数字人文研究方法依旧强调从问题出发,追求人的发展, 而不是学科的自洽。数字人文研究者结合利用创新的技术,目标是解决现实世界中的复杂问题。

基于数据,指的是AI4DH是以数据为基础要素的研究范式。在未来的研究环境下,智慧数据的积累和建设成为数字人文研究的基石。AI4DH真正发挥作用的,除了依赖大模型的隐性知识、推理能力、泛化能力,更重要的是依赖领域的数据和知识。基于领域数据,构建领域模型,才能完成高质量的数据处理、文献分析、研究考证,以及多样化的知识组织等任务,真正解决行业问题。另外,通过基准测试数据,研究者能够实现结果的可重复性和确定性,这对基于AI的人文学科的科学化和规范化具有重要意义。尽管AI大模型可能存在“黑箱” 问题,但可通过端到端的可量化方法,努力确保研究的可靠性,为人文学科的量化分析提供了新的工具和方法。

基于计算,指的是AI4DH是基于计算的研究范式。以大模型为代表的AI技术可以以全新的方式参与到数字人文数据建模、数据处理等多项工作中。大模型的潜力在于无需人工标注大量数据,通过零样本小样本学习,即可处理诸如文字处理、图像处理等任务。其次,新一代的AI逐渐发展出主动学习、迁移学习、终身学习的新范式。大模型可以依照复杂系统进行认知,利用强大的计算能力,基于模拟仿真,支持多种叙事还原。此外,大模型能以向量的方式实现多模态的转化和交互,弥补不同模态资源信息的鸿沟。这些方法对于理解文化现象、历史演变和社会动态非常有帮助。通过计算模拟, 人文学科的研究得以跨越时间和空间的限制,为理解人类历史和文化提供了新的视角。这种方法能够揭示人类文化和社会现象的深层结构,并能预测和模拟未来的发展变化。

通过不断地检验和完善研究方法,数字人文研究者们正努力推动数字人文这一跨学科领域向着更加成熟和深入的方向发展。在新方法的应用上,数字人文研究者们也意识到,任何方法都不是万能的,从数据采样、模型构建到推导过程,都需要经过严格的检验。特别是当前生成式人工智能的黑箱特性给数字人文研究带来了巨大的挑战。这意味着,研究者们需要在方法的透明度和可解释性上下更多的工夫,以确保研究的严谨性和可靠性。

4 结语

未来二十年,大模型的普及和迭代将成为推动知识进步的关键力量。大量的领域模型不断地训练、微调和迭代,并在云端和端侧实现部署。基础设施平台的建设将从单一的文献平台过渡到整合数据和算力的大模型工具平台,AI即服务(AI as a Service)实现落地。未来,行业需要推进相关评测基准和技术应用标准规范的研究和制订,推广最佳实践,并加强相关人才培养,提升数字人文整体水平。行业还需重视开放数据和开源生态,加快推进GLAM领域数据资源的开放存取并创新业务模式, 使GLAM获得可持续发展的动力。同时,还要关注计算伦理与数字道德问题,注重安全与监管,致力于可信任的AI应用研究。

未来二十年,通用人工智能(AGI)将成为现实,AI带给数字人文的不仅是工具和方法,还有更多的课题和问题。未来二十年,数字人文要实现再一次转向,即向智慧人文的转向。如何利用好人工智能并驾驭人工智能是研究的重要课题。未来二十年,数字人文学科边界将被彻底打破,不断交叉融合,诞生出新的领域和学科,自然的奥秘、社会的规律与生命的意义在方法论层面得到最终的统一。彼时,所有的人文都是数字人文,所有的人文学科都是科学研究的组成部分。

预测未来不如创造未来,我们应从被动的观察者转变为积极的塑造者。对于中国数字人文来说, 尤其是对于人文学界,未来要克服封闭保守、门户森严、对变化不敏感、对实践漠视、功利主义、追求象牙塔绩效的弊端;要关注真问题、开发新平台、总结新方法、建立新范式,倡导开放共享,跨界合作,在“大帐篷”底下团队作战,尽快产生颠覆性成果,使数字人文的地位得以高光和彰显,并在国际数字人文界发出中国声音。

作者简介:

刘 炜 上海社会科学院信息研究所所长、研究员。研究方向:智慧图书馆、数字人文、人工智能、知识图谱、图书馆服务平台。

嵇 婷 上海图书馆(上海科学技术情报研究所)副研究馆员。研究方向:智慧图书馆、人工智能应用、数字人文、公共数字文化。

(参考文献略)

发表评论

云瀚联盟-智慧图书馆技术应用联盟