百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

共生与共构:人工智能与历史学结合的新探索

myzbx 2025-02-15 00:15 14 浏览

编者按

近年来人工智能技术飞速发展尤其是ChatGPT、DeepSeek等生成式人工智能技术的兴起,为历史研究和教学带来新的机遇。借助人工智能技术,历史学家们可以便捷地获取数据、释读史料,发现不同文本之间存在的关联。此外,运用人工智能进行历史模拟,也逐渐成为历史教学中积极探索的方向。人工智能为史学研究带来便利的同时,也给历史学家的工作带来不少挑战,如学者们必须注意到生成式人工智能引用的已有数据可能会存在价值偏见,进而影响输出内容的真实性等。人工智能与历史学之间如何共融共生?人工智能时代历史学家应该如何提升技能,积极运用新技术,推进历史知识生产和公共历史实践呢?基于此,本版特刊发专题文章,以期对上述问题作出回答。

作者:向静(中国社科院大学数字史学研究中心副教授)

当前AI(人工智能)正在逐渐改变世界,成为政府决策、医疗干预、金融交易、司法审议、环境保护、科学研究等领域的重要“参与者”。历史学者将要面对的是一个前所未有的与AI共生的时代。不过,到目前为止,大多数学者并不认为AI会从根本上改变历史学,或者历史学会对AI发挥关键性的作用。

这种态度部分源自于人文学者将AI理解为机器能力的进展,从而把接受AI视为纯粹的技术问题。1956年,美国科学家约翰·麦卡锡提出了“Artificial Intelligence(人工智能,简称AI)”这一术语,指代能展示人类智能行为的计算机系统。数十年后,随着计算能力提高、有了可用的大规模数据集,在2010年代中期,出现了基于深度学习技术的算法决策系统与预测性的机器学习,“人工智能”的涵义不断扩展,代表了IT系统(包括机器或软件系统)通过学习和解释庞大的人类记录数据,实现模拟人类认知能力的一系列技术、方法和流程。机器学习的算法和模型走出了学术研究与科学实验,开始应用于商业、医疗、教育以及国家战略等层面。戏剧性的转变发生在2022年底,生成式AI的应用ChatGPT问世,上线两个月,活跃用户达到1亿人,在引起广泛关注的同时,也促进中国开发的诸多大语言模型(LLM)投放市场。2024年底,DeepSeek上线并同步开源的V3模型,以其创新的模型构架和高性价比点燃了民众以中文使用AI的极大热情。通过ChatGPT、DeepSeek、Kimi、豆包这些国内外聊天机器人,AI对于普通人变得触手可及。人们能运用自己熟悉的语言指示机器执行任务,个人的决策、行动随时可以参考、调用算法和模型,机器的回应不仅符合人类表达的逻辑,顺畅自然,还能针对个人的输入进行调整,如同一个适应性强、情绪稳定的同伴,使人感到亲近。在与人类的互动关系上,这是人工智能一次革命性的飞跃,大语言模型不仅是一项在语义空间里应用生成式人工智能的典型技术,还下沉到日常生活,拉近了人类历史与现实之间的互动关系。

虽然到目前为止,人们还无法解释人工智能算法在内部运行的机制细节,但通过其训练过程,可以看到它正在为人类历史与现实的关系提供一种从未有过的数字交互模式。以生成式AI为例,开发者为了让AI理解人类语言的指令,实现人机连贯对话,主要让机器学习大量的文本数据。近两年来,现有的基础大语言模型几乎使用了绝大部分的可用高质量文本数据源,其中公开的、数字化的历史记录、档案、书籍论文虽然数量占比不大,对AI的训练影响却很重要。通过理解这些训练文本背后的结构,AI实现了与人类语言的“对齐”,也表征了这些历史文献与历史认识当中反映出来的偏好、价值观与意识形态。主流的机器学习算法目前都近似于一种优化多数的策略,擅长从历史数据中识别模式与类型,如果用于训练的历史文本和图片里含有明显的偏见、歧视与局限性,数量又多的话,就会被AI当作重要的参数,带入判断当下、影响未来的决策和预测当中,威胁到人类社会的安全、伦理、道德等基本需求。换言之,训练AI的过程,是在使AI历史化,从数据中获得定义过去的方法;运用AI的过程,则极大加速了从认识过去到付诸当下行动的转化,使人类历史与现实活动之间的关系在数字层面上呈现为一种持续相遇、顷刻相通、实时作用的互动形态。从一开始,AI系统的研究与应用,可以说就是赋予AI历史性与社会性的过程。

为了确保这项新信息技术的发明能服务于人类共同的福祉,除了技术开发者外,还需要人文社会科学工作者的深入理解与广泛参与。对历史学者来说,这会是一个与AI共同建构学科、学理与学识的过程。一方面,AI会促成重大的历史变革,它能自行决策、提出想法,将来还会使大量的非人类智能加入对历史的研究当中,它们擅长高速处理多模态的历史资源,通过智能体模拟进行“虚拟历史实验”,可能提出对复杂社会的解释系统,挑战人类学者的主体性,重新界定历史学的存在边界与独特领域。另一方面,历史学者如果能理解并掌握AI,可以增强历史学的技艺,作为领域专家参与审查AI训练的历史数据集,从长期的历史脉络中揭示AI系统的价值内嵌与认识机制,评估AI的预测、决策,并将历史学提供的对过去记忆与事实的选择书写,对人类活动价值与意义的总结反思,通过数据构建与算法改进,贯注作用于AI系统,影响AI的走向。

以古代历史研究为例,可以看到AI与历史学者之间这种正在探索中的共同建构。对于历史研究工作的核心要素与基础工作,AI能发挥积极作用,同时历史学也有力量推动AI从数据与算法两方面改变现状、提升性能。

为了理解古代社会、探究人群生活,历史研究需要的史料搜集与处理技艺非常复杂,比如泥板、纸草、甲骨、金石、写本这些载体的文献修复,古汉语、古希腊文等多种文字的识别与释读,图像、雕塑、考古遗址的辨识、分类等。近年来,学者运用深度神经网络、卷积神经网络等深度学习技术,结合迁移学习等策略,贡献出了前沿成果。中国科学院团队提高了甲骨文字符的自动识别率;谷歌的模型Ithaca,能合理推断古希腊铭文的时间与地理归属范围;浙江大学团队实现了缀合敦煌写本的自动化流程;中国矿业大学团队发布敦煌壁画的MuralDH图像数据集,进行分类、修复。2024年初,机器学习从碳化的意大利赫库兰尼姆卷轴里,识别出了莎草纸符,提供了古希腊哲学的新史料。像这类具有原创性和影响力的工作,都是由包括历史学在内的领域专家与计算机科学家组成的跨学科团队完成,显示出AI对历史研究的来源,尤其是在多模态史料发掘、解析方面的效能。由于目前大多数的AI算法依赖英语等主流语种,偏重近现代的历史训练集,在将AI运用于古代语言的文本、图像与考古对象时,需要明显扩大数据的多样性和包容性,在使AI处理古代历史中非标准化的、异质的、不完整的资料时,也要同时推进算法的批判性创新,这都显示出历史学研究将是助力AI突破结构性限制的重要领域。

研究古代的学者,也可能遇到史料数量庞大或者类型复杂得难以把握,此时找寻到最合适的AI技术,不仅使研究得以展开,还能发现隐藏的事实,提出有解释价值的新问题。在一项针对15至17世纪欧洲史的研究中,学者需要考察359本天文学教科书,其中含有76000页文本、数万幅科学插图与天文表格。德国马普所的研究人员通过机器学习来识别文本间的联系,检测、分类与聚类这些插图和表格,历史学者则从数据中看到了以前不被注意的事实,即欧洲的科学知识传播并不受宗教改革的分裂影响,而是呈现出凝聚与同质化的形态。这一时段对应着中国历史上的明清时期,研究者们同样也面临着史料复杂烦琐、文献汗牛充栋的问题,对于在整理、分析与思考中如何运用AI系统有着迫切的需求。比如对于明清档案文献,中国人民大学团队提出了深度学习、人机协同的智能著录标引流程;对于地方志研究,中国社科院大学团队开发了专有工具,通过调用大语言模型的API端口,批量实现方志数据的多层次、多义性标注,以知识图谱进行可视化呈现与分析。这些尝试都希望能从明确的问题出发,探索以数据建设为核心、以算法呈现历史语境、具有透明性与可解释性的研究工作流程,以一种符合职业与专业的要求,来推进与AI的共构,使研究者把更多的时间和精力解放出来,真正用于历史学的创造性思考、深度解释以及价值反思。

在积极拥抱AI变化的历史学者中,很多人从数字人文、数字史学的兴起之时已经在讨论史学与AI的共生之道。在AI迅速发展、推理思考能力不断迭代的当下,相信还会有更多的历史学家主动了解AI运作的机制,视其为学术助手、影子同行,共同建构一种从思考、写作到交流、教育的史学工作新生态,这将是一场引人注目、面向未来的探索之旅。

(本文系国家社科基金重点项目“清史地理信息系统开发与研究”的阶段性成果)

相关文章:①游戏还是工具——生成式人工智能与历史模拟 ②人工智能在史学研究中并非无往不利

《光明日报》(2025年02月10日 14版)

来源: 光明网-《光明日报》

相关推荐

攀升战境S5电竞主机评测:NVIDIA RTX 3060实力助阵,光追游戏走起

此次笔者将为玩家们推荐一款游戏主机——攀升战境S5。该主机是攀升电脑今年力推的游戏装备,主机采用一线品牌配件,特别是在显卡选用上严苛把关,精选GeForceRTX30系列显卡,玩家们大可以放心选购...

慎买-神牛闪光灯兼容性问题:神牛V350&松下S5M2

神牛V350和松下S5M2的兼容性问题。大家好,我是向往闪光灯人像的Fish。国庆期间,我购买了神牛V350闪光灯和神牛X2T引闪器,但这成为了我的噩梦。我原以为客服和松友们说这款闪光灯在松下S5M2...

Acer蜂鸟持续办公一整天(acer 蜂鸟s5)

移动办公在工作节奏日益加快的今天越来越普遍,目前大部分工作无法在手持设备上完成,笔记本依然是移动办公最明智的选择。为了实现移动办公,很多笔记本越做越轻薄,性能也越来越强,而续航却一直没有很大提升。笔者...

职业车手明年会骑什么?2021赛季各大世巡赛车队使用器材一览

新年的钟声即将敲响,意味着充满魔幻色彩的2020年即将过去。受新冠肺炎的影响,2020年的赛季非常不同寻常。因这一原因不得不延迟举行的各种比赛导致许多车队的赞助商无法得到足够曝光,这也间接导致了许多车...

三星部分手机系统升级路线图流出(三星系统在哪升级)

三星包括Note3和S5在内的手机在升级到4.4.2系统之后一直没有什么系统升级的消息,而最近流出的一张三星的系统升级路线图中出现了一共13台手机升级KTU84P(也就是Android4.4.4)...

索尼Xperia Z3配置大曝光:升级并不大

IT之家(www.ithome.com):索尼XperiaZ3配置大曝光:升级并不大索尼明天就会在IFA2014大会上发布其下代旗舰XperiaZ3智能手机,目前网上曝光了其原型机,并且机身背后...

不进反退 三星Exynos 5433只能运行32位模式?

三星GalaxyNote4将带有两个版本,除了国行使用的骁龙805以外,还有三星自家的Exynos5433版本。而这颗SoC的详细信息三星并没有公布,据外媒Anandtech称,他们从源码中确认...

尼康Z6III测评:对比EOS R6 II、A7M4、S5IIX

摄影器材测评网站DPReview刚刚发布了尼康Z6III的完整图文测评,该机获得金奖评级,得分达到91%。以下是该文章的摘录——尼康Z6III核心规格:2400万像素“部分堆栈式”传感器RAW连拍:机...

赛默飞Ion S5首批数据公布,玩爆前任PGMTM系列

北美时间9月1日,赛默飞发布了两款最新的NGS系统IonS5和IonS5XL,旨在提供更加简捷的靶向测序流程。10月29日IonS5测序仪的首批实验数据产生于阜外医院。阜外医院研究人员选用了主...

Excel技巧:快速制作批量文件夹,省时省力,加强工作效率

大家好,如果公司领导要求按人员姓名制作文件夹,以一人一档的形式呈现人员档案,办公人员一个一个制作费时费力,而且效力低下,今天为大家介绍快捷制作批量文件夹的方法下面我们用图片来进行演示操作打开表格,选...

国行、港版、美版Apple watch各版本售价一览

今天凌晨,苹果牌手表正式发布,苹果开始正式进入可穿戴设备领域,除了功能和外观,我相信大家更关心的是价格问题了,小编就将国行、港版、美版的Applewatch售价做一总结,以供参考。国行:美版:港版:...

松下全画幅微单S5和S1到底哪里不一样?

Hello,我是ET,欢迎大家来到我的“相机笔记”。————9月2日晚,松下正式发布了第4款全画幅微单LUMIXS5。这一篇,我们主要来说松下LUMIXS5和LUMIXS1到底有哪些区别...

融会贯通之典范 神舟S7-2021S5评测

便携、性能、续航,这简简单单的六个字道出了这么些年来笔记本电脑的设计方向,可是由于底层技术、模具设计等等原因,这三点并不能很好的融合在一起。虽说闻道有先后,术业有专攻,但能够有一台融会贯通的产品,不是...

三国志战略版:S5赛季装X指南,开荒不是一成不变,需要因地制宜

大家好我是零氪玩家花席,S5赛季已经开始,因为S5赛季的野地阵容和S4赛季没有区别,所以S5赛季开荒相对不难。你在S4有经验,并且多了很多武将和战法,还能用150赛季功勋兑换7500战法点。S5赛季新...

聊聊松下S5M2和S5M2X的区别(松下s5k和s5c有什么区别)

先简单说下哪里不同:12bitRAWHDMI外录支持直接将视频录制到USB-SSD上多了All-Intra和ProRes编码支持有线/无线IP推流,USB网络连接黑化的机身不过要特别强调一下,S5...