在不断迭代更新的数字技术加持下,数字人文在过去的十数年间迅速进军中国人文与艺术各学科,在历史学领域逐渐形成了一个相对独立的分支——数字史学(Digital History)。如今,包括关系型数据库、大数据连接与量化分析、历史地理信息系统、社会网络分析、自然语言处理、知识图谱等逐步成熟的数字技术已越来越多地被运用于数字史学研究,新技术与历史学的融合呈现出欣欣向荣的趋势。受此影响,历史学界在教学、研究两方面都出现了诸多新动向:越来越多的高校建立起数字人文研究机构,“大数据”“人工智能”频频成为历史学年度研究热点词汇。华中师范大学和北京大学的历史专业先后开始招收“大数据与历史研究”硕士研究生和“人工智能与历史学”博士研究生,教育部更是在2022年将“数字人文”纳入本科专业目录。凡此种种,都昭示着数字史学在现有的教学研究体系中已落地生根并逐渐成熟,大有成为学科体系中固定一环的趋势。因此,讨论并明确数字史学的学科定位及研究规范正当其时。
数字史学的学科定位
尽管近些年来数字史学在多个层面开疆拓土,广受关注,但学界对数字史学的学科定位、研究的内涵与外延等基础问题尚未形成共识。一些学者认为,数字史学是一种新型的学术平台,是传统的历史、语言、考古等人文学科与现代信息技术交叉融合的产物,没有必要为其明确学科属性。不过,尽管跨学科是数字史学重要的学术特性,是其活力和价值的重要基础,其学科界限可以适当模糊,但无论如何,跨学科不等于没有学科。作为历史产物的“学科”,尚未成为历史。如果不明确学科定位,就无法明确要实现怎样的研究目标和遵循何种研究规范。实际上,人文学科由于研究对象的复杂性和研究方法的主观性,并不能完全熨帖地套入后设的“学科”概念中,是一直以来的现象。人文学科本质上都是跨学科的,但也都有本位学科。
不管如何定义,数字史学首先应该是历史学。多数学者都认同数字史学是技术与史学的结合,使用数字技术方法开展的史学研究——包括数字化研究对象和技术化研究方法的采用——都可以纳入数字史学范畴。数字史学不仅是一种工具和补充,更是史学研究的新思维和新拓展。无论采用多新颖的材料形态或使用多先进的技术手段,数字史学所要研究或解决的首先是史学问题。人文与科技的跨界交融催生出数字史学,但跨学科是对拓展学科边界的努力,是针对学科无法应对或解决问题的尝试,而非简单的学科综合。
明确数字史学的史学定位也会造成诸多限制,毕竟数字史学的运作方式,如高额的研究经费、多学科团队化的合作等都更符合工程学科长期以来的规范,与传统的人文学科较为疏离。但数字史学只有在史学研究中证明自身的价值,才能从学术上摆脱可有可无、花哨不适用的技术拜物教形象,真正成为一个自主自为、不可替代的固定领域。数字史学当然不只是借用数字技术开展史学研究。数字史料平台和相关研究成果已经为诸多社会科学甚至自然科学提供了学术资源或用武之地,需要给予数字史学必要的灵活性与兼容度以发挥其学术价值。但这只是数字史学跨学科建设的目的而非不明确学科定位的理由。
数字史学的研究目标
数字史学是运用数字技术开展和推进历史研究的新尝试,这不仅明确了其历史学科的定位,也同时表明开展数字史学必须以回应和解决史学问题为目标,以遵循历史学科的根本规范为原则,如此,方可实现数字史学研究成果和传统史学成果的学术对话与相互砥砺,也才能将数字史学逐步固定为历史学科不可或缺的一环。以科学精神规范地探求过往真实是现代史学的核心目标,数字史学同样应奉为圭臬。19世纪30年代,兰克(Leopold Ranke)及其柏林大学的同事们通过高度强调规范化客观性的“求真”,将历史学从文学批评的解释模式和主观化创造性中区分出来,打造出历史学科。规范化的历史研究就是将科学方法和程序运用于非科学领域,在“完成由培根、笛卡尔和伽利略等人开启的宏大知识活动”的同时,促使包括历史学在内的人文与社会学科发展壮大。在梁启超看来,历史学的“求真”不外乎两层目的:一是要知道人类过往究竟是怎样的“如此如此”,二是要在第一层的基础上推求“为什么如此如此”。虽然第二层看起来更高深和更有普遍意义,但对于历史学来说,解释必须建立在第一层“如此如此”真实可靠的基础之上,否则花在第二层上的功夫不仅是枉费的,还可能由此“自误误人”。因此,数字史学不应以追求方法的高明和技术的超前为目标,而应努力探求过往历史中未被呈现,特别是不借助数字技术就难以达到的历史幽深处,通过发现更多历史真实来实现学术交融并展现自身学术价值。
以求真为最高诉求,反对价值观先行的历史学,特别重视研究手段和路径的规范化——强调一手史料的收集与考辨,重视史料和解读工具相结合以探求历史的真实。史料是史学研究的基础和核心。尽管数字技术至少可以在史料保存与利用、辅助教学与可视化呈现和学术研究等多个层面发挥作用,但从研究角度看,无论是文本分析和挖掘、图像解读还是定量分析等跨学科技术手段,引入史学学科是否有价值、有多大价值,判断标准是能在多大程度上作用于史料,能否更有效地呈现史料中蕴藏的历史真实。例如,很多传统古籍史料被高分辨电子化后,不仅可以借助古籍标点的人工智能工具,高效并准确地辨识文献所记载的内容,还可以很好地成为数字史学家的研究对象,借助数字工具,突破过往人力限制,更好地解释和分析这些原始资料,在为研究者提供数字化工作空间(Digital Workspace)的同时,丰富或更新史学知识。因此,数字化史料、工具和方法的使用,通过更多地获取材料和新的合作与交流模式,已经使得过往没有数字资源和方法就不能进行的研究成为可能,并开始提出新问题。反之,数字技术若不能在分析史料和形成历史认识上有所作用,就无法成为数字史学。
数字史学的未来与挑战
2022年底以来,各种大语言模型纷纷问世。人工智能不仅侵入历史课堂,甚至改变着历史研究。尽管目前大语言模型在历史学家高度重视的史料链接与独立分析等关键任务上还不成功,现有大语言模型并没有理论突破和巧妙算法,只是人工神经网络在规模膨胀后形成的复杂系统涌现现象,这种现象背后的原理还不为科学家所掌握,但涌现依靠的是大文本训练,历史研究的对象恰恰主要是文本。如今数字基础设施正在被不断建设起来,特别是各种史料普遍电子化,当机器能够被投喂大量史料,基于文本求真的历史研究,完全也有可能被机器所渗透,依靠人工开展的史料比较、解读等工作会越来越多地被机器所替代,更具突破性的智能系统完全有可能在将来出现。届时需要讨论的一定不仅是数字史学,而是整个史学甚至人文学科的属性都需要被重新定义。
历史的真实不仅隐藏在史料里,也往往隐藏在与其他学科的交汇处。新一代的历史学者必须具备更多的跨学科知识与技能,数字技术与计算机设备不应该成为人文学者眼里的“黑匣子”,而应是“炼丹炉”。今天,历史学科在后备军的培养上,应重视自然语言处理和机器学习等信息技术领域。不过,仅掌握跨学科方法,不懂史料和历史背景,研究者很可能只是“有知识的无知者”。数字史学是开放的学术领域,不仅有历史学者,更有图书馆与档案馆专业学者、以政治学与经济学为代表的社会科学家以及网络与信息技术专家等参与其中,显示出相当的学术吸引力和活力。但在学科边界日益模糊的情况下,更需要明确其学科定位和历史学者在其中的责任,才能保证新领域的发展不会“误入歧途”。
(作者系37000cm威尼斯历史学院教授)