3月13日下午,中国科学院自然科学史研究所研究员孙显斌博士在仙林校区杜厦图书馆为我院师生开展讲座,题为《数字人文视野下的古籍数字化》。信息管理学院图书馆与数字人文系主任谢欢副教授主持讲座,图书馆史梅副馆长、部分馆员、我院相关专业同学参加了讲座。
孙显斌,北京大学中文系古典文献学博士、计算机软件专业学士,现为中国科学院自然科学史研究所研究员、中国古籍保护协会古籍智能开发与利用专业委员会委员、北京大学数字人文中心兼职研究员,“中国科技典籍选刊”联合主编。曾任中国科学院自然科学史研究所所长助理、图书馆馆长。著有《〈汉书〉颜师古注研究》《攻玉集》,整理古代科技典籍《王祯农书》《物理小识》等,参与开发“资治通鉴分析平台”“中国历代典籍目录数据集成与分析系统”等。
孙显斌首先介绍了数字人文在国际、国内各方面方兴未艾的发展实况,已成立相关的学会与期刊。然后梳理了古籍数字化从20世纪80年代至今的发展历程。在 “大数据”时代,人文研究面临双重挑战,经典文献既精深又博大,需要新的整理方法——典籍数字化,包括图像化、文本化、本体化三个层次。接着他举了一些古籍数字化的工程实例,如李铎教授率领的北京大学数据分析中心团队与中华书局合作开发的“资治通鉴分析平台”,功能包括:全文增强阅读、本体标记、本体导航、检索、全景分析、人物相关性分析、聚类分析、事件—时间统计分析等。古籍目录数据库目前已完成共约30万条典籍目录数据的结构化、规范化加工,线上可视化查询及分析系统的设计开发以及分析构架的构建,可进行数据加工、检索统计、类目演化分析等。最后,对古籍数字化的前景进行了展望,新动向是人工智能技术的引进,包括古籍OCR技术、自动句读标点、命名实体标记等,实现古籍整理研究智能化平台架构,探索与发展方向是进一步推进理论化、工程化、建设基础设施,如知识库建设、文本语义分析等。
讲座结束后,全场听众报以热烈掌声,谢欢副教授作总结,相关馆员就数字人文实现过程中的困难与解决办法与主讲人进行了充分交流。