纸端到云端:跨越百年的古籍生命续章当哈佛燕京图书馆的宋刻《十诵律》、元刻《隋书》在“识典古籍”平台展开高清书影,那些沉睡于大洋彼岸的千年典籍,终于以可触可及的姿态重回中文世界。更令人动容的是,齐思和、顾颉刚等学者的校勘痕迹与研究路径清晰可辨,而支撑这一切的,不仅是数字技术的突破,更是一段跨越百年的学术因缘与精神传承。
哈佛燕京图书馆的古籍珍藏,从来都是中外学术交流的重要坐标。这座馆藏13300余部(约15万册)古籍的宝库,坐拥4000部珍贵善本,3000余部方志占中国大陆现存总量的39%,1400余部丛书涵盖半部《中国丛书综录》,更有《永乐大典》残卷、毛氏汲古阁抄本等稀世珍品。这些典籍之所以能跨越重洋汇聚于此,源于上世纪二十年代一项极具远见的“文献双生”制度——燕京大学与哈佛燕京图书馆约定,学社经费购置的中文文献一式两份,分藏两地;燕京侧重西文参考与汉学著作,哈佛专攻宋元善本与方志,以此构筑中西互补的文献体系。
遗憾的是,战火中断了这座跨越太平洋的学术之桥,诸多精良古籍带着未竟的学术使命滞留海外。直到2023年,哈佛燕京馆方将全部善本影像无偿捐赠北大图书馆,这段百年裂隙才迎来弥合的契机。2024年,全国高等院校古籍整理研究工作委员会、字节跳动公益与北大数字人文中心联合发起“我用AI校古籍”行动,将7000部珍贵古籍转化为可检索数字资源,免费向公众开放。这场盛大的数字化工程,看似是技术赋能的成果,实则是对一段古老学术传统的赓续——那便是由“文献双生”制度推动者洪业奠定的“索引”传统。
“索引,是古籍之钥。”1893年生于福州的洪业,用这句箴言开启了中国现代古籍整理的新篇章。1922年,受司徒雷登邀请回国担任燕京大学历史学助理教授的他,面对当时学界设备简陋、藏书匮乏且散乱无序的困境,深刻意识到:“知识若如散落的珍珠无法串联,学术进步便会受阻。”他不再满足于募集资金扩充藏书,而是将目光投向知识体系的重建。
借鉴西方现代信息科学理念,融合中国古典文献学精髓,洪业耗费心力制作数千张卡片,创立“中国字庋撷法”,为古籍检索搭建起科学框架。1928年哈佛燕京学社成立后,他出任中国区主要执行人,在北平创立“引得编纂处”,制定出严苛的编纂制度:统一卡片规格、分离编纂校对,设立互校、复审、排印三道工序。他反复强调,编纂引得并非简单抄录,而是“整理学的训练”,要求学者具备精准的判断力与严谨的治学态度。在《引得编纂计划书》中,他写下振聋发聩的论断:“凡学术之进步,必赖材料之可检。材料可检,则学术可积。”这句话至今仍是中国现代目录学与信息学的思想源头。
自1930年起,《引得丛刊》陆续出版,累计64种81册,涵盖经史子集各类典籍;洪业撰写的《引得说》,系统阐释索引理论,其《礼记引得序》更厘清两汉礼学渊源,为他赢得1937年法兰西儒莲奖。抗战胜利后,他重返北平重建引得编纂处,迎来学术生涯的第二个高峰。1946至1956年间,他带领团队完成《二十四史引得》《资治通鉴引得》等大型索引及各类专题索引三十余种、八十余册,几乎覆盖传统典籍全领域。这些著作收录的十万至二十万条索引,均由他与同事手抄记录,在繁琐的劳动中搭建起中国近代学术最早的“数据逻辑”。
洪业的努力,不仅让学术讨论摆脱印象式转述,走向“就章有据”的严谨;更将“可检索、可验证、可复用”确立为学术交流的基本准则。他常说:“引得不是结论,是入口。”正是这个入口,让后世研究者能循着清晰坐标回归原典,完成比对与复演。更可贵的是,他始终强调学术是“公共基础设施”,主张“标准化与国际合作”,呼吁全社会共同维护知识系统,“避免学问沦为意见之争”。这份“共同维护知识系统”的理想,在百年后的今天,终于通过数字技术得以全面实现。
2022年,“北京大学——字节跳动数字人文开放实验室”成立,新一轮古籍数字化合作启动;同年10月,“识典古籍”平台上线,整合影像、文本与智能检索工具,成为国内首个覆盖古籍整理全流程的开放系统,完美延续了洪业“可检索、可验证、可复用”的理念。截至目前,平台已收录四万三千余部古籍,支持全文检索、注释、标点与比对,真正让古籍走出“深阁”,走向公众。
技术的迭代,让古籍整理的门槛大幅降低。“我用AI校古籍”项目启动后,三万四千名高校师生与社会志愿者参与其中,累计整理古籍一万九千余部,修订文本超十三亿字。平台文字识别准确率超96%,自动标点准确率达94%,命名实体识别接近98%,AI用彩色标记疑难字提示修正,将传统“手工作坊”式的整理转化为高效协作的“流水线”。北京大学数字人文中心副主任杨浩的评价精准道出核心变化:“AI先初步整理,志愿者校对,专家攻坚难点,分包制度让人人都能参与。”
华东师范大学博士生刘帅的经历颇具代表性。曾对古籍整理软件存疑的他,参与项目后效率飙升:过去一年仅能整理几十万字,如今一个月便可初步完成200万字,三个月内校点审阅191种书目、总字数超500万。他感叹:“AI习得的古文‘语感’,让整理工作事半功倍。”而机场调度员九衛的故事,则诠释了古籍整理的公共价值。这位热爱古籍的普通人,白天坚守调度岗位,夜晚化身“校书官”,在核对古本中揪出代代相传的错字,在学术协作中获得成就感,更凭借出色贡献加入进阶组,与专家同台探讨。
为激发公众参与热情,平台设计了完善的激励机制:志愿者凭校对贡献领取象征知识累积的冰箱贴,投入1000小时以上的核心贡献者可获“金典典”奖杯,已有50人获此殊荣;每一位参与者的名字,都将永久留存于平台。这种设计,让严谨的学术工作转变为全民可参与的文化实践,正是洪业“公共知识基础设施”理念的生动落地。
根据不同勘校贡献度可领取不同奖励
如果说洪业时代的“引得编纂处”,是十余名学者以笔为器、以纸为田的坚守;那么今天的“识典古籍”平台,便是数万名志愿者与AI并肩作战的传承。技术从未取代学术,只是回归了洪业的初心——让知识可检、可证、可继。
1979年秋,洪业去世前一年,与老友聚谈时感叹“相知多为鬼”,友人慨叹岁月老去,他淡然回应:“不久都过去了。”但他或许未曾想到,自己当年亲手写下的一张张卡片,早已化为数据库中的千万条索引;那些他牵挂的散佚典籍,正被无数人用数字技术重新点亮。
跨越百年,从纸端的手抄引得 to 云端的智能检索,从学者的孤军奋战 to 全民的协同参与,古籍传承的形式已然改变,但“守护知识、薪火相传”的内核从未动摇。这场无声的接力,不事喧哗,却在人与古籍之间,为文明延续写下最温暖的注脚。
本文来自微信公众号:凤凰WEEKLY,作者:何伟,编辑:刘暮
