4月29日,中南民族大学文学与新闻传播学院的王兆鹏教授在上海古籍书店分享了自己在“大数据时代唐诗研究”领域的最新成果。此前,王兆鹏用大数据的研究方法推出的唐宋诗词研究的定量分析成果引起了学术界和公众的广泛关注,诸如 “李白最喜欢用的词是黄金,杜甫最喜欢用万里”“宋代,浙江一省的诗人数量占了全国的四分之一”等结论是这项研究所引发的有趣问题。数字化及可视化研究能否给传统人文学科带来新的改变?这一问题的热度在争议中节节攀升。
“大数据时代唐诗研究”讲座现场 (图:上海古籍书店)
二维地图:一键检索唐代诗人一生行迹与作品
历代以来,学者们对唐诗的批评和研究,无论是诗话、评点,还是选本、诗坛点将录等传统形式,大部分是感悟、直觉和印象式的,缺少整体上的理论思辨。而时至今日,我们可以通过定量分析和大数据的方法,为唐诗研究带来哪些改变呢?王兆鹏指出,唐诗研究领域至少需要作家、作品、读者三个方面的数据。从作家角度来看,我们所需要的信息,有时间层面的生卒年、享年、进士及第年、进士年岁、创作起始年、创作终止年等;空间层面的出生地(籍贯)、定居地、去世地、活动地、贬谪地等;以及身份层面的帝王、宰相、将军、帅臣、幕僚、官员、隐士、布衣、僧道、歌妓等等,都应该进入研究的视野。
近年来,王兆鹏及其学术研究团队从《全唐诗》《全唐文》的作家小传、《中国文学家大辞典·唐代卷》、年谱及生平考证类论著中持续挖掘相关数据,先后制作成《唐代诗人信息统计表》《唐代文学编年地图平台》等多个数据库(表)。他们在不断摸索中改进,试图寻找出海量数据背后文学衍生发展的规律。