与此同时,关注“唐诗系年系地地图”领域的数据分析爱好者也很不满足。“唐宋文学编年系地信息平台”已经取得一定的成果,但若与技术工具的发展相对比,又难免令人兴起望洋之叹。目前,“唐宋文学编年系地信息平台”的信息展示方式仅有点状散点图一种,但现今大众常用的数据地图至少包括气泡图、面积图、点状图和热力图四种,每一种又各有丰富的操作工具和呈现方式。如果考虑到与词云、指标卡、计量图、瀑布图、桑基图、旭日图和雷达图等多种信息图(Infographic)的综合使用,那么未来的文学地图数据可视化(Data Visualization)之路,应该会走向形式更加丰富的交互式可视化方向。
此外,更加重要的是,大数据分析方式的核心基石是海量异构数据(massive heterogeneous data),目前“信息平台”仅仅有不到两百位唐代诗人的行踪和诗歌数据,预计到年底诗人的数量可以增至500余位,然而这与唐代诗人的总量相比仍然略显单薄。因此,快速增加大量相关诗人的数据就成为“信息平台”发展和维护的当务之急。据王兆鹏介绍,项目组下一步可能会与哈佛大学费正清研究中心《中国历代人物传记资料数据库》项目组合作,共享数据资源。
经典信息图之一,《拿破仑东征图,1812-1813》。1861年,由法国工程师 Charles Joseph Minard 绘制,描述了1812年拿破仑东征俄罗斯的失败战役。图中同时包含了多个信息,粗细代表军队规模,配合日期标明了军队位置经纬度,棕色进军黑色撤退,下方折线展现气温,另标注了战斗的关键事件等。
《经济学人》杂志的数字编辑肯尼思·库克耶(Kenneth Cukier)在其著名的TED演讲“大数据好处多”(Big Data is Better Data)中曾提出:“现在,更多的数据不仅仅让我们在同一件事情上了解更多,它可以我们有新的发现,能更好地了解,并让我们从不同视角去理解事物。”在海量数据和数据可视化的基础上,传统人文研究能否走出一条兼具信度效度与吸引力的创新研究之路,将是人文研究者和数据分析师未来需要共同回答的命题。