Chinese-poetry最全中华古诗词数据库凑集了唐宋两朝近1.4万名古墨客的作品。毫无疑问,这些数据是弘大且繁杂的,尤其是在唐宋期间正式高产期,墨客多每个人作出的诗词也多,这个数据达到近5.5万首唐诗和近26万首宋词。目前,这个项目已经得到了22.6k个[star]和4.2k[fork],得到网友同等好评。
在被问到为什么要做这个项目的时候,项目的作者表示,中华古诗是中华民族乃至全天下的宝贝,完备值得、该当被传承下去的,虽然现在古典文集不在少数,但大多数人并没有这些书本。乃至从某种意义上来说,当代人离这些繁杂的纸质文集是有间隔的,但电子版不一样,方便复制粘贴,以是这个开源数据库应运而生。这个数据库是通过JSON格式分发,数据分发采取sqlite数据库,保留繁体,很方便项目的随时开始停滞。
古诗采集没有记录的过程,准确来说记录这个过程是不可能的,由于古诗的数据弘大且目标网站资源有限,采集过程常常被迫中断。两年前新加入了全宋词,全宋词爬取过程及数据剖析。
GitHub也根据节制的数据做了唐诗宋词中一些高频词的剖析图。辛弃疾、白居易和浣溪沙等都纷纭上榜了。
在感慨唐诗宋词之丰富的同时网友也感慨起了苏辛的贡献了,毕竟这两位可是宋词的顶梁柱般的人物。不过也有网友调侃,唐诗宋词这么完好恰好可以从中找字词给孩子取名字。
不管怎么说,最全的唐诗宋词这个数据库已经供应了,大家也该当好好地利用起来,毕竟古诗词作为精良的传统文化,是须要继续的。