龙语翰堂典籍数据库


停用
点击“教育网正式版”可以直接使用。
试用截止日期为2007年3月11日
如想在校外使用该数据库,请和图书馆咨询部联系(is@lib.pku.edu.cn)。
数据库介绍: 
           
“龙语瀚堂典籍数据库”采用基于Unicode四字节编码和自然语言全文检索的典籍文献数字化构建技术,以小学工具、出土文献、传世文献以及专题文献类数据所构架的独特内容,为历史、中文、哲学等学科的研究提供一个一体化数字平台。
龙语瀚堂典籍数据库以精准校对的小学工具类数据、出土文献类数据为基础,陆续纳入包括儒、释、道的各类传世文献,涵盖文史哲等专业的教学和研究工作中所应用到的专业古籍文献数据。未来将在庞大的数据支持下,根据不同专业领域对特定数据的学术需求,从而提供更具针对性的专题文献类数据。同时在此基础上,尝试蒙、藏等少数民族及基于UNICODE多语种文献的信息处理和检索技术,从而纳入更广泛资源。
龙语瀚堂典籍数据库所搭建的国学研究数字化平台,所有生僻汉字可在微软平台上自由编辑,不但彻底的解决了造字的繁琐,极大提高工作效率,更便于学术成果在全球范围内的广泛传播。数据库所独有的“知识链”特点使未来研究会延伸出更加独特的角度和发掘出更多的研究领域。

特点
1:独特的内容规划
龙语瀚堂典籍数据库采用四字节编码技术,以小学工具类数据和出土文献类数据为核心,逐步纳入大量传世文献,并以此为基础,建设各种专题文献。
小学工具类数据由于高达5%的生僻字频率,历来是各种古籍数字化工作不得不有意绕开的“雷区”。龙语瀚堂典籍数据库的小学工具类数据涵盖大部分重要小学类典籍和类书类书籍,并以囊括所有小学书籍和大型类书为己任。该部分数据是国学研究的基础性工具数据。
出土文献类数据涵盖大量甲骨文、金文、简帛文、印章、石刻等出土文献资料。提供器物照片、线图、拓片、释文等内容。该部分数据将是史学各领域研究的基础性数据。
逐步纳入的传世文献包括儒、释、道的典籍文献,力图呈现中国文化的轮廓性数据。

2:具有在通用浏览器上自由编辑和浏览的功能
采用B/S模式的“龙语瀚堂典籍数据库”,无需下载任何客户端,即可在通用浏览器上 进行阅读和编辑。由于该数据库采用四字节编码技术,彻底解决这些四字节汉字在计算机平台上的录入、显示、编辑、检索、查询和管理。全库无造字,所有文字可以自如的在MS-office上进行复制、粘贴和通过互联网进行广泛发布。

3:独有的四字节自然语言全文检索技术
相对于目前基于二字节字符系统的(即UCS-2)的互联网全文检索,“龙语瀚堂典籍数据库”(www.dragoninfo.cn)是全球第一个支持四字节字符(即UCS-4)、基于互联网的自然语言海量文本全文超高速检索系统。该引擎可以从海量的含有UCS-4字符的文本中在毫秒量级内进行信息抽取。

4:众多专利技术形成对核心技术的专利池保护
由于在四个字节字符方面拥有的核心技术和专利池,和对含有四字节汉字内容的版权 群,形成了对以UCS-2为技术核心的目前大量古籍数据库及其它检索网站的战略优势,为其主导甚至全球范围的网络检索领域的发展、建构领先的超级知识库提供坚实的技术保证。