BCC语料库全称为北京语言大学汉段盯语语料库,由北京语言大学信息科学学院大数据与教育技术研究所开发的BCC汉语语料库,总字数约 150 亿字。
包括:报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30 亿)、综合(10 亿)和古汉语(20 亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。
CCL语料库全称为北京大学汉语语言学研究中心语料库,它分为“古代汉语”和“现代汉语”两部分,古代脊燃瞎汉语语料库收录了自周朝到民国共 15 个朝代的各种体裁的古代汉语语料 1059 个,现代汉语语料库收录现代报刊、文学作品等汉语语料 1696 个。
作文对译语料库该语料库收集了一些日语学习者(母语包括但不仅限于汉语)的作文,一部分有日语老师批改的痕迹。通过这些作文中反映出来的问题,我们对照自身,有则改之无则勉。
青空文库樱空也是我们会经常用到的一个语料库。它收录了很多在日本国内版权到期或者作者允许公开发行的文学作品。不需要注册,可以直接在线观看。
版权声明:文章由 百问九 整理收集,来源于互联网或者用户投稿,如有侵权,请联系我们,我们会立即处理。如转载请保留本文链接:https://www.baiwen9.com/life/127517.html