AntConc中文版是一款非常好用的语料库检索工具,对于从事语言文字研究学习的朋友特别有用,它具有索引词表生成,主题词计算,搭配和词族提取等多种功能,以很方便地用来分析文本中的词汇主题。
AntConc是免费的语料库检索工具,适用于语料库语言学、翻译学、外语教学等领域的研究者。该软件的开发者是Laurence Anthony,他是日本早稻田大学(Waseda University)教授。AntConc的一个非常重要的功能是计算相对于参照语料库(reference corpus)的观察语料库(observed corpus)中的主题词(key word)的主题性(keyness)。
AntConc中文版功能介绍
AntConc开始是作为相对简单的索引程序,不过慢慢地进步成一个相对有用的文本分析工具。它是在ActiveState供应商的优良Komodo跨平台支持多种程序软件的开发环境下用Per15.8程序语言写成的。
AntConc包括以下工具:素引**Concordance**索引定位**Concordance Plot**文件查看**File View**词丛**Clusters**N元模式(部分词丛)**N-Grams (part of Clusters)**搭配**Collocates**词单**WordList**关键词单**Keyword List**注意每个工具都可以点击工具窗口上各自的选项卡或者使用功能键F1至F7打开。
怎么用ANTCONC分析汉语语料?
首先是分词,因为中文非常特殊,不像英语那样每个单词之间都有间隙,电脑可以轻易识别单词,但是汉语大家都知道的,一般都是以标点符号隔开,所以我们需要用其他软件分词。我用的是rost来分词,分词之后大概就是这个效果:
这个软件很贴心,自己就会写好“分词后”。
然后就是“转码”
我们先把我们要用的语料粘在Word上,然后保存格式选为“纯文本”之后再,点击TXT(纯文本)文件-另存为-编码下拉-utf8-保存。这一步我也是找了好久,很多人都说改成Unicode,我试了无数次,都不行,不管哪个版本的antconc都不行,我好难过~
后来我换成了utf8,其实这个是属于Unicode的一种的。
然后我们就可以打开antconc-files-open files-选中我们修改好的文件,就可以操作啦。
点击start就可以看到这个界面了,祝大家好运。