コーパス関連サイト




イギリスのコーパス

British National Corpus
略してBNC。1億語の徹底したサンプル・コーパス(バランスよく様々な領域からサンプリングして構築したコーパス)。かつてはその中に含まれていたデータの著作権者の一人が,どういうわけかEU以外での販売の禁止を主張したため,わが国でも入手が不可能となり,研究の進展を妨げていた。しかし,BNCは世界からの要望に答え,この「問題の」データをはずしたため,現在誰でも購入できるようになった。契約書(End User Licence)を2枚送って申し込めば,CD−ROM2枚が送られてくる(SARAというコンコーダンサが付いている)。シングルユーザーで£50。クレジットカードでの申し込みが可能。今後コーパスを本格的に使おうという人は買って損はしない。ただ,なにぶん1億語なので解凍するときに,パソコンがフリーズしたかと思うほど時間がかかるので覚悟しておくこと ^^;

コーパスの材料を集めるには

Drew's O-Rama
シナリオ多数あり。

ICAME
Brown Corpus 入手可(有料)。

CNN TRANSCRIPTS
ホットなニュース,インタビューのテキストが入手可。

Athelstan Online
Athelstanは第二言語修得関連のソフトを販売する会社で,Michael Barlow氏が関係している。米語口語コーパスも入手できる。

コーパス用の道具(コンコーダンサー)を入手するには

TXTANA
赤瀬川史朗氏によるシェアウェアソフト(シノニム辞典搭載)。

Corpus Wizard
浜口崇氏によるシェアウェアソフト。

WordSmith Tools
定番コンコーダンサー(有料だが機能豊富)。

Literary and Linguistics Computing-Online Services
約60にもおよぶ Text Analysis 関連のソフトのあるサイトが紹介 されている。テキスト分析のソフトが必要な方はここで見てみよう。

Text-retrieval, concordancing, and analysis software
トロント大学のサイト。数は多くないが,主要コンコーダンサーに 関してかなり詳しい(そして的確な)説明が載っている。

本格的コーパスを使ってみたいならば

The BNC Sampler
BNCから話し言葉100万語,書き言葉100万語,計200万語をサンプリングしたコーパス。30ポンドで買えるが,それよりは本体を50ポンドで買うことをおすすめする。

CobuildDirect
CobuildDirectは今や数億語となったコーパス,the Bank of Engilsh から5,600万語を抽出して作られたコーパスである。本格的に利用するとなると一ヶ月50ポンド,一年で500ポンド要るが,制限つきながらフリー・トライアル版もある。CobuildDirectについての利用については名古屋大学滝沢直宏先生のHPにある「基本的なCobuildDirectの利用方法」が詳しい。

是非訪れたい海外コーパス関連団体

ICAME
ヨーロッパのコーパス言語学のメッカ。

ライス大学 Barlow 氏のサイト
特に bibliography が充実している。

ランカスター大学コーパス研究所
ここではすでに20年以上にわたってコーパスを用いた自然言語処理の研究を行っている。

バーミンガム大学コーパス言語学
John Sinclair 氏を中心に先進的活動を行っている大学。必見。

オックスフォード大学言語センター
もともとオックスフォード大学関係者のための資料提供機関。英国における学術研究サイトが多数紹介されている。

Summer Institute of Linguistics
米国テキサス州ダラスにある国際言語研究所。コーパス関連資料が豊富。

CETH
米国 Prinston 大学と Rutgers 大学の協同プロジェクト。電子テキストの人文科学応用を進めている。
LDC
ペンシルバニア大を中心にコーパス構築を目的とする産学共同体。

ACL
lexical resource に関する情報あり。

トロント大学人文科学コンピューター・センター
コーパスに関する豊富な情報あり。

Computers and Language on the Web
自然言語処理および Computational Linguistics の研究機関,プロジェクト,その他の情報が満載。

Human Communication Research Centre
エジンバラ大学とグラスゴー大学のコミュニケーションに関する研究センター。人間のコミュニケーションに関する実にさまざまなプロジェクトが進められている。

Association for Computational Linguistics
Association for Computational Linguistics (ACL) は 自然言語と コンピュータに関心のある専門家集団。MIT Press より季刊誌 COMPUTATIONAL LINGUISTICS を発行している。

UCREL Home Page
ランカスター大学のリサーチ・センター。コーパス言語学に関心 があればここはマークすべきサイト。ここのreference は充実していて参考になる。Publications Bookshelf もおもしろい。

コーパス言語学入門

Catherine N. Ball 氏のサイト
Ball氏はジョージタウン大学で教鞭をとる新進の言語学者。 LING-361でComputational Linguisticsに関する講義録が読める。

Corpus Linguistics
コーパス言語学入門のサイト

Concrodancing
香港大学のコーパス言語学関連サイト。コーパス言語学に関する基本的情報が入手できる。

SSLiMIT - Corpus Linguistics
ボローニャ大学のコーパス言語学に関するサイト。コーパス言語学 関連の基本的サイトが紹介されている。


国内コーパス言語学関連サイト

英語コーパス学会(JAECS)
日本唯一のコーパス言語学学会。コーパス情報を得るためにも,みなさんも会員になりましょう!もともと関西が主でしたが,現在では関西と関東交互に年二回の学会が開かれています。会員も200名を越え,さらに増えつつあります。

岡山朝日高校鷹家秀史先生のホームページ
わかりやすい。コーパス言語学だけでなく,興味ある書籍の紹介もある。

徳島大学井上永幸先生の研究室
基本的資料はここで入手できる。井上先生は日本のコーパス言語学では第一人者のお一人。BNCの使い方など必須情報あり。

東北大学 後藤斉先生のホームページ
後藤先生の論文など,コーパス言語学についての貴重な資料が入手できる。

東海大学 朝尾幸次郎先生のホームページ
インターネットを教育に生かすために努力されている朝尾幸次郎先生の研究室。

名古屋大学 滝沢直宏先生のホームページ
コーパスをはじめ,語法など言語学関係の情報で得るものが非常に多い。

コーパスを英語教育に役立てる論文サイト

On the Use of Concordancing in ELT (Bernhard Kettemann)
EFLの教室においてコンコーダンスをどのように役立てるかについて論じられている。

Concordancing in stylistics teaching (Bernhard Kettemann)
教室でコーパスを利用することが大きな動機づけになることを示唆している。

Concordancing with Language Learners: Why? When? What? (Vance Stevens)
コーパスを利用した研究がいつどのように始まったかが詳しく説明されてる。

Improvising corpora for ELT:quick-and-dirty ways of developing corpora for language teaching (Chris Tribble)
大規模な既成のコーパスが手に入らなくても,周辺にある材料で作った自前のコーパスを活用することを教えてくれる。

Sensing the Winds of Change:An Introduction to Data-Driven Learning (Gregory Hadley)
DDL(Data-driven learning)についての紹介。特に日本の大学生に対して行われた点は興味深い。

CREATING AND USING A MULTILINGUAL PARALLEL CONCORDANCER (Philip King and David Woolls)
バーミンガム大学で開発されたWindows用コンコーダンサーの仕組みとその 利用法について述べている。

International Journal of Corpus Linguistics
ICAME Journalと並んで,John Benjamins Publishing Company のこのジャーナルはコーパスに関心のある人には必読である。ここではアブストラクトが入手できる。(中には全文のものもある)

Tim Johns Data-drive Learning Page
同じくTim Johns のサイト。ここでは Data-driven Learning に ついて詳しい説明がある。コンコーダンサーを授業の中で活用し たいと思っている人には必見。

その他コーパスに役立つサイト

Collocation Home Page
英語教師,生徒,研究者別にさまざまなコロケーション情報が紹介されている。とても役に立つサイト!

Computational Linguistics Mailing List and Newsgroup
コーパス情報はメーリングリストに加入して入手しよう。ここでは世界のメーリングリストが紹介されている。

Concordancer
インターネット上から検索語をサーチする。

Concordancing and Corpus Linguistics
コンコーダンスに関するサイト・資料にリンクしている。

Corpora and Linguistics
20ほどのコーパス言語学関連サイトを紹介。

Corpora List Archive in Hypermail
メーリングリストCorporaの過去ログが読める。主題別にも検索できるので コーパス関連の思いがけない情報が手に入るかも?

CTI Centre for Textual Studies
CTIとはThe Computers in Teaching Initiative の略。 英国におけるコンピュータを利用した大学教育を推進するプロジェクトの一つ。中でも Ask CTI Textual Studies のコーナーは Q&A形式で text analysis toolの入手サイト紹介などあり,重宝する。

IJCL Home Page
John Benjamins社のInternational Journal of Corpus Linguistics 最新号の内容がわかる。この雑誌はコーパスの大御所達が寄稿しているので購読を 勧める。購読方法はこのHPからメールで問い合わせればよい。

Textual Databases General Corpus Linguistics
Alberta 大学スーザン・ホッキー氏によるサイト。

Tim Johns CALL Page
バーミンガム大学 Tim Johns 氏のHPの一部。クローズテスト用の プログラムが入手できる。CALL関連のサイトの紹介あり。

Word Wizard
言葉に関心のある人のサイト。ここの会員に登録すると言語関係の様々なメールサービスなども受けられる。無料です(^_^)

Wordlists and tools
子供の fiction や 英文評価(といっても手持ちの語彙リストとチェック するだけですが)ツールがダウンロードできる。



Home Pageへ