2008年06月29日

ネイティブに近い英語を書くには2(コーパス:CORPUS OF AMERICAN ENGLISH の使い方)

先週はコロケーション辞書とコーパスの紹介をしましたが、今日はコーパス(言語データベース)のひとつである CORPUS OF AMERICAN ENGLISH の使い方について説明しようと思います。

データベースと言うとちょっと近寄り難い気もしますが、知的なおもちゃだと思って気軽に遊んでみて下さい。

 

ここをクリックすると、CORPUS OF AMERICAN ENGLISH の入り口に飛びますので、enter ボタンをクリックしてデータベースの中に入りましょう。

home.jpg

左が検索語や条件を入れるボックスで、右上に検索結果が出ます。右下にはサイトの説明文が載っています。サイトの説明文の最後に "five minute guided tour" という導入ガイドへのリンクがあります。

この記事は、そのガイドの要所を日本語にしたものです。原文には検索条件を自動入力してくれるリンクも貼ってありますので、この文章と並行して見るのもいいかも知れません。



genre0.jpg

まずは上記の通り、DISPLAY欄の CHART を選択して、WORD(S)欄に mysterious と入力して、SEARCHボタンを押してみましょう。

genre.jpg

上記のような棒グラフが表示されたと思います。左の5本は、3億6千万の文献データベース中の どのジャンルの文章に その言葉が高い割合で含まれるかを表しています。この例では、mysterious はフィクション関係の文章に多いと分かります(当たり前)。

右の4本は文章の発表年によって違いがあるかを見るためのもので、最近のはやり言葉か、もう最近は使われなくなった死語かが分かります。(といってもデータベースは1990年からしかありませんが)。



collocation0.jpg

次に「faint という言葉の後にくる名詞」という条件でコロケーション(関連語)を調べてみます。DISPLAY欄の LIST を選択して、WORD(S)欄に faint [n*] ([の前にはスペースを入れます)と入力して、SEARCHボタンを押してみましょう。[n*] は名詞を表します。

POS LIST をクリックすると品詞リストが出てきて選択できます。動詞は [v*] 、形容詞は [j*] 、副詞は [r*]、前置詞は [i*]です。その他の品詞リストはこちら

collocation01.jpg

「ぼんやりした、かすかな」という意味を持つ形容詞、faint は smile(微笑)や light(淡い明り)という名詞を修飾することが多いんだなと分かります。



変化形を含めて検索したい場合は、角括弧を使って [big] と表現すると、bigger, biggest などもまとめて検索できます。[need] to [v*]、であれば needs to work, needed to go などを検索できます。


ワイルドカード(任意の文字)を使うことも出来ます。例えば "un*ly" で検索すると下記のような結果が得られます。

wildcard.jpg


"r?n*" で検索したら下記の通り。(?は一文字のワイルドカード、*は文字数指定のないワイルドカードを意味します。)

wildcard2.jpg



collocation.jpg

コロケーションの条件を細かく指定したい時は、WORD(S)欄に見出し語(調べたい言葉)を、CONTEXT欄に品詞名を入れます。次に、見出し語から何単語離れた単語までをコロケーションとして扱うかを表す CONTEXT欄 右の2つの数字を指定します。

3と4なら、見出し語前の3単語以内、見出し語後の4単語以内を表していて、Her little (brother with his thick dark hair and laughing) sea-green eyes... という文であれば、カッコ内の単語を thick のコロケーションとして扱います。
(この様に、thick と hair がくっついていなくても関連語としてみなせる場合があるので、それを指定できるのがこの詳細条件指定です。)

thick の後 4単語以内に出て来る名詞を調べてみると、

collocation2.jpg

thick hair (濃い髪)という表現や、thick grasses(茂った草)、thick smoke(濃い煙)が良く使われるんだと分かります。こうしてよく使われる表現を知ると、英和辞典に載っている意味だけではなくて、単語本来のニュアンスみたいなものまで感じられますよね。



collocation3.jpg

smile という「名詞」の近くで使われる形容詞を調べたい時は、WORD(S)欄に smile.[n*] と入れます。smile には動詞もありますから、名詞として使っている文に限定させたい時に、こう書きます。[j*] は形容詞です。

collocation4.jpg

DISPLAY欄の SORT を RELEVANCE に変えると、頻度順ではなくて、関連の深い順にコロケーションが表示されます。つまり pepsodent(歯磨き粉のブランド名)という単語は使われる頻度は低いけれど、使われる時は smile と一緒に使われることが多いというのが分かります。


freq.jpg

歯磨き粉のように 使われる頻度の少ない単語を削りたい時は、SECTION欄の MIN FREQ で最低頻度数を決めることも出来ます。



compare.jpg

DISPLAY欄で COMPARE WORDS を選択し、SORT を RELEVANCE に変えた後、WORD(S)欄に2つの単語を入れて検索すると、それぞれの関連語が比較でき、似たような単語のニュアンスの違いを感じることが出来ます。

compare2.jpg



compare3.jpg

こんな検索条件で遊ぶことも出来ます。

compare4.jpg



[=beautiful]と書くと、類語(synonyms)を指定でき、頻度順のリストを見ることも出来ます。

synonyms.jpg

[[=clean]].[v*] と書けば、「clean という動詞の類語を変化形も含めて検索する」という条件になります。



いかがでしたか? 通常のライティングでは英和・和英とコロケーション辞典があれば大体事足りますが、論文やビジネス上の正式文書を書く際に、出来るだけネイティブに近いプロフェッショナルな文章にしたい、でもネイティブ・チェックを頼む時間、金、つてがない、なんていう場合には絶好の味方になってくれると思います。

また自分の頭に浮かんだ表現が実際に使われているかどうか、他にもっと自然な表現はないか調べてみたい、なんていう時にも便利です。


来週はオンライン英英辞典のリンク集をアップする予定です。ご興味のある方は、お読みになって下さい。
posted by けん at 10:15| Comment(6) | TrackBack(0) | 英語学習コラム | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
こ、これを無料で使えるとは!!便利で、有難いですねー!
ワイルドカードが使えたり変化形を含めて検索できたり
すごい!

ネイティブチェックの値段って、人によりますからねぇ。
それでは応援、3億6千万〜(←無理ですって)
Posted by うろこ at 2008年06月29日 18:22
うろこさん

他のコーパスってサンプル検索しか出来なかったり、検索条件がしょぼかったりするんですよね。CORPUS OF AMERICAN ENGLISH は太っ腹。
どうせだから使い倒しましょう。

応援返し、億千万〜億千万〜
Posted by けん at 2008年06月29日 19:24
こんにちは。

これはすごいですね!
連語辞典は、ときどき英文を書くので使っています。
いちいち調べないと、とんでもない文を書きそうなので・・・

とにかく応援♪
Posted by Q太郎 at 2008年06月30日 07:55
Q太郎さん

連語辞典にない量的比較が出来るところもコーパスの良さでしょうね。様々な検索条件も痒いところに手が届く感じでイケてます。

応援返ししておきまーす。
Posted by けん at 2008年06月30日 08:55
 ウォォォオ! こんなすごい無料コーパスがあったんですねぇ!
 ちなみに prostitute を検索したら、昔の方が使われていることがわかりました。(変な単語を調べてすみません・・・)
 かなりはまっていじっていたら、登録させられました。(笑)
 これは、本当に嬉しいです。ありがとうございました。
 英語ブログのネイティブスピーカー部門第1位、おめでとうございます!
Posted by ASAKA.YUTAKA at 2008年06月30日 09:02
ASAKA.YUTAKA さん

私もこれが無料(メール登録のみ)っていうのは驚きでした。他のちゃちな有料システムがあほらしく思えてしまいますね。

ロンドンの美術館に無料のところが多いのも素晴らしいと思いましたが、こういう教養を高める手助けになるものが無料というのは高く評価されていいと思いますね。

応援しに向かいまーす。
Posted by けん at 2008年06月30日 10:05
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/101214494
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック