「中納言」を活用したコーパス日本語研究入門

投稿者: | 2021年12月17日

今日ご紹介する本はこれ。中俣尚己(2021)『「中納言」を活用したコーパス日本語研究入門』ひつじ書房

タイトルそのまんまの本で、「コーパス日本語研究の入門書」的なものです。この本を読めば、「中納言コーパスの使い方」と「それを利用した研究の方法の基礎」がわかると思います。

コーパスとは?

と、ここまで読んで、「コーパスって何?」と思う人もいると思いますから簡単に説明しときます。

コーパスとは、Wikipedia先生によりますと、

言語学において、自然言語処理の研究に用いるため、自然言語の文章を構造化し大規模に集積したもの。構造化し、言語的な情報(品詞、統語構造など)を付与している。言語学以外では「全集」を意味することもあり、言語学でも日本語を扱う場合には、「言語全集」「名詞全集」「動詞全集」などと呼ぶとよい。コンピュータ利用が進み、電子化データとして提供されている

https://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%83%91%E3%82%B9

だそうです。要は大量の実例が保存されてあって、それを様々な条件で検索できるものと考えれば良いのではないかと思います。

タイトルに入っている「中納言」はそのコーパスの一つの名前です。国立国語研究所により開発されたもので、それはそれは大量の実例が記録されています。私も論文を書いたりしたときにだいぶお世話になりました。

ただ、この中納言って、「思い立ったが吉日」でもすぐに使えるものでもなくて、確か郵送とかで申請をしないと使えないんですよね。ですから誰でも気軽に使えるものではないですけど、その簡略版?の「少納言」はもう少し気軽に使えます(2021年12月17日現在は使えないみたいです。そのうち使えるようになるはず。)

少納言
中納言

コーパスの用途

そんなの何に使うの?というと、それはどのような実例がどの程度の数量的規模で使われているのかを知るためです。

例えばですね、日本語教師のコミュニティでも「こういう例文は不自然でしょうか」という質問が時々されますよね。それに対しては「私はよく使います」とでも、「私の語感では使いません」とでも答えられますが、

その回答のエビデンスを示せ

と言われると困りますよね。「エビデンスと言われたって、私の感覚ですから…」。そんな時に「中納言で検索した結果そういった用例が1200例も見つかりました。そのうちの10例を書き写します。」とでも書いておけば、相手はぐうの音も出ないはずです。

…ってまあ、普通は相手も糞もないんですけど、日本語教師の普段使いとしては「そういう用例が普通なのか、特別なのかを調べる」というのが、コーパスの使用法の落ち着くところかと思います。

意外な盲点に気づく

「まあ、なら特別な人だけが使うものなのね。私は読書量は足りてるからそんなものに頼る必要はない」と思った人いますよね?

例えば、本書でも言及されているんですが、「~てある」の用例について調べてみたらしいです。日本語の教師の皆さんであれば、この部分なかなか教えるのが面倒なところだとわかると思います。「~ている、~てある、~ておく」なんかがセットで教えられたりしますよね。

で、「~てある」を練習するとき、どんなやりかたをしましたか?私も本書を読んで笑ってしまいましたが、著者の方も「パーティーの準備」という設定で練習をやっていたそうです。ある年齢以上の日本語教師の方々!そうですよね?あなたも「~てある」を「パーティーの準備」の設定で練習しましたよね?

ケーキは買ってあります。
テーブルはふいてあります。
花は飾ってあります。
ビールは冷やしてあります。

的な?でもね、コーパスとか調べてみると、「~てある」の用例の多くを占めるのは、

書いてある

なのだそうです。ですから、極端な話をすると、実際の生活や仕事での使用頻度を考えても、「~てある」は初級では「ここにこう書いてあります」的な使い方だけ教えておけば十分だということになるんですね。

こういう話は以下の同著者の本を読むとよくわかります。いわゆる初級文法に関して調べて、どういう文法表現はどういう動詞や語彙とよく共起するのか、というのを数字とともに表したものです。

中俣尚己(2014)『日本語教育のための文法コロケーションハンドブック』くろしお出版

私はこの本とってもおもしろいと思いました

もう刷り込みとして、私たち(ある一定年齢以上の)日本語教師は「~という文法の時は、こういう例を出す」「こういう場面を使って練習をする」という定番がある(あった)と思うんですが、実際の使用例を調べてみると、案外そのテッパンの語彙や表現が実生活ではそれほど使われていないのだということに気づくんですね。

内容

なんか脱線してしまいました。そう本の内容について書くんでした。

この本は、前半は「中納言の使い方」、後半は「中納言を使った研究の一例」について書かれています。

これからこういう研究がやりたい!中納言をバシバシ使いこなしたい!という人は中納言をスクリーンに開きつつ、本書とにらめっこをしながら作業の仕方を勉強することになるでしょう。私はまあ、これからそこまでマニアックに使うことはないと思いますから、その辺はさらっと読み流しました(こういうものの常として、実際に課題の直面しないと使い方を覚えてもしょうがないですしね)。

後半の研究の一例では、

「~としても」と「~にしても」
「思う」と「感じる」
「美しい」と「きれいな」

などの違いを、コーパスを用いた方法で鮮やかに説明してくれます。これを読めば、なるほどコーパスとはこういう風に使うものなのか~ということがよくわかります。おもしろいですよ。

まとめ

伝統的に国語学の研究などでは小説やエッセイ、新聞などから用例を引き抜いて来て、それをもとにあーでもない、こーでもないと賢い人たちが「AとB」の違いなどを説明していました。ただ、あまりそこには「量」的な視点がなかったんですよね。もちろん「非常にまれな例」などは除外されたかもしれませんけど。

そこに量的な視点を与えてくれるのがコーパスですね。用例が発見されても、それが全体の50%を占めているのか、たった5例しか見つからないかではまったく意味あいが変わってきますしね…って、おっと、あまり知らない癖に専門的な分野に首を突っ込みかけてしまいました(笑)

とにかく、読み物としておもしろかったです。あと、もっとコーパスをさらっと検索できるようにならないとな~とも思いました。すぐ使い方を忘れてしまうんですよね(汗)。残念ながら電子版はありませんが、もし興味があるなら紙の本を読んでみてください。

コメントを残す

メールアドレスが公開されることはありません。