
英語を話すのが苦手な日本人が多い理由のひとつに、単語と単語の自然な結びつき、つまり「コロケーション」の知識が不足していることがあります。単語を単体で覚えるだけでは、実際に英語を使う力にはなかなかつながりません。では、このコロケーションをはじめとする英語の深い知識を、最も効率よく学ぶにはどうすればよいのでしょうか。
今、その強力な味方として注目されているのが生成AIです。本稿ではAI英語学習の可能性について、書籍『英単語「1万語」習得法』より解説します。
※本稿は、内田諭著『英単語「1万語」習得法』(PHP新書)より、内容を一部抜粋・編集したものです
「この2つの単語のニュアンスって何が違うんだろう?」「この単語はどんな文脈で使うの?」 ──英語学習者なら誰もが抱くこうした疑問に、24時間いつでも答えてくれる優秀な家庭教師がいたらどうでしょうか。
実は、その家庭教師はすでにあなたの手元にあります。
ChatGPTをはじめとする生成AIは、単なる質問応答ツールを超えて、英単語学習における強力なパートナーへと進化しているのです。
本稿ではAIから「コロケーション」の情報を引き出す方法を紹介します。
コロケーションとは、簡単に言えば「単語と単語の自然な組み合わせ」のこと。面白いのは、簡単な単語であってもこの組み合わせが難しいという点です。たとえば school、phone、lunch という誰もが知る単語でも、「学校をさぼる」、「電話にでる」、「昼食を抜く」などの組み合わせとなると途端に出てこない人が多いのではないでしょうか(それぞれcut [skip] school, answer the phone, skip lunchが答えです)。使われている単語自体は基礎レベルなのですが、普段の学習ではその「相棒」にまで意識が向きにくいからです。しかしながら、英語の発信力を高めるためには非常に重要な情報です。
このように、「コロケーション」のような言語学の概念を手がかりにしてAIから必要な情報を引き出す──この戦略こそが、AIを単なる質問応答ツールから本物の学習パートナーへと変える鍵です。
「でも、AIの答えって本当に信頼できるの?」──こう思う方も多いでしょう。実際、私もこの疑問からコーパス言語学と生成AIに関する研究を行いました。(※1)
2024年に発表した論文(Uchida,2024)では、初期の大規模言語モデル(ChatGPT3.5など)の生成結果が、どの程度大規模コーパス(COCA)と一致するかを検証しました。
英語の頻出語上位100語をリストアップさせる実験では、ChatGPT3.5の生成結果は90%以上がコーパスのデータと一致しました。また、「giveの後に来る名詞を頻度順に20個挙げて」(List the top 20 most frequent English nouns that come after the verb "give" sorted by frequency.)といったコロケーション生成タスクでも、約半数がCOCAの実際のデータと一致し、一致しなかったものも教育的価値の高い語彙が多く含まれていました。
つまり、厳密な研究用途には不十分な面もありますが、学習用途としては十分に有益であることが証明されたのです。現在のChatGPTやClaude、Geminiなどの最新モデルは、さらに精度が向上していると考えられます。
ただし、注意点もあります。生成AIには「ランダム性」があるため、同じ質問でも毎回微妙に異なる答えが返ってくることがあります。また、モデルのアップデートによって結果が変わることもあります。
以下では、生成AI(執筆時点の最新モデルであるChatGPT5.1を利用)に入力したプロンプトの例とその結果の一部を示します。言語学的な概念を知っていることで体系的に情報を「引き出せる」ことを実感してください。
(※1)コーパス(corpus)とは、実際に使用された言語を大量に収集し、コンピュータで検索・処理できるように構造化したデータベースのこと。英語学習に最も有用な一般コーパスとして、BNC(British National Corpus)とCOCA(Corpus of Contemporary American English)という2つの代表的なコーパスが存在する。
コロケーションを、AIを使って探索してみましょう。驚くほどシンプルなプロンプト(指示文)で、豊富な情報を引き出すことができます。
[プロンプト例]adviceの直前にくる形容詞のコロケーションを頻度順に20挙げて
ChatGPT5.1が挙げた20個の形容詞は以下の通りです。
good, practical, useful, sound, best, excellent, helpful, invaluable, sensible, detailed, independent, expert, free, legal, financial, medical, friendly, unsolicited, honest, confidential
一方、コーパスの上位20個の形容詞は次の通りです。
good, medical, legal, best, great, financial, bad, practical, sound, professional, little, free, unsolicited, helpful, friendly, excellent, technical, only, other, general
このうち、共通している語はgood, medical, legal, best, financial, practical, sound, free, unsolicited, helpful, friendly, excellentの12個で一致率は60%です。
コーパス側にのみ出現する語はgreat, bad, professional, little, technical, only, other, generalで、ChatGPTのリスト側にのみ出現する語はuseful, invaluable, sensible, detailed, independent, expert, honest, confidentialです。
コーパスには頻度が高いgreat, bad, onlyなどの汎用的な形容詞が含まれているため、これが違いの原因と考えられます。一方、AIのみが挙げたconfidential advice(機密の助言)やexpert advice(専門家の助言)などのほうが、実際の英語使用において重要な場合も多いと考えられます。このようにAIがリストアップしたコロケーションは、十分に学習の役に立つことがわかります。
更新:05月15日 00:05