
「英語は3000単語で91%カバーできる」といいます。では、実際に英文を正しく理解するには、どのくらいの単語を知っている必要があるのでしょうか。言語学者の研究によると、95%の理解には約6000語、98%の理解には1万2000語が必要だといいます。 高校卒業時の目標4000~5000語では、まだ足りないのが現実なのです。科学的根拠に基づく英単語学習の戦略について、書籍『英単語「1万語」習得法』より解説します。
※本稿は、内田諭著『英単語「1万語」習得法』(PHP新書)より、内容を一部抜粋・編集したものです
英文を正しく理解するためにはどのくらいの英単語を知っている必要があるか、ということについてはさまざまな研究があります。Laufer(1989)は英文中の約95%の単語を知っていることが理解には必要だと示しています。ただし、これは最低限であって、98%のカバー率が目指すべき語彙力であると示す研究もあります。
比率に直すと、95%は20語に1語、98%は50語に1語の割合で未知語がある、という状況です。
具体的にこの比率で単語が欠けている英文を見てみましょう。43語の英語ですので、95%なら2語わからない、98%なら1語わからないということになります。
-------------------------------
In her lecture, the professor emphasized the [1] between technological innovation and social change. She argued that progress is rarely [2], often shaped by unexpected challenges. Students listened carefully, realizing that a true understanding of such change requires both evidence and thoughtful interpretation.
講義の中で、教授は技術革新と社会変化の [1] を強調しました。彼女は、進歩は決して [2]ではなく、予期せぬ課題によって形づくられることが多いと論じました。学生たちは注意深く耳を傾け、そうした変化を真に理解するには証拠と慎重な解釈の両方が必要であることを認識しました。
-------------------------------
いかがでしょうか。2語欠けた状態でも全体の意味がなんとなく理解できるのではないかと思います。また、文脈をよく考えると、なんとなく入る単語が推測できるかもしれません。ちなみに [1] にはinterplay(相互作用)が、 [2]にはlinear(直線的な)が入ります。
もしこれ以上の穴があると、文章の読解はさらに難しくなります。文脈から英単語の意味を推測しにくい場合もありますので、理想としてはどんな英文でも98%の単語を知っている状態(100語中2語が未知語)を目指すとよいでしょう。
そうなると、98%の理解率を達成するにはどのくらいの数の単語を知っていればよいか、ということを考えればよいことになります。しかしながら、何を「1単語」と数えるかは実は難問です。
イメージしやすいのは辞書です。辞書には「見出し語」があり、これが一つの英単語の基準となるでしょう。例えば、go-went-gone-goingなどの活用形はすべてgoの項目に書かれていますので、これは別の単語ではなく、一つの単語(go)の変形だとわかります。
次に、「品詞」を考える必要があります。例えば、exerciseという単語は「練習」という意味の名詞と、「<権力などを>行使する」という意味の動詞があります。この単語の場合、品詞によって意味が異なるので、別のものとして扱ったほうが良い場合もありそうです(ただし、empty(形容詞:空の、動詞:空にする)のように意味が密接に関わっているものが多く、辞書では同じ見出し語の下に置かれています)。
このように品詞を区別する数え方は、英語の語彙リストなどで用いられています。例えば、CEFR-J Wordlistという日本の英語学習者が学ぶべき語を集めたもの(約8,000語が含まれています)では、「見出し語+品詞」が基準となっています。このリストは単語のレベルをCEFRという国際的な言語指標によって分類しています(CEFRにはA1[初級]、A2、B1、B2、C1、C2[上級]の6段階があります)。例えば、動詞のbreak(「~を壊す」などの意味)は初級のA1レベル、名詞のbreak(「休憩」などの意味)は一つ上のA2レベルに分類されています。
さらに細かい分類では、「意味」を基準に単語と考えることも可能です。同じ品詞であってもend(名詞)の「終わり」と「目的」のように、意味同士の関係性が遠いものは別の単語として認定してもよいかもしれません。
English Vocabulary Profileというプロジェクトでは、CEFR-J Wordlistと同様に英単語をCEFRレベルごとに分類して提示していますが、「休憩」(lunch breakなど)の意味のbreakはA2に、「休日」(summer breakなど)の意味の場合はB1に分類しています。ただし、この数え方は「breakをいくつの意味に分類するか」ということにも依存し、カウントするのが難しい場合があります。
本稿では、品詞や意味の区別のない「辞書の見出し語形」を1単語とみなしたいと思います。この数え方が最も揺れが少ないというのが主な理由ですが、近年の研究でこの単位(flemmaと呼ばれます)が学習者の実態を把握しやすいということも示されています。
さらに大きな括りとしては、ワードファミリー(word family:語族)というものがあります。これは同じ単語から派生した語を1つとして扱うというものです。例えば、kind, unkind, kindly, kindnessなどはすべてkindから派生しているので、1ワードファミリーということになります。これはkindを知っていれば他の派生形の意味が推測できるという前提に立っており、英語教育の分野で広く用いられてきました。
Laufer and Ravenhorst-Kalovski(2010)ではこのワードファミリーの概念を使ってリーディングに必要な語彙数を推定しています。この研究では95%の単語をカバーするには4,000 ~ 5,000語族(+固有名詞)、98%を達成するには8,000語族(+固有名詞)が必要であることを明らかにしています。しかしながら、英単語によってワードファミリーの大きさが異なるため実数が把握しにくい、特に初級の英語学習者には当てはめにくいなどの批判もあります。

では「98%の理解率」を達成するには何単語覚えておく必要があるのでしょうか。Corpus of Contemporary American English(COCA)という10億語規模の言語データベースの語彙表がありますので、それで確認します(ただし、このデータベースは更新されることがありますので、同じ数字が再現できるとは限りません)。
ここでは「品詞や意味の区別のない辞書の見出し語形」(flemma)で集計します。
表1は、英単語のランクとそのランクまでの単語によるコーパス全体の単語数のカバー率を示したものです。この表を見ると、上位10語で約27%をカバーし、上位3,000語で91%をカバーします。この後はそれぞれの単語の頻度が下がりますので、伸び率は遅くなり、95%に到達するには、約6,000語が必要だとわかります。さらに98%に到達するには12,000語が必要だということになります。
しかしながら、10,001~12,000位では2,000語で0.5%しかカバー率が増えません。現実的なラインとしては、四捨五入して98%と言える10,000語が目標、と言えるでしょう。
更新:05月11日 00:05