最近有考雅思的同学提了一个问题:准备雅思听力需要背多少单词才够?对此网上有各种答案,从六千到一万多不一而足,今天苏州新航道雅思培训班小编就从数据分析的角度跟大家聊一聊这一问题。
在继续讨论这个话题之前,我们需要了解一个概念:词汇覆盖率。
词汇覆盖率是指文本中有多大比例的词汇出自于特定词表。因为词表都是根据词汇量水平按照词频分布而成,所以词汇覆盖率与词汇量水平密切相关。词汇覆盖率与阅读理解的水平也有直接联系。国外语言学家 Laufer在1997年的研究表明二语读者需要掌握文章中所有词汇的95%,才能对文章获得大致的理解。即,如果要独立完成阅读任务,必须要做到平均每20个词中只有一个词不认识。如果要做到充分理解,则需要掌握文章中所有词汇的98%及以上。以上的讨论是针对阅读而言,而听力的要求只会更高,因为我们最多只能听懂我们能读懂的内容。要充分理解听力内容,我们至少需要掌握听力文本的98%。
小编找到了剑桥4到剑桥14这11套真题集的听力原文,并统计这些文本的词频分布情况。统计过程中用到的工具和材料有:
1.AntConc
AntConc 是由在日本早稻田大学执教的英国学者 Laurence Anthony 研发的一款语料库检索软件。它可以应用于中小规模的词频统计、语料检索,信息筛选等。我在之前的文章怎样快速入门考研高频词汇?中曾经介绍过该软件的用法。软件的下载地址是:https://www.laurenceanthony.net
2.BNC 词表
BNC 是英国国家语料库 (The British National Corpus) 的简称,该语料库是目前网络上可直接使用的语料库之一,也是目前世界上代表性的当代英语语料库之一。英国国家语料库针对英语词频统计给出了一个BNC 15000 词表。这份词表覆盖了英国本土出版物语料中最常使用的15000个单词。这份 BNC 词表的下载地址是:https://www.audiencedialogue.net/susteng.html
本次统计我从BNC词表中按照词频分别选取了前5000到前10000个单词,利用 AntConc 软件的词表筛选功能,统计出124828词的剑桥雅思听力真题文本中,有多少词落在这些词频范围。得到的统计结果是:雅思听力的12万多词文本中,只有 89.1%的单词落在BNC词表中前5000词区间中。也就是说,假如你的词汇量是5000,那么你最多只能听懂文本的89.1%,按照上面的词汇覆盖率标准,这样的覆盖率并不能保证顺利理解文本。如果你的词汇量能达到9000,那么你大概可以读懂98.16%的雅思听力文本,在不考虑其他影响听力理解的因素下,基本上能充分理解听力内容。如果词汇量达到了10000,你的词汇覆盖率会上升到99.1%,听力理解水平会进一步增强。
因此,如果你雅思听力想要考到一个比较好的分数(8分以上),词汇量能够达到9000,这样理解起听力内容才会比较顺利。