TOEIC対策

TOEICは連続で受けて!難易度の違いを統計的に検証しました

2023年5月26日

TOEIC L&Rの試験って受けるたびに自分の得点が大きく変動するなって感じたことはありませんか?

「こんなに勉強したんだから自己ベスト更新は間違いなし!」と思いながら行くと、むしろ前回よりも下がってしまうことも。。。

「たまたま調子がいいときと悪いときがあるのかな」とか「テストによって相性があるのかな」と思っていましたが、「逆にテスト側に難易度の違いがあるのかも」と思い、統計的に検証してみました。

結論

結論からお話すると、統計的には「TOEIC L&Rのテスト難易度は毎回異なる」と言えます。したがって、たまたま易しい回に当たる場合もあれば、たまたま難しい回に当たる場合もあります。

また、「テスト難易度以外の要因」で、得点がバラついてしまうということも今回の検証でわかりました。

これを運任せにしないためには、「TOEICは連続して受けたほうが良い」ということになります。

詳しい検証結果について、以下ご説明していきますね。

各回でのTOEICの平均点の違い

TOEICを主催しているIIBCでは、公開テストの統計情報をWebサイトで公開しています。2023年5月26日現在で公開されているもので、直近の6回の情報を以下に引用します。

  • 2023年4月23日 午後:平均621.4点(受験者数:29,249人、標準偏差:164.2)
  • 2023年4月23日 午前:平均624.7点(受験者数:30,404人、標準偏差:163.4)
  • 2023年3月19日 午後:平均593.1点(受験者数:33,187人、標準偏差:171.0)
  • 2023年3月19日 午前:平均598.9点(受験者数:33,920人、標準偏差:169.1)
  • 2023年3月5日 午後:平均609.4点(受験者数:11,765人、標準偏差:164.3)
  • 2023年3月5日 午前:平均633.3点(受験者数:11,909人、標準偏差:161.5)

この中で平均点の最高は633.3点、最低は593.1点ですので、実に40.2点もの違いがあるということがわかります。

「40.2点の違い」は「統計的に難易度が違う」といえるのか?

TOEIC L&Rの得点範囲は10〜990点です。実に範囲が1,000点近くもあるテストにおいて、平均点にたかだか40点の違いがあるというくらいで、果たして「難易度が違う」とはいえるのでしょうか?

つまり「本当は難易度が一緒だけど、たまたま取得したサンプル(その回を受験した人)の平均に違いが有っただけ」という可能性もあるわけです。これは、例えば受験者数が5人だけとか、極端な場合を考えればよりわかりやすいと思います。

これについては、実は統計的に検証することができます。幸い平均、標準偏差、サンプル数(受験者数)が公開されているので、これを使って統計的検定を行うことができます。

今回のケースの場合は、「母平均の差の検定」に該当します。詳細な説明は割愛しますが、検定に必要な値の計算結果だけ記載しておきます。

  • 平均値:x1_avr=633.3, x2_avr=593.1
  • 標準偏差:s1=161.5, s2=171.0
  • 分散:s1^2=26082.25, s2^2=29241.00
  • サンプルサイズ:n1=11909, n2=33181
  • 標準誤差:SE=1.75
  • 自由度:f=7206
  • 棄却限界値:2.58(有意点0.01=信頼度99%とした場合)
  • T値:22.94

T値が棄却限界値を上回っており、「2つのテストの難易度が同じ(母平均は同じ)」という帰無仮説を棄却できます。

これはつまり「2つのテストの難易度が同じ(母平均が同じ)ことは99%以上ありえない」ということを示しているので、「2つのテストの難易度は異なる」という結論が得られたということになります。

平均点と私の得点の推移は連動しているか?

というわけで「難易度が違う」ことはわかりましたが、では平均点と実際の私の得点が連動しているのか、気になったので調べてみました。

直近の1年くらいの全体平均点と私の得点を散布図にプロットしたものが以下です。

平均点と得点に相関がある場合は、右肩上がりになるはずなのですが、全体的にバラけているので、ほとんど無相関であることがわかります。

相関の強さを表す「相関係数」はR=0.04となっています。これは、絶対値が1に近づくほど相関が強く、0に近づくほど相関が弱いので、数値的にも無相関であることがわかります。

つまり、全体の平均点と私の得点には何の関係もないということが言えます。

ここから導き出される結論として、「私の得点は、各回の問題の難易度を原因としたものではなく、他の事項を原因としてバラついている」と言えます。そして、「他の事項」として推測されるのは、主に以下です。

  1. 会場の残響の大きさ(残響が大きくて細かい子音が聞き取れないことがあり、リスニングの得点が下がる場合がある)
  2. 時間の使い方の成否(特定の問題を解くのに時間を要したことにより、最後部の問題が解けない、または見直しの時間がなくなる場合がある)

①については運としか言いようがないところですが、②については「実力とテクニック」が原因ですので、修行を重ねるしかないですね。

まとめ

上記より、

  • TOEIC L&Rのテスト難易度は毎回異なる
  • 他にも受験者側にも得点がバラつく要因がある(会場の残響の大きさ、時間の使い方の成否など)

ということがわかりますので、たまたま運悪く得点が低くなるということがあるということです。

これを運任せにしないためには「TOEICは連続して何回も受けるべし」ということになります。

私自身は公式テストを受けるとき、できるだけ3回連続して受けるようにしています。そうすることで、「今回がたまたま運悪く点数が低かった」となっても、あとの2回でカバーできると考えているからです。

(あるいは連続して低かった場合は、「これが実力だ」と納得するためでもあります。。)

■著書紹介
TOEIC®スコアUPは『デジタル』が最速 第二言語習得論に基づくアプリ徹底活用術
当サイトやストアカ講座で提供している情報をギュギュっと1冊にまとめました。

アプリひとつだからこそできる、最短・最速の学習法を伝授!
「どうすれば学習が継続できるのか?」から、単語・リスニング・リーディングの具体的な学習方法、TOEICのスコア別おすすめの学習内容、よくある質問まで完全網羅。これから英語を始める方はもちろん、やってみたけど続かなかった、いろいろやっているけど伸び悩んでいるなど、さまざまな段階の方々に合ったTOEIC対策の決定版です。

-TOEIC対策
-, ,