統計検定2級の過去問2018年6月の解説!分散の公式の覚え方など

統計検定2級の過去問2017年11月!コレログラムもわかりやすく解説

この記事では、2018年6月に実施された統計検定2級の過去問を解説しています。

問題自体はすでにダウンロードできないため、無料のメルマガ登録でプレゼントしております。

 

2018年11月に実施された統計検定2級の過去問の解説もしています。

2017年11月に実施された統計検定2級の過去問の解説もしています。

 

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

統計検定2級2018年6月の過去問解説!:問1(1)

3つの箱ひげ図から適切なものを選ぶ問題。

箱ひげ図に関しては、以下の図を参照ください。

 

 

また、偏差の定義は「個々のデータ-平均値」です。

標準化とは、「偏差/標準偏差」で示されます。(標準化後のデータをZで示すことが多いです。)

 

 

標準化することによるメリットは、標準化することで平均値0、標準偏差1の正規分布データになることです。

そのため、-2〜2の間に、95%のデータが入ることになります。(正規分布の性質です。)

 

I:標準化得点のグラフ

縦軸が-2〜2のグラフです。すなわち、標準化得点のグラフということです。

II:偏差のグラフ

縦軸が0を中心に、約-25~30の間に散らばっています。

すなわち、偏差のグラフを示しています。

III:総得点のグラフ

縦軸が20~80の間に散らばっています。

すなわち、総得点のグラフです。

 

 

統計検定2級2018年6月の過去問解説!問1(2)

この問題では、標準化の性質を使います。

標準化することで、平均0、標準偏差1の正規分布のデータになります。

つまり、「標準偏差の2倍より離れた値があるかどうか」は、「標準化データのグラフで、-2より小さいデータまたは2より大きいデータ、があるかどうか」と言い換えることができます。

Iが標準化データのグラフですので、そこから読み取ると、1つだけ2より大きい外れ値があります。

そのため、1つ、という答えになります。

 

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

統計検定2級2018年6月の過去問解説!問2(1)

I:◯

横軸(人口)が大きくなればなるほど、縦軸(常設映画関数)が大きくなる傾向があります。

また、その傾向は直線に近いため、正の相関があると言えます。

II:◯

相関係数は外れ値の影響を受けやすいため、散布図を一緒に見る必要があります。

III:×

正の相関は見ることができました。

 

 

統計検定2級2018年6月の過去問解説!問2(2)

I:×

北海道は人口が500万人の付近にあります。

500万人の付近のデータだけを見ると、北海道は一番上にありますので、一般病院病床数は多いです。

II:◯

変動係数は標準偏差を平均で割ったものです。

人口1人当たりの一般病院病床数の変動係数は、一般病院病床数の変動係数よりも小さくなることが予想されます。

 

例えば、以下のようなデータがあったとします。(数値は適当です)

病院数 人口 1人あたりの病院数
50.0 5.0 10.0
40.0 3.0 13.3
30.0 7.0 4.3
50.0 5.0 10.0
40.0 8.0 5.0
70.0 5.0 14.0

 

このとき、変動係数(CV)は以下のようになります

Mean SD CV
病院数 46.7 13.7 3.4
1人あたりの病院数 9.4 4.1 2.3

1人あたりの病院数のほうが、CVが小さくなることがわかります。

 

III:×

人口が多い都府県に限っても、正の相関が見られます。

 

 

統計検定2級2018年6月の過去問解説!問2(3)

I:◯

偏相関係数とは、第3の因子の影響を除いた相関係数のことです。

今回の場合、常設映画関数と一般病院病床数に関して、人口の影響を取り除いた相関係数を指しています。

II:◯

残差e1と残差e2の散布図を見ると、相関があるようには見えません。

つまり、人口の影響を除くと相関が見られなくなることから、常設映画関数と一般病院病床数の相関は、擬相関であったことがわかります。

III:×

病院と併設している映画館のデータはどこにもないため、ここからは読み取れません。

 

 

統計検定2級2018年6月の過去問解説!問3(1)

ローレンツ曲線とは、横軸に世帯(人口)の累積度数を、縦軸に所得の累積度数を示した曲線である。

ローレンツ曲線の特徴は、所得格差が存在しないなら45度線と一致し、所得に偏りがあると、曲線は下に膨らむ、ということ。

与えられた表は各階級の度数であるため、この表から累積度数分布表を作成する。

すると、以下のような表ができる。

~20% ~40% ~60% ~80% ~100%
日本 5.4% 16.1% 32.4% 56.5% 100%
アメリカ 5.1% 15.4% 30.8% 53.5 100%
スウェーデン 8.7% 23.0% 40.8% 63.8% 100%
中国 5.2% 15.0% 29.9% 52.2% 100%
ドイツ 8.4% 21.5% 38.7% 61.4% 100%

 

この累積度数分布表と、曲線を見比べると、ドイツが当てはまっていることがわかる。

 

 

統計検定2級2018年6月の過去問解説!問3(2)

ジニ係数とは、「45度線とローレンツ曲線の面積の2倍」で計算できる。

すなわち、以下の図の枠で囲んだ部分の面積の2倍である。

 

 

赤い枠の面積を直接求めることができないため、以下のように0.5 – ( ① + ② + ③ + ④ + ⑤ )を計算する。

三角形と台形の面積の計算を5つ実施し、ジニ係数を求めると、0.28になる。

 

 

統計検定2級2018年6月の過去問解説!問3(3)

I:◯

どの国も45度線より下に曲線が描かれます。

II:×

ジニ係数が大きいと、格差が大きいことを表しています。

問題文は、説明が逆です。

III:◯

スウェーデンと中国を比べると、中国のローレンツ曲線が下に描かれます。

よって、中国の方が、格差が大きいということです。

 

 

統計検定2級2018年6月の過去問解説!問4(1)

2011年の輸出物価指数の、前年からの変化率は以下の式で算出できます。

 

 

よって、以下のようになります。

 

 

統計検定2級2018年6月の過去問解説!問4(2)

問題文を解釈できたかどうかが鍵となる。

問題文を図示すると、以下の条件を満たすrを計算するということ。

 

 

 

ではまず、X1を計算します。

 

 

次に、X2を計算します。

 

 

と計算することができます。

ということは、あとは2015年までの変化率を計算していけば良いということです。

 

 

 

統計検定2級2018年6月の過去問解説!問5

フィッシャーの3原則とは、「繰り返し」「局所管理」「無作為化」のことです。

 

 

統計検定2級2018年6月の過去問解説!問6

抽出の問題は毎回必ずでてくるので、理解したいです。

今回の問題では、男女という「性別」というカテゴリごとに無作為抽出をしたい場合です。

この時カテゴリのことを「層」とよびます。

「層」は一般的にも使われていて、例えば「年齢層」という使い方をしますよね。

そのため、層化(層別)抽出といいます。

 

 

統計検定2級2018年6月の過去問解説!問7(1)

まず、お菓子をもらえる条件は「2回連続で勝つ」ということ。

つまり、お菓子がもらうためには、以下のうちいずれかの場合。

  1. 1回目と2回目に勝つ:確率はpq(独立なので、そのまま掛けて良い)
  2. 1回目負けて、2回目と3回目に勝つ:確率は(1-p)pq

そのため、お菓子がもらえるのは上記の2つを足したもの。

pq+(1-p)pqが正解。

 

統計検定2級2018年6月の過去問解説!問7(2)

T-U-Tでお菓子をもらえる確率は、(1)で計算できました。

では、U-T-Uでお菓子をもらえる確率を計算してみます。

  • と同様に計算すると、qp+(1-q)qpとなります。

では、「pq+(1-p)pq」と「qp+(1-q)qp」ではどちらが大きいでしょうか。

2つの違いは、1-pと1-qのみです。

問題文よりp<qですので、1-p>1-qとなります。

つまり、T-U-Tの順番の方がお菓子をもらいやすいということがわかります。

 

 

統計検定2級2018年6月の過去問解説!問8(1)

まず必ず知っておきたいのが、正規分布の性質。

正規分布は「平均値(μ)」と「標準偏差(SD)」の2つで形が決まります

そして、μ±SDの間には、約68%のデータが含まれています。

μ±2SDの間には、約95%のデータが含まれています。

 

 

そして、もう一つ知っておきたいのが、標準化。

問1でもさらっと出てきましたが、ここでもおさらいしましょう。

 

 

標準化をすることで、平均0、標準偏差1の正規分布(標準正規分布)のデータにすることができます。

 

以上の2点を知ったところで、問題です。

4,800円を標準化のデータに直します。

すると(4800-4000)/500=1.6となります。

つまり、標準正規分布で1.6以上となる確率はどれぐらいか?と問われているのと一緒です。

標準正規分布表は問題の最後の方についておりますので、1.6以上がどのぐらいの確率かを確認します。

 

 

0.548なので、0.55が正解です。

 

 

統計検定2級2018年6月の過去問解説!問8(2)

この問題も、与えられた数字をZに直して、標準正規分布表と見比べる、ということをします。

つまり、最終的には以下の式に代入します。

 

 

ここで問題なのが、「今年6月と昨年6月の差の標準偏差」はどう求めるのか、ということ。

これは、分散の定義から計算します。

 

 

このように求めることができるので、最終的には以下の式になります。

 

 

ということで、また標準正規分布と見比べて、答えは0.129となります。

 

 

統計検定2級2018年6月の過去問解説!問8(3)

難しそうに見えて、簡単な問題です。

3年分の電気料金は独立なので、その大小関係が出る確率はそれぞれ等しいです。

つまり、3年分のデータの並び順は3!=3*2*1で6通り。

そのうち、今年が一番大きい組み合わせは「前々年<前年<今年」と「前年<前々年<今年」の2通り。

つまり、2/6=1/3が正解。

 

 

問9(1)統計検定2級2018年6月の過去問解説!

平均、分散、共分散、相関の4つの定義をおさらいしましょう。

こちらの4つの定義は、暗記したほうが良いです。

 

 

これを知っていれば、あとは当てはめるだけです。

 

 

統計検定2級2018年6月の過去問解説!問9(2)

少々複雑に思いますが、こちらの問題も上記の定義がわかっていれば解ける問題です。

計算間違いさえしなければ解くことができます。

 

 

 

統計検定2級2018年6月の過去問解説!問10(1)

95%信頼区間の知識と、ちょっとした応用力が必要な問題でした。

まず、95%信頼区間は以下の式です。

 

 

95%信頼区間の定義がわかっていれば、あとは与えられた問題文を上記の式に近づけます。

 

 

かなり、95%信頼区間の式に近づきました。

そして、上記の式と95%信頼区間の式と見比べます。

 

 

よって、あとは計算していきます。

 

 

統計検定2級2018年6月の過去問解説!問10(2)

n=20が与えられたとき、T分布に従います。

つまり、95%信頼区間は以下のような式になります。

T分布表より、自由度19のt0.025は2.093です。

 

 

あとは、与えられた数字を代入します。

 

 

 

統計検定2級2018年6月の過去問解説!問11(1)

比率の信頼区間。

統計検定2級では、かなりの頻度で出題されます。

割合をpとして、信頼区間は以下の式で計算できます。(暗記しておいていいレベルです)

今回のデータを当てはめると、以下のようになります。

 

 

統計検定2級2018年6月の過去問解説!問11(2)

母比率の推定値は以下の式で計算することができます。

 

 

そして、標準誤差の算出には、問9で出てきた分散の定義を使います。

 

 

つまり、以下のようになります。

 

 

ここまでできたらあとは、標準誤差(Standard Error, SE)とは何か?がわかっていれば解くことができます。

データの標準誤差とは、推定値の標準偏差のことです。

ここはぜひ理解しておきましょう。

つまり、上記の分散をルートすれば、そのまま標準誤差になります。

 

 

統計検定2級2018年6月の過去問解説!問12(1)

T検定の基礎知識を問う問題です。

2群のT検定の際のT統計量は以下の式で計算できます。

これは暗記していいレベルです。

 

 

そして、プールした分散とは、以下の通りです。

 

 

これがわかれば、あとは計算ミスしないようにするだけ。

計算式は割愛しますが、セリーグの不偏分散は以下の通り。

パリーグの不偏分散は以下の通り。

よって、t統計量は以下の通りになります。

 

統計検定2級2018年6月の過去問解説!問12(2)

分散分析のF値を問う問題です。

分散分析表を思い浮かべられるかどうかが鍵です。

 

分散分析表は以下の通りです。

 

 

つまり、F値を算出するには群の分散と、残差の分散が必要です。

そのために、まずはそれぞれの平方和を算出します。

 

 

ここまでくれば、あとは分散分析表の通りに当てはめるだけです。

自由度に関しては、こちらの記事をご確認ください。

[blogcard url=”https://best-biostatistics.com/contingency/degree-freedom.html”]

 

 

 

統計検定2級2018年6月の過去問解説!問13(1)

まず、問題文を可視化してみます。

H0(帰無仮説)とH1(対立仮説)の数字が与えられていますので、それをそのままグラフにします。

 

(1)ではX≦3としていますので、以下の通りの棄却域になります。

 

 

そして、第1種の過誤、第2種の過誤、検出力の用語を整理します。

 

  • 第1種の過誤:棄却域での帰無仮説下(H0)の累積確率
  • 第2種の過誤:棄却域ではない部分での対立仮説(H1)の累積確率
  • 検出力:1-第2種の過誤

 

よって、第1種の過誤は0.1+0.1+0.1=0.3となります。

第2種の過誤は0.05+0.05=0.1となります。

検出力は1-0.1=0.9となります。

 

 

統計検定2級2018年6月の過去問解説!問13(2)

X≦2が棄却域の場合と、X=6が棄却域の場合、第1種の過誤、第2種の過誤、検出力はそれぞれ以下の通り。

有意水準とは、第1種の過誤とほぼ同じ意味です。

 

 

 

 

統計検定2級2018年6月の過去問解説!問14(1)

回帰分析の読み取り方です。

問題文で与えられた回帰式に、出力結果を当てはめると以下の式になります。

 

 

ここに、問題文の数字を当てはめます。

 

 

 

統計検定2級2018年6月の過去問解説!問14(2)

回帰分析の結果から、t統計量を求める式は以下の通り。

 

 

よって、値を代入するとこのようになる。

 

 

計算結果のt統計量を、t分布表と見比べる。

自由度は回帰分析結果のResidual Standard Errorを見る

43degree of freedomとあるため、自由度40のt分布表を確認する。

すると、得られたt=1.915は両側10%と両側5%の間のt値に相当する。

そのため、両側10%であれば棄却される。

 

 

統計検定2級2018年6月の過去問解説!問14(3)

I:◯

Interceptとlog(賃金)の2つが有意水準1%で0ではない。

II:×

Log(賃金)の推定値は正の値であり、有意水準1%で0ではない。

そのため、賃金が上がると犯罪発生率は上がる傾向にある。

III:◯

自由度調整済み決定係数は、回帰分析結果のAdjusted R-squaredの値である。

 

 

統計検定2級2018年6月の過去問解説!問15(1)

分割表の基本的な知識を問う問題。

与えられた表から期待度数の表を作成すると、以下のようになります。

 

 

 

統計検定2級2018年6月の過去問解説!問15(2)

カイ二乗値は、以下の式で求めることができる

 

 

よって、数字を代入すると以下の通り。

 

 

 

統計検定2級2018年6月の過去問解説!問15(3)

分割表の自由度は、(行の数-1)*(列の数-1)で計算できる

よって、2*2分割表の場合の自由度は1である。

カイ二乗分布表より、自由度1のときに0.05となるカイ二乗値は3.84

 

 

また、(2)より計算されたカイ二乗値は69.04である。

69.04>3.84であるため、風向と季節には関連があると言える。

 

 

統計検定2級2018年6月の過去問解説!問16

F値の求め方は、以下の通り。

 

 

また、自由度(20, 40)の両側5%のF統計量は下記の通り2.068となる。

 

 

1.81<2.068であるため、棄却されない。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメント一覧 (5件)

コメントする

目次