MENU

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

| 統計ER

統計ER

統計 ER とは

2018年9月– date –

機械学習

R で主成分回帰と部分的最小二乗回帰を実行する方法

主成分回帰と部分的最小二乗回帰を R で実行する方法の解説部分的最小二乗回帰とは部分的最小二乗回帰の前に、主成分回帰を説明する。主成分回帰（Principal Component Regression, PCR）は、主成分分析と回帰分析の融合。主成分分析で情報の集約をし...

2018年9月25日
主成分分析

R で主成分分析を行う方法

主成分分析は、たくさんの変数を、合成変数に集約する分析。主役級の主成分から第一主成分、第二主成分、・・・と呼ばれる。たくさんの変数を、いくつかの主成分でまとめると、情報がまとまって考えやすくなる。 Rで主成分分析を行う方法 princomp()を使...

2018年9月24日
機械学習

R でリッジ回帰・ラッソ回帰・エラスティックネットを実行する方法

エラスティックネットを簡単に解説 R で実行する方法も解説リッジ・ラッソ・エラスティックネットとは？線形回帰モデルは、係数 β（パラメータ）を推定するときに最小二乗法を用いる。通常の最小二乗法は、従属変数の実測値とモデルから計算された値と...

2018年9月23日
機械学習

R で SVM の C パラメータについて具体例を示す

SVM（サポートベクターマシン）のコストパラメータ C について。 SVM の C とは？ SVM（サポートベクターマシン）のコストパラメータ C とは何か？コストパラメータ C は誤分類を許容する指標。 C が小さいと誤分類を許容する。大きいと誤分類を許容しな...

2018年9月17日
機械学習

サポートベクターマシンとは？ごく簡単に解説

機械学習の分類手法の一つ、サポートベクターマシンとは何か？サポートベクターマシンの前に最大マージン分類器についてサポートベクターマシンを説明する前に最大マージン分類器から話を始めねばならない。最大マージン分類器、サポートベクター分類器...

2018年9月12日
機械学習

R でランダムフォレストを最適化する方法

ランダムフォレストはチューニングして最適化する。チューニングは決定木を最適化する方法。ランダムフォレストの場合は、決定木の数と特徴量（説明変数）の数を最適化する。ランダムフォレストのパッケージのインストールと準備最初に一回だけパッケ...

2018年9月11日
機械学習

R でランダムフォレストを行う方法重要度の可視化の方法

R でランダムフォレストを実行する方法。ランダムフォレストとバギングの違いランダムフォレストとバギングの違いは、こちらの記事を参照。 R でランダムフォレストを実行するパッケージの準備パッケージはrandomForestというそのままの名前のパッケー...

2018年9月11日
機械学習

R でアンサンブル学習のバギングを行う方法

バギングというアンサンブル学習を R でやってみる。ランダムフォレストとバギングの違いランダムフォレストとバギングの違いは、以下の記事を参照。バギングのための R パッケージの準備 adabagパッケージをインストールする。 install.packages("adab...

2018年9月10日
機械学習

ランダムフォレストとバギングの違い

ランダムフォレストとバギングは、決定木をより汎用化するために考えられた手法。違いは何か？概念的な簡単な説明。ランダムフォレストとバギングの総称アンサンブル学習とは何か？ランダムフォレストとバギングはともにアンサンブル学習と呼ばれてい...

2018年9月3日
機械学習

R partykit で決定木分析を実行する方法

決定木分析をRで行う方法を紹介。難しいプログラムが組めなくてもすぐに使える。決定木分析のRパッケージの準備決定木分析のパッケージrpartときれいな決定木の描画パッケージpartykitをインストールする。インストールは初めの一回だけでOK。 install...

2018年9月3日
機械学習

決定木の過学習を防ぐ剪定（枝刈り）とは？

決定木には剪定（せんてい）という過程がある。剪定とは何か？簡単に紹介。決定木の弱点　過学習あるデータセットから、決定木を作ったとする。決定木は、大きく茂らせれば茂らせるほど、きれいに分岐して、分類してくれる。しかしながら、機械学習...

2018年9月3日
機械学習

機械学習の決定木分析に計算される Gini 不純度とは？わかりやすく解説

決定木の分岐（ノード）を作るときどのような計算をしているのか？ Gini不純度を計算しているのだが、Gini不純度とは何か？機械学習の決定木における Gini 不純度とは？ Gini不純度とは、ある特徴でデータを2分割するときに、特徴の要素Aである確率とAで...

2018年9月2日
機械学習

機械学習による決定木分析ごく簡単な解説

機械学習をする方法はさまざまある。代表的な方法は決定木分析である。そもそも決定木とは何か？基本的なことをごく簡単に解説。決定木とは何か？決定木とは意思決定に使う、いくつもの枝分かれをする図のこと。膨大なデータを使って、決定木のモデ...

2018年9月2日
サンプルサイズ計算

統計に必要なサンプル数が計算できるエクセルファイルのリンク集

標本の大きさの求め方。エクセルを使う方法。サンプルサイズ計算をエクセルで行う方法。なかなか探しても見つからないサンプルサイズ計算がここでは見つかる！！アンケート調査アンケートは何人に取れば最適なのか？エクセルファイルで簡単に計算でき...

2018年9月2日
機械学習

R で分類課題を機械学習モデルで実行する方法

機械学習で、よりよく推測できるモデルを選ぶ。統計ソフトRのISLRパッケージのWeeklyデータで基礎的な機械学習を行ってみた。 Rで機械学習を行うためデータの準備 ISLRパッケージのWeeklyデータは、S&P500指数の週当たりのリターンのデータ。 9つの変...

2018年9月2日
多重共線性

R で重回帰分析を行う具体例 ― ISLR パッケージ Auto データセットを使った重回帰分析

R の ISLR パッケージの Auto データセットを使った分析例。データの準備最初の一回だけ、ISLRパッケージをインストール。 install.packages("ISLR") ISLRパッケージを呼び出して、解析開始。 library(ISLR) ISLRパッケージのAutoデータセットを用いて解...

2018年9月1日

1