2019-12-01から1ヶ月間の記事一覧

多項式回帰(polynomial regression)

重回帰分析の式と似ているが、よく見ると異なる。 以下が多項式回帰の式である。 y = b0 + b1*x1 + b2*x1^2 + .... + bn*x1^n 重回帰分析では、係数がb0、b1、、、、となるたびに独立変数も増えていったが、 多項式回帰では、その代わりに、power(指数)の数…

重回帰分析

単回帰分析はy = b0 + b1*xであり、求めたい係数はb0とb1だけであった。 また独立変数も1つだけである。 一方、重回帰分析はy = b0 + b1*x1 + b2*x2 + .... + bn*xn と求めたい係数も増え、また独立変数の数も二個以上である。 線形回帰で注意したいこと 以…

線形単回帰

線形単回帰とは、y = b0 + b1*xという式で表され、xからyを予測できるようなそれっぽい直線(つまり切片b0と傾きb1)を求めるものである。 ここで、yは従属変数(dependent variable)であり、xは独立変数(independent variable)である。 そしてこのようなデー…

Feature Scalingの話

Feature scalingと何か?? 特徴量の取りうる値の範囲(スケール)を変えることである。 これが必要な理由は何か。 例えば、特徴量に年齢と給料があるとする。 年齢は大体30才とか40才とかの範囲にあるが、給料は40万であったり、60万であったりと、年齢と給…

train_test_splitでトレーニングセットとテストセットに分ける

機械学習をする上で用いるデータをトレーニングセットとテストセットに分割する必要がある。 トレーニングセットで機械学習のモデルを構築し、dependent varialesとindependent variablesの関係を学習し、テストセットでその性能を図る。 なぜトレーニングセ…

データの前処理(preproceccing)

機械学習ではデータの前処理が大事になってくる。 例えば、以下のようなデータを考える Country Age Salary Purchased France 44 72000 No Spain 27 48000 Yes Germany 30 54000 No Spain 38 61000 No Germany 40 Yes France 35 58000 Yes Spain 52000 No Fr…

Spyderの使い方

Spyderは、Anacondaで作成した仮想環境の中で Pythonのスプリクトファイルを作成し、 実行するための機能である 筆者の使っているOSはmacなのでwindowsだと若干違うかも。 実際の使い方 Viewのpanes Viewタグのpanesから好きなものを画面上に追加できる。例…