python, R, vimでデータマイニング

python, R, vim で疑問に思ったことなどを

2015-10-01から1ヶ月間の記事一覧

dplyr, mutateを用いたデータハンドリング, data wrangling

dplyr, mutateを用いたデータハンドリング, data wrangling kanosuke 2015年10月21日 モデル構築前の前処理 モデル構築する前には前処理が必要。むしろ、前処理の方がが時間がかかる。モデル構築ではトレーニング用とテスト用に分割するので2つのデータセッ…

caret:trainに慣れる

caret:trainに慣れる kanosuke 2015年10月19日 パッケージ caret The caret Package 色々なアルゴリズムを個別のパッケージで対応してきた。でも、それぞれの使い方を調べながら対応するのが面倒。caretは多くのアルゴリズムを一つのパッケージにまとめてく…

欠損値置換や因子ベクトル化をmutate_eachで

欠損値置換や因子ベクトル化をmutate_eachで kanosuke 2015年10月17日 Rでのデータ加工がいつも捗らなくて困っていた。dplyrをより活用することでもっと効率的にしたい。そのなかでもmutate_eachは使う場面が多そうなので慣れておきたい。 全変数を因子ベク…

経過月数の計算 library(mondate)

KAGGLEの分析で経過月数を求めたいと思った。 過去に書き散らかして放置していたブログでも同様の記事を投稿したことがあった。月日が立ち、そのときに利用していたライブラリ名すら忘れていた。 「r months between」で検索してみるとStack Overflow に質問…