イベントの説明
概要
shml 機械学習勉強会@渋谷は、機械学習の勉強会です。
Pythonではじめる機械学習――scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎 などを教科書に、実習に重点を置いてすすめています。 次は時系列データの予測(外挿)をしていきたいという話をしており、次の教科書や実習テーマを決めてやっていくところです。
各人あるいは共同で、実行環境を整備し、データを集め、前処理をして、教科書にあるテクニックを応用してみる実習をする予定です。詳細は参加者で相談しながら決めていきます。
参加について
はじめての方もぜひご参加ください。
参加費用について
参加費用を仮に200円としてありますが、貸し会議室等の費用を人数で割った金額になります。200円〜300円程度です。
事前準備について
事前準備は必須ではありません。 もし余裕がある方は以下などをやってきてくださるとたいへん良いと思います。
- 教科書を読む
- 実行環境(anacondaなどpythonの環境)を整える
- ご自分の機械学習の実習をすすめる
- 関連ニュース・発表のネタを用意する (プロジェクタを使った発表も大歓迎です)
当日の持ち物について
- 上の教科書
- ノートPC (実習中心のため必須とさせていただきます)
- プロジェクタと繋ぐためのケーブル (発表者のみ。hdmiケーブル等。)
- ご自分の飲み物など (差し入れ大歓迎です)
- 参加費用 (小銭を用意していただけると助かります)
実績と予定
- 8/22 (終了) 実習初回. 教科書に沿ってirisをk近傍法でクラス分けしました. データを散布図にして観察しました. きゅうりの分類などについて話しました. その他関連ニュースについて情報交換しました. 7名参加しました.
- 8/29 (終了) 実習第2回. 教科書のデータをつかって実習をしました. bostonの不動産のデータを、決定木を使って分析しました. pythonのコードを助け合いつつ各人で書きました. 決定木の可視化なども行いました.
- 9/12 (終了) 実習つづき 簡単にロードできる練習用サンプルデータに頼らず、実世界のデータを pandasをつかってcsvを取り込んで、分析まで持ち込みました. それぞれ決定木・ランダムフォレスト・多層パーセプトロンなど違う手法を使って分析・学習しました. 精度が高くなるパラメーターをさぐる等しました. ノートPCが熱くなるという機械学習らしい経験をしました.
- 9/19 (終了) 時系列データの分析として、Poloniexからビットコインのチャートのデータを取得しました. 周期を分析しやすいよう曜日の列を足しました.
- 10/3 (終了) RNNについて発表してもらいました。次の教科書や実習テーマについて相談しました。
- 10/10 (予定) 次の教科書を決めて実習に着手できるといいと思います。
- (今後やりたい) 時系列データの予測(外挿)
- (今後やりたい) webからのスクレイピング
- (今後やりたい) パラメータの自動調整・グリッドサーチなど
- (今後やりたい) ディープラーニングもうごかしたい
- (今後やりたい) 実際に役に立つことをしてみたい
- (今後やりたい) 実習で理解が深まったらまた教科書を読み進めたい
- (今後やりたい) 他の本も読んでみたい
資料 資料をもっと見る/編集する
資料が投稿されると、最新の3件が表示されます。