Numpy,Pandasライブラリを使って機械学習のデータ処理を体験し、線形回帰の問題を解いていきます。
ラストは学んだことを活かして、Kaggleに挑戦してみましょう。
エンジニア歴数年以上の方。
プログラミング初心者は「ゼロからはじめるパイソン入門講座」をオススメします。
・ノートPC持参
・言語はPythonを使います。
・numpyライブラリ
・matplotlibライブラリ
・ヒストグラム
・データフレーム
・データ分析
・要約統計量を表示する
・単回帰分析
・散布図の上に計算した回帰係数と切片が示す直線を上書き表示
・モデルの決定係数
・Kaggle にチャレンジ
Kaggle(カグル)は企業や研究者がデータを投稿し、それに対して、統計家やデータ分析家がその最適モデルを競い合う、予測モデリング・分析手法のプラットフォームで、2010年に設立。そして2017年にはGoogleが数百億円で買収しました。
カグルの仕組みは、企業や政府などの組織がコンペを開催、それに対して、データサイエンティストや機械学習エンジニアが最適モデルを提案。賞金と引き換えに最も制度の高い分析モデルを買い取るという「クラウドファンディング」の仕組みです。
現在、開催されいるコンペを見てみると、賞金は250万円から1000万円ぐらいまでのコンペがひしめいていますが、3億円の賞金のコンペもあったようです。
https://www.kaggle.com/competitions
コンペの分野はさまざまで、HIV研究、チェス格付け、交通量予測、空港のセキュリティなどなど。
日本企業の例ですと、メルカリが販売者が投稿した情報を基に「適正な販売価格」を予測するチャレンジを開催しました。
Kaggleの中でも特に有名な課題として「タイタニック号:災害からの機械学習)」があります。
なお、コンペ参加費用は無料で、企業から提供されているトレーニング用のデータセットを利用して、モデルの訓練を行います。
各データセットには、他のユーザーが構築した予測モデルのコードや説明が公開されています。
それは「Kernels(カーネル)」という機能で閲覧できます。
また、「Discussion(ディスカッション)」はカグラーたちのコミュニティ機能で、そこで質問したり、情報交換をすることができます。
データの投稿は、予測されたデータのファイル(CSV形式)だけのときや、モデルのコードのカーネルの提出が必要な時があります。
予測データの投稿後は、リアルタイムで評価がつきます。
このスコアをあげていき、コンペを勝ちあがりましょうということになります。
なお、予測データの投稿は1日5回までです。
初心者の方でもカーネルで公開されている処理コードを読むことで、最先端のデータサイエンティストに近くことができますので、Kaggleは機械学習の勉強の場としても有意義です。
Kaggleをやることでデータサイエンティストになるために必要なスキルを身に付けることができます。
データサイエンティストになるには、機械学習の理論や数学・統計に関する学習、データを見極めたり、モデルを作成する作業、そしてコーディングスキルが必要とされています。
しかしながら、Kaggleを始めるだけならそれは不要で、プログラミング言語を始めるのと同じ感覚で、他のカグラーの分析手法を見ていれば、自ずと上記のスキルが身につくようです。
プログラミング経験がない人でも、カグルをやって3ヶ月で「ソロゴールド」という称号を得た人もいます。
機械学習の勉強歴が半年の初心者で、Kaggleで銅メダルを取得した方のブログによると、注目した視点は、入力データを改変する“前処理”と、他者が提案したモデルを良いとこ取りする“モデルの流用”とのことです。
これを読む限りでも、カグラー同士でマッシュアップされていく世界観が彷彿とされており、カグルの最大の魅力といえましょう。
「TechGYM方式」とは、基礎知識なしでも、座学なしでプログラミングに専念できるように設計されたプログラミングのカリキュラムメソッドです。
優れたエンジニアの多くは、職業訓練学校や研修スクールで学ぶような学び方をしません。
作りたいものを作っていたら、自然に習得できているのです。そして、優れた指導者(メンターや師匠)との出会いがエンジニアとしてのプロフェッショナル性を高めます。
この自発性とプロフェッショナル性を兼ね備えたのが「TechGYM方式」です。
授業を聞いたりテキストを読むことで失う時間を、純粋にプログラミング時間に向けることで、習得効率は飛躍的に向上し、モチベーションも維持できます。
その時点で知らなくていい知識や概念を可能な限り削ぎ落とし、知るべきタイミングが訪れた時にはすでに課題を通じて覚えているようなスキル習得の自動化を図ります。
講座で用いるサンプルソースや課題は、最も効率よく学べるように細部に渡って設計されています。
まるで魔法にかかったようにプログラミンスキルが習得できるのが「TechGYM方式」の醍醐味です。
百聞は一見に如かず。実際に講座に参加して「魔法体験」をしてみてください。
・デイズ赤坂見附(最寄駅:赤坂見附)
・19:00-21:00(途中参加・途中退席OK)
月額2万円で、参加し放題のサービスとなります。
他にもテックジム赤坂見附校の特徴は、
・平日夜の毎晩開催
・トレーナーは現役のエンジニア
・女性と学生の月会費は50%割引
・会員の同伴参加は無料
・ピザナイトを月1で開催(無料)
・キャリア相談
などの会員特典のほか、
早期入会特典として、入会金が無料となっております。
詳細はこちら
http://techgym.jp/?p=22
「テックジム方式」とは、基礎知識なしでも、座学なしでプログラミングに専念できるように設計されたプログラミングのカリキュラムメソッドです。 優れたエンジニアの多くは、職業訓練学校や研修スクールで学ぶような学び方をしません。 作りたいものを作っていたら、自然に習得できているのです。そして、優れた指導者(メンターや師匠)との出会いがエンジニアとしてのプロフェッショナル性を高めます。 この自発性...
メンバーになる