Kaggleの使い方【データサイエンティストへの最短ルート】

KaggleはPythonによるデータサイエンスを学び、ディスカッションし、一流企業も出題するコンペの問題に回答をし、賞金を獲得できるプラットフォームです。
機械学習やAIなど、データサイエンスを学びたい人はもちろん、腕を上げたい人、実力を試したい人、お金を稼ぎたい人でまだKaggleをやっていない人は、今すぐユーザー登録をしましょう。

Kaggleでできること

Kaggleの特徴は様々ですが、その全てがweb上で完結します。kaggle notebookというJupyter Notebookに似た実行環境があり、自分で開発環境を構築する必要がありません。
つまり、どんなにショボいパソコンでも、Webページさえ開くことができるのであれば、Kaggleのサーバー上で動く開発環境でデータサイエンスを学び、開発できるのです。

まずはKaggleのウェブサイトを見てみましょう。リンクのページへ飛べば、多くのコンペが表示されるはずです。

kaggle_ウェブサイト
KaggleのWebページ

一番上のコンペは賞金が1000万という目ん玉飛び出そうな値段です。超一流の人たちで構成されたチームが参加するようなものを見て、『自分にできるわけないやんけ』と思いますが、そんな理由でKaggleを離れてしまってはもったいないです。

色々なコンペに提出されたコードを見ることができるので、それを使って学習することが可能です。色々あるケースに最適なアルゴリズムを学び応用してみましょう。

『でも私、機械学習以前にPythonも初めてなんだけど』と思いますが、そんな理由でKaggleをやめるのは、相当なせっかちです。

学習ページを覗いてみてください。多くの初歩的な学習コースが用意されています。

Kaggle_学習コース
Kaggleで勉強できるコース
  • Python
  • 機械学習入門
  • Pandas
  • データ可視化
  • 特徴量エンジニアリング
  • データクリーニング
  • SQL入門
  • SQL発展
  • AI倫理の導入
  • ディープラーニングの導入

などなど、様々なことを学ぶことができます。コースはそれぞれ『レクチャー+実践』の効率の良い学習ができるようになっています。

Kaggle Notebookの使い方

ウェブ上でプログラミングを実行し、保存できるKaggle NoteookはJupyter Notebookの様に使うことができます。
こちらのページから、新規Notebookを作成できます。

Kaggle_Notebook
Kaggle Notebookの新規作成

『+ New Notebook』から新規Notebookを立ち上げましょう。

Kaggle_Notebook
Kaggle Notebook

すると、Jupyter Notebookの様なNotebookが立ち上がります。使い方は同じです。(こちらの記事でJupyter Notebookについて解説しています。)

コンペに参加する

コンペに参加して、課題に対する自分の回答を提出する方法については、チュートリアルがあります。
タイタニックの乗客について、生存する人を予測するプログラムを提出することができます。

コンペのチュートリアル

ここでは、学習することよりも、いかに早く『コンペへの参加方法を知るか』に重点が置かれているので学習用には不向きかと思われます。

データセットを入手する

データサイエンスにとって一番大切なのは膨大なデータです。より多いデータでモデリングをすれば、より良い精度の予測ができる様になります。

こちらのページからは、多くのデータセットを無料で入手することができます。

kaggle_データセット
データセット

一つのCSVファイルで500MBほどの膨大なビッグデータを入手することができたりします。

最後に

Kaggleは非常に優れたプラットフォームで、データサイエンス初学者から熟練工に至るまで、あらゆるニーズに応えてくれます。

あなたもKaggler(カグラー)になるべく、この機会に初めてみてはいかがですか?