KaggleはPythonによるデータサイエンスを学び、ディスカッションし、一流企業も出題するコンペの問題に回答をし、賞金を獲得できるプラットフォームです。
機械学習やAIなど、データサイエンスを学びたい人はもちろん、腕を上げたい人、実力を試したい人、お金を稼ぎたい人でまだKaggleをやっていない人は、今すぐユーザー登録をしましょう。
Kaggleでできること
Kaggleの特徴は様々ですが、その全てがweb上で完結します。kaggle notebookというJupyter Notebookに似た実行環境があり、自分で開発環境を構築する必要がありません。
つまり、どんなにショボいパソコンでも、Webページさえ開くことができるのであれば、Kaggleのサーバー上で動く開発環境でデータサイエンスを学び、開発できるのです。
まずはKaggleのウェブサイトを見てみましょう。リンクのページへ飛べば、多くのコンペが表示されるはずです。
一番上のコンペは賞金が1000万という目ん玉飛び出そうな値段です。超一流の人たちで構成されたチームが参加するようなものを見て、『自分にできるわけないやんけ』と思いますが、そんな理由でKaggleを離れてしまってはもったいないです。
色々なコンペに提出されたコードを見ることができるので、それを使って学習することが可能です。色々あるケースに最適なアルゴリズムを学び応用してみましょう。
『でも私、機械学習以前にPythonも初めてなんだけど』と思いますが、そんな理由でKaggleをやめるのは、相当なせっかちです。
学習ページを覗いてみてください。多くの初歩的な学習コースが用意されています。
- Python
- 機械学習入門
- Pandas
- データ可視化
- 特徴量エンジニアリング
- データクリーニング
- SQL入門
- SQL発展
- AI倫理の導入
- ディープラーニングの導入
などなど、様々なことを学ぶことができます。コースはそれぞれ『レクチャー+実践』の効率の良い学習ができるようになっています。
Kaggle Notebookの使い方
ウェブ上でプログラミングを実行し、保存できるKaggle NoteookはJupyter Notebookの様に使うことができます。
こちらのページから、新規Notebookを作成できます。
『+ New Notebook』から新規Notebookを立ち上げましょう。
すると、Jupyter Notebookの様なNotebookが立ち上がります。使い方は同じです。(こちらの記事でJupyter Notebookについて解説しています。)
コンペに参加する
コンペに参加して、課題に対する自分の回答を提出する方法については、チュートリアルがあります。
タイタニックの乗客について、生存する人を予測するプログラムを提出することができます。
ここでは、学習することよりも、いかに早く『コンペへの参加方法を知るか』に重点が置かれているので学習用には不向きかと思われます。
データセットを入手する
データサイエンスにとって一番大切なのは膨大なデータです。より多いデータでモデリングをすれば、より良い精度の予測ができる様になります。
こちらのページからは、多くのデータセットを無料で入手することができます。
一つのCSVファイルで500MBほどの膨大なビッグデータを入手することができたりします。
最後に
Kaggleは非常に優れたプラットフォームで、データサイエンス初学者から熟練工に至るまで、あらゆるニーズに応えてくれます。
あなたもKaggler(カグラー)になるべく、この機会に初めてみてはいかがですか?