2019年のトップ機械学習コース

統計に強いルーツを持つMachine Learningは、最も興味深く、ペースの速いコンピューターサイエンス分野の1つになりつつあります。

チャットボット、スパムフィルタリング、広告配信、検索エンジン、不正検出は、機械学習モデルが日常生活を支える方法のほんの数例です。機械学習は、パターンを見つけて、人間にはできないこともあることの数学モデルを作成できるようにするものです。

探索的データ分析、統計、コミュニケーション、視覚化技術などのトピックを含むデータサイエンスコースとは異なり、機械学習コースは、機械学習アルゴリズム、それらが数学的にどのように機能するか、プログラミング言語でそれらを使用する方法のみを教えることに焦点を当てています。

さあ、始めましょう。今年のトップ5の機械学習コースの簡単な要約です。

TL; DR

最高の5つの機械学習コース:

  1. 機械学習— Coursera
  2. ディープラーニングスペシャライゼーション— Coursera
  3. Pythonによる機械学習— Coursera
  4. 高度な機械学習スペシャライゼーション— Coursera
  5. 機械学習— EdX

本当に良い機械学習コースを作るのは何ですか?

eラーニング環境を数年間追跡し、Coursera、Edx、Udemy、Udacity、DataCampなどのさまざまなプラットフォームから無数の機械学習コースに登録してから、現在利用可能な最高の機械学習コースを収集しました。

基準

リスト内の各コースは、次の基準に従います。
コースは:

  • 機械学習に厳密に焦点を当てる
  • 無料のオープンソースプログラミング言語、つまりPython、R、またはOctaveを使用する
  • これらの言語には、無料のオープンソースライブラリを使用してください。一部のインストラクターとプロバイダーは商用パッケージを使用しているため、これらのコースは考慮から除外されています。
  • 実践と実地体験のためのプログラミング課題を含む
  • アルゴリズムが数学的にどのように機能するかを説明する
  • セルフペース、オンデマンド、または毎月利用可能
  • 魅力的なインストラクターと興味深い講義があります
  • さまざまなアグリゲーターやフォーラムからの平均以上の評価とレビューを持っている

これにより、コースのプール全体がすぐに切り捨てられますが、目標は、時間と労力に見合うだけのコースを決定できるようにすることです。

MLをできるだけ早く包括的に学習するには、オンライン学習に加えて、さまざまな本を探す必要もあると思います。以下は、私の学習体験に大きな影響を与えた2冊の本です。

2つの優れたブックコンパニオン

以下のビデオコースを受講することに加えて、機械学習が初めての場合は、次の本を読むことを検討してください。

  • 統計学習の紹介。オンラインでも無料で利用できます。

この本には、基本的な機械学習技術の多くの数学的な直観を高めるために、信じられないほど明確でわかりやすい説明と例があります。この本は物事の理論的側面に関するものですが、Rプログラミング言語を使用した多くの演習と例が含まれています。

  • Scikit-LearnおよびTensorFlowによるハンズオン機械学習、Safariサブスクリプションでも利用可能

このテキストは、Pythonを使用した機械学習のアプリケーションに重点を置いているため、前の本を補足します。この本は、以下のいずれかのコースとともに、プログラミングスキルを強化し、機械学習をプロジェクトにすぐに適用する方法を示します。

それでは、コースの説明とレビューを見てみましょう。

#1機械学習— Coursera

これは、他のすべての機械学習コースが審査されるコースです。このコースの初心者向けの教師と作成者は、スタンフォード大学教授、Google Brainの共同設立者、Courserの共同設立者であり、BaiduのAIチームを数千人の科学者に成長させたVPであるAndrew Ngです。

このコースでは、割り当てにPythonまたはRの代わりにオープンソースプログラミング言語Octaveを使用します。これは一部の人にとっては契約違反になるかもしれませんが、あなたが完全な初心者であれば、Octaveは実際にMLの基礎を学ぶ簡単な方法です。

全体として、教材は非常にバランスが取れており、Ngによって直感的に明確に表現されています。各アルゴリズムを理解するために必要なすべての数学は完全に説明されており、いくつかの計算の説明と線形代数の復習があります。コースはかなり自己完結型ですが、事前に線形代数の知識があれば役立ちます。

プロバイダー:Andrew Ng、スタンフォード
費用:監査は無料、証明書は79ドル

コース構成:

  • 1つの変数を使用した線形回帰
  • 線形代数レビュー
  • 複数の変数を使用した線形回帰
  • Octave / Matlabチュートリアル
  • ロジスティック回帰
  • 正則化
  • ニューラルネットワーク:表現
  • ニューラルネットワーク:学習
  • 機械学習の適用に関するアドバイス
  • 機械学習システムの設計
  • サポートベクターマシン
  • 次元削減
  • 異常検出
  • レコメンダーシステム
  • 大規模機械学習
  • 適用例:写真OCR

これらはすべて11週間にわたってカバーされます。コース全体を完了することを約束できれば、約4か月で機械学習の基礎知識が得られます。

その後、Deep Learning、ML Engineeringなど、興味をそそる他のトピックなど、より高度なトピックや専門的なトピックに快適に進むことができます。

これは間違いなく、初心者として始めるのに最適なコースです。

#2ディープラーニングスペシャライゼーション— Coursera

また、Andrew Ngが教えたこの専門分野は、ニューラルネットワークとディープラーニングについて学び、多くの問題をどのように解決するかに興味のある方のための、より高度なコースシリーズです。

各コースの割り当てと講義では、Pythonプログラミング言語を使用し、ニューラルネットワークにTensorFlowライブラリを使用します。これは当然、Ngの機械学習コースの優れたフォローアップです。同様の講義スタイルを受講できますが、機械学習にPythonを使用することになります。

プロバイダー:Andrew Ng、deeplearning.ai
費用:監査は無料、証明書は月49ドル

コース:

  1. ニューラルネットワークとディープラーニング
  • ディープラーニングの概要
  • ニューラルネットワークの基本
  • 浅いニューラルネットワーク
  • ディープニューラルネットワーク

2.ニューラルネットワークの改善:ハイパーパラメーターの調整、正則化、最適化

  • ディープラーニングの実用的な側面
  • 最適化アルゴリズム
  • ハイパーパラメーターチューニング、バッチ正規化、プログラミングフレームワーク

3.機械学習プロジェクトの構築

  • ML戦略(1)
  • ML戦略(2)

4.畳み込みニューラルネットワーク

  • 畳み込みニューラルネットワークの基礎
  • 深い畳み込みモデル:ケーススタディ
  • 物体検出
  • 特別なアプリケーション:顔認識とニューラルスタイルの転送

5.シーケンスモデル

  • リカレントニューラルネットワーク
  • 自然言語処理とワード埋め込み
  • シーケンスモデルと注意メカニズム

このコースで提示されるアルゴリズムを理解するには、線形代数と一般的な機械学習に既に精通している必要があります。必要な数学をどこで取り上げるかについての提案が必要な場合は、この記事の最後にある学習ガイドを参照してください。

#3 Pythonによる機械学習— Coursera

もう1つの初心者コースは、最も基本的な機械学習アルゴリズムのみに焦点を当てています。インストラクター、スライドアニメーション、およびアルゴリズムの説明が非常にうまく組み合わされて、基本を直感的に理解できます。

このコースではPythonを使用し、アルゴリズムの背後にある数学について多少軽くなります。各モジュールを使用すると、ブラウザーでインタラクティブなJupyterノートブックをスプールして、今学んだ新しい概念を学習することができます。各ノートブックは知識を強化し、実際のデータでアルゴリズムを使用するための具体的な指示を提供します。

プロバイダー:IBM、Cognitive Class
価格:監査は無料、証明書は月額39ドル

コース構成:

  • 機械学習の紹介
  • 回帰
  • 分類
  • 分類
  • レコメンダーシステム
  • 最終プロジェクト

このコースの最も良い点の1つは、各アルゴリズムに与えられた実用的なアドバイスです。新しいアルゴリズムが導入されると、インストラクターはその仕組み、その長所と短所、使用する状況を提供します。これらのポイントは他のコースから除外されることが多く、この情報は新しい学習者にとって重要ですより広い文脈を理解する。

#4高度な機械学習の専門分野— Coursera

これは、非常に幅広いネットをキャストする別の高度なコースです。できるだけ多くの機械学習技術をカバーすることに関心がある場合、このスペシャライゼーションはバランスの取れた広範なオンラインカリキュラムの鍵となります。

このコースの指導は素晴らしく、非常にわかりやすく簡潔です。その高度な性質により、これまでにリストされている他のどのコースよりも多くの数学が必要になります。すでに初心者コースを受講しており、線形代数と微積分学に精通している場合、これは機械学習の専門知識の残りを埋めるのに適した選択肢です。

このSpecializationで扱われていることの多くは、多くの機械学習プロジェクトにとって極めて重要です。

プロバイダー:国立研究大学経済学部
費用:監査は無料、証明書は月49ドル

コース:

  1. ディープラーニングの概要
  • 最適化の概要
  • ニューラルネットワークの概要
  • 画像のディープラーニング
  • 教師なし表現学習
  • シーケンスのディーラーニング
  • 最終プロジェクト

2.データサイエンスコンペティションに勝つ方法:トップカグラーから学ぶ

  • イントロと要約
  • モデルに関する機能の処理と生成
  • 最終プロジェクトの説明
  • 探索的データ分析
  • 検証
  • データ漏洩
  • メトリックスの最適化
  • 高度な機能エンジニアリング1
  • ハイパーパラメーター最適化
  • 高度な機能エンジニアリング2
  • アンサンブル
  • 大会が通過する
  • 最終プロジェクト

3.機械学習のためのベイズ法

  • ベイジアン手法と共役事前分布の概要
  • 期待値最大化アルゴリズム
  • 変分推論と潜在ディリクレ割り当て(LDA)
  • マルコフ連鎖モンテカルロ
  • 変分オートエンコーダー
  • ガウス過程とベイズ最適化
  • 最終プロジェクト

4.実践的な強化学習

  • イントロ:なぜ気にする必要があるのですか?
  • RLの中心:動的プログラミング
  • モデルフリーの方法
  • 近似値ベースの方法
  • ポリシーベースの方法
  • 探検

5.コンピュータービジョンのディープラーニング

  • 画像処理とコンピュータービジョンの概要
  • 視覚認識のための畳み込み機能
  • 物体検出
  • オブジェクト追跡とアクション認識
  • 画像のセグメンテーションと合成

6.自然言語処理

  • イントロとテキストの分類
  • 言語モデリングとシーケンスのタグ付け
  • 意味論のベクトル空間モデル
  • シーケンスからタスクへ
  • 対話システム

7.機械学習による大規模なハドロン衝突型加速器の課題への対処

  • データサイエンティスト向けの素粒子物理学入門
  • 粒子識別
  • まれな崩壊で新しい物理を検索
  • 新しいCERN実験での機械学習を使用した暗黒物質のヒントの検索
  • 検出器の最適化

この一連のコースを完了するには約8〜10か月かかります。今日から始めると、1年足らずで大量の機械学習を学び、最先端のアプリケーションに取り組むことができるようになります。

数か月を通して、コンピューターで読み方、見方、遊び方を学習する実際のプロジェクトをいくつか作成します。これらのプロジェクトは、ポートフォリオの優れた候補となり、GitHubが関心のある雇用主に非常に積極的に見えるようになります。

#5機械学習— EdX

これは、このリストの他のどのコースよりも数学の前提条件が最も高い上級コースです。線形代数、微積分、確率、プログラミングを非常にしっかりと把握する必要があります。このコースには、PythonまたはOctaveのいずれかの興味深いプログラミング割り当てがありますが、どちらの言語も教えていません。

このコースの最大の違いの1つは、機械学習への確率論的アプローチの適用範囲です。 Machine Learning:A Probabilistic Perspective(修士課程で最も推奨されるデータサイエンスの本の1つ)のような教科書を読むことに興味があるなら、このコースは素晴らしい補足になるでしょう。

プロバイダー:コロンビア
費用:監査は無料、証明書は300ドル

コース構成:

  • 最尤推定、線形回帰、最小二乗
  • リッジ回帰、バイアス分散、ベイズ規則、最大事後推論
  • 最近傍分類、ベイズ分類器、線形分類器、パーセプトロン
  • ロジスティック回帰、ラプラス近似、カーネル法、ガウス過程
  • 最大マージン、サポートベクターマシン(SVM)、ツリー、ランダムフォレスト、ブースティング
  • クラスタリング、K-Means、EMアルゴリズム、欠損データ
  • ガウス分布の混合、行列因子分解
  • 非負行列因子分解、潜在因子モデル、PCAおよびバリエーション
  • マルコフモデル、隠れマルコフモデル
  • 連続状態空間モデル、関連分析
  • モデル選択、次のステップ

カリキュラムのトピックの多くは、初心者を対象とした他のコースでカバーされていますが、数学はここで骨抜きにされていません。これらのテクニックを既に習得しており、数学の詳細に興味があり、アルゴリズムの一部を実際に導出するプログラミング割り当てに取り組みたい場合は、このコースを試してみてください。

学習ガイド

コースの推奨事項を確認したので、学習機械学習の旅のクイックガイドを次に示します。まず、ほとんどの機械学習コースの前提条件に触れます。

コースの前提条件

より高度なコースを開始するには、次の知識が必要です。

  • 線形代数
  • 確率
  • 微積分
  • プログラミング

これらは、機械学習が内部でどのように機能するかを理解できる一般的なコンポーネントです。多くの初心者コースでは、通常、少なくともある程度のプログラミングと、ベクトル、行列、それらの表記法などの線形代数の基礎に精通していることが求められます。

このリストの最初のコースであるAndrew Ngによる機械学習には、必要なほとんどの数学の復習が含まれていますが、以前に線形代数を取ったことがない場合は、機械学習と線形代数を同時に学習するのは難しいかもしれません時間。

必要な計算をブラッシュアップする必要がある場合は、以下を確認してください。

優れたMLコースの大半はPythonを使用しているため、Pythonを学ぶことをお勧めします。 Octaveを使用するAndrew Ngの機械学習コースを受講する場合、最終的に必要になるため、コース中またはコース終了後にPythonを学習する必要があります。さらに、別の優れたPythonリソースにはdataquest.ioがあります。これには、インタラクティブなブラウザー環境で無料のPythonレッスンがたくさんあります。

前提条件の基本事項を学んだ後、アルゴリズムの仕組みを実際に理解し始めることができます。

基本的なアルゴリズム

機械学習には、誰もが使い慣れた経験のあるアルゴリズムの基本セットがあります。これらは:

  • 線形回帰
  • ロジスティック回帰
  • k-Meansクラスタリング
  • k最近傍
  • サポートベクターマシン(SVM)
  • 決定木
  • ランダムフォレスト
  • ナイーブベイズ

これらは必要不可欠なものですが、もっとたくさんあります。上記のコースには、本質的にこれらすべてが含まれていますが、いくつかのバリエーションがあります。これらの手法がどのように機能し、いつ使用するかを理解することは、新しいプロジェクトに取り組む際に非常に重要です。

基本の後、学習するためのより高度なテクニックは次のとおりです。

  • アンサンブル
  • ブースティング
  • 次元削減
  • 強化学習
  • ニューラルネットワークとディープラーニング

これはほんの始まりに過ぎませんが、これらのアルゴリズムは通常、最も興味深い機械学習ソリューションで見られるものであり、ツールボックスへの効果的な追加です。

また、基本的な手法と同様に、新しいツールを学習するたびに、プロジェクトにすぐに適用して理解を固め、復習が必要なときに戻っていくことが習慣になるはずです。

プロジェクトに取り組む

オンラインでの機械学習の学習はやりがいがあり、非常にやりがいがあります。動画を見てクイズをするだけでは、教材を本当に学習しているわけではないことを覚えておくことが重要です。さまざまなデータを使用し、コース自体とは異なる目的を持つ、取り組んでいるサイドプロジェクトがある場合は、さらに学ぶことができます。

基本の学習を開始したらすぐに、これらの新しいスキルを適用できる興味深いデータを探す必要があります。上記のコースでは、特定のアルゴリズムをいつ適用するかについての直感が得られるため、独自のプロジェクトにすぐに適用することをお勧めします。

試行錯誤、探索、フィードバックを通じて、さまざまな手法を試し、結果を測定し、予測または分類する方法を発見します。どのようなMLプロジェクトを引き受けるかについてのインスピレーションについては、この例のリストを参照してください。

プロジェクトに取り組むことで、機械学習の状況をより深く理解することができます。また、ディープラーニングなどの高度な概念に入ると、事実上、無数のテクニックと方法を理解して操作できます。

新しい研究を読む

機械学習は急速に発展している分野であり、新しい技術やアプリケーションが毎日登場しています。基礎を学んだら、興味のあるトピックに関するいくつかの研究論文を読む準備ができているはずです。

条件に一致する新しい論文について通知を受けるためのウェブサイトがいくつかあります。 Google Scholarは常に開始するのに適した場所です。 「機械学習」や「Twitter」など、興味のあるキーワードを入力し、左側の小さな「アラートを作成」リンクをクリックしてメールを取得します。

それらのアラートを読み、論文をスキャンして読む価値があるかどうかを確認し、何が起こっているのかを理解することを週に1度習慣にしてください。作業中のプロジェクトに関係している場合は、自分の問題にテクニックを適用できるかどうかを確認してください。

まとめ

機械学習は非常に楽しく、学び、実験することができます。このエキサイティングな分野へのあなた自身の旅に合った上記のコースを見つけていただければ幸いです。

機械学習はデータサイエンスの1つのコンポーネントであり、統計、視覚化、データ分析などの学習にも興味がある場合は、同様の形式に従うガイドであるトップデータサイエンスコースを必ずチェックしてください。これに。

最後に、質問や提案がありましたら、下のコメントに自由に残してください。

読んでくれてありがとう、楽しい学習を!

learndatasci.comで最初に公開されました。