学習 本・勉強方法

【Udemy】独学でプロ・データサイエンティストになるためのオススメ講座をご紹介

2022年1月31日

さて今回は独学でデータサイエンティスト/機械学習・AIエンジニアになるために是非利用したいUdemy講座を紹介したいと思います。

本で勉強するのもよいですが、Udemyはすごく効率的に勉強できるツールなので、私も積極的に活用しています。

もう一つのMOOCの代表格であるCouseraは、Stanford大学の先生が解説していたりとクオリティがものすごく高いのですが、英語だけだったり、1ヵ月5000円とかだったりして、1ヵ月で終わらないと1万円かかったりします。

もちろんちゃんとやれば十分元は取れますし、それでも十分安いと思いますが。(講座は最高なのでこのサイトでもいくつか紹介しています)

一方でUdemyの良いところは、人気の講座はクオリティが高い上に一度購入するといつまでも見られるところです。

日本語の講座も充実しています。

価格も割引セールだと数千円になりますので、このクオリティ、このボリュームで2000円は破格!と思える講座がたくさんあります。

ということで、今回はプロ・データサイエンスを目指すためのUdemyコースを紹介していきたいと思います。

同じジャンルの講座でも、ボリュームが色々あるので、講座全体の時間も確認しながら選ぶと良いかと思います。

最後に一つ付け加えておきますが、最後までしっかり受講するのは楽ではありませんで、そこはご留意いただければと思います。

順番に見ていきましょう。

Python

まずはPythonをしっかりとマスターしましょう。

Pythonの学習に限定した講座についてのオススメは次の2つです。

『現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル』

【受講者数】 84672人
【レビュー数】16686
【評価】4.4
【講師】酒井 潤
【総時間】28時間36分

学習内容より
  • Python3の基本の習得できます。
  • Pythonicなコードのスタイルを身に付けることができます。
  • 応用編の講義もありますので、簡単なアプリケーション開発に必要なスキルを習得できます。

受講者数が多く、評価も4.4点なので非常に良いですね。

なんとPythonだけで合計28時間強の講座です。

隙間時間にやるにしてはボリュームがかなりありますが、ハイレベルなトピックも網羅しているため、しっかりとした知識がつきます。

単にPythonをマスターするだけではなく、他人にとってもわかりやすいコードを書けるようになるというのがこの講座の目標です。

今Pythonを使っている人にもPythonマスターになるためにオススメできる講座です。

講座内容より抜粋

Pythonのコードをただ書いて、プログラムが動けば良いというだけではなく、コードスタイルに関しても言及しております。pythonicにと言われるように、PythonはPythonらしく綺麗でわかりやすいコードを書くことが大切です。

詳細はこちらをご覧ください。

『現役シリコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル』

『はじめてのPython 少しずつ丁寧に学ぶプログラミング言語Python3のエッセンス』

【受講者数】 12361人
【レビュー数】2914
【評価】4.4
【講師】我妻 幸長
【総時間】4時間30分

学習内容より抜粋
  • AI、データサイエンスの講座を受講するための下地が身につきます。
  • ちょっとした計算、解析やWebスクレイピング用のツールとしてPythonが活用できるようになります。
  • Pythonで文章を加工したり解析したりできるようになります。正規表現も学びます。
  • Pythonの文法を理解し、コードが書けるようになります。Pythonの基本的なプログラミング技術が身につきます。
  • 条件分岐、ループ、関数、オブジェクト指向などプログラミングの基本的な考え方が身につきます。

上の講座ではボリュームが多いなという方には、より時間の短く、より入門的なこちらの講座です。

講師の方はデータサイエンスやディープラーニングの講座でも非常に人気のある方です。

Pythonの基礎の基礎から解説されているので、初心者の方でも問題ありません。

まず、Pythonを使えるようになりたい、ということであれば、こちらの講座が良いと思います。

Pythonマスターを目指す人には、上記の『現役リコンバレーエンジニアが教えるPython 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイル』がオススメです。

講座内容より抜粋

はじめてのPythonは、誰にでも開かれたPython初心者向けの講座です。

プログラミング言語Pythonをゼロから少しづつ丁寧に解説するので、Pythonの本質を無理なく着実に身につけることができます。

詳細はこちらにあります。

『はじめてのPython 少しずつ丁寧に学ぶプログラミング言語Python3のエッセンス』

機械学習・AI

続いて、機械学習がメインの講座です。

機械学習の講座でもPythonの解説がある場合があるので、重複する部分も結構あります。

Pythonは使えるよ、という人は飛ばしても構いませんし、1.5倍速や2倍速で気になるところだけチェックをするというのも良いと思います。

『【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -』

【受講者数】 43949人
【レビュー数】12209
【評価】4.4
【講師】吉崎 亮介、株式会社キカガク
【総時間】4時間17分

学習内容より
  • 機械学習の原理を数学から理解し、プログラミング(Python)で実装できるようになります。
  • 今まで難しそうに見えていた機械学習に用いられる数式の意味を理解できるようになります。
  • 機械学習に関する専門用語も数式と一緒に覚えることができます。
  • 求めた数値を綺麗に可視化する技術を習得することができます。

受講者数43949人と大人気の株式会社キカガクによる講座です。

機械学習で必要な基本的な数学の説明や微分の説明がありますので、文系の人や数学の知識があまりない人でも大丈夫です。

まさに入門といった内容になっていますので、初めて機械学習を勉強するという方に最適です。

最終的には説明変数が一つの単回帰を学びます。

時間は短めの4時間強で、学ぶのも単回帰までなので、機械学習を理解したというところまではいきませんが、最初のステップとしてはすごく良いと思います。

講座内容より抜粋

初級編では機械学習で必要な数学のエッセンスがたくさん詰まっている「単回帰分析」をゴールに、機械学習の考え方、微分、単回帰分析まで一気通貫で解説します。

数学は中学校の復習から始め、Pythonも環境構築・プログラミングの文法から解説しますので、初めての方でも学べる内容となっています。

中級編・上級編とステップアップしながら学ぶことで、データ解析の実務に必要なスキルと考え方が学べる構成となっています。

詳細はこちらです。

『【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -』

なお、キカガクはAIを勉強する人のためのスクールも運営しており、独学は続かないという人にはオススメです。

『キカガクのキャンペーン』はこちら

『【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 中級編 -』

【受講者数】 28577人
【レビュー数】5147
【評価】4.4
【講師】吉崎 亮介、株式会社キカガク
【総時間】4時間22分

学習内容より抜粋
  • 今まで難しそうに見えていた機械学習に用いられる数式の意味を理解できるようになります。
  • 機械学習に関する専門用語も数式と一緒に覚えることができます。
  • 線形代数を用いて複数の変数を考慮したモデルを作成できるようになります。
  • Numpyを用いた線形代数演算をプログラミングで実装が出来るようになります。
  • Scikit-learnを用いた機械学習の実装ができるようになります。
  • データの相関関係をひと目で可視化出来るようになります。
  • 平均・標準偏差・正規分布といった統計の数式と使い所が理解できます。
  • 外れ値の除去が行えるようになります。
  • 予測に大きな影響を与えている変数を見つけることができるようになります。

上記の『【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -』の中級編です。

線形代数の説明から始まり、最後は重回帰を実装します。

こちらも4時間22分と短めです。

ビジネスでデータを分析するのであれば、こういった単回帰や重回帰を理解して使えるようになり、統計もきちんと理解しているというのは非常に重要だと思います。

講座内容より抜粋

中級編では機械学習で必要な数学のエッセンスがたくさん詰まっている「重回帰分析」をゴールに、線形代数統計重回帰分析まで一気通貫で解説します。

詳細はこちらをご覧ください。

『【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 中級編 -』

『みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習 【2022年最新版】』

【受講者数】 45345人
【レビュー数】8342
【評価】4.4
【講師】我妻 幸長
【総時間】8時間44分

学習内容より
  • 簡単な機械学習のコードを書けるようになります。
  • Pythonの基礎的なプログラミング技術が身につきます。
  • ビジネス上必要な人工知能の基礎知識が身につきます。
  • 有名な機械学習ライブラリが扱えるようになります。
  • 機械学習と関連した簡単な数学の知識が身につきます。
  • 人工知能全般についての知識が身につきます。

この講座は上記の『はじめてのPython 少しずつ丁寧に学ぶプログラミング言語Python3のエッセンス』と同じ講師の方の講座です。

機械学習と言ってもニューラルネットワークが中心です。

理論だけを理解するのではなく、データの分類や、文字認識、株価分析などで手を動かしながら学んでいきます。

講座内容より抜粋

みんなのAI講座は、誰に対しても開かれた人工知能、機械学習の講座です。プログラミングや数学の事前知識はほとんど必要ありません。

難解な数式やプログラミングが学習の妨げであった方でも、問題なく学習できます。

文系や非エンジニアの方にもお勧めです。

詳細はこちらです。

『みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習 【2022年最新版】』

『【世界で37万人が受講】データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜』

【受講者数】 27298人
【レビュー数】4031
【評価】4.3
【講師】大橋 亮太
【総時間】26時間23分

学習内容より抜粋
  • データサイエンティストになるために必要な一連のツールについて学ぶことができます
  • 統計分析、NumpyやPandasなどを使ったPythonのプログラミング、高度な統計学上の手法、Tableau、StatsModelとScikitLearnを使った機械学習の実装、TensorFlowを使ったディープラーニングの実装
  • データの前処理の方法
  • 機械学習の背景にある考え方
  • Pythonを使って統計上の分析をする方法
  • Pythonを使った線形回帰とロジスティック回帰分析
  • クラスター分析と因子分析
  • 実生活における実践問題を通じた深い理解

(続く)

ブートキャンプというだけあって、総時間26時間強とボリュームが非常に大きい講座です。

学習内容は、確率統計から始まり、線形回帰・重回帰ロジスティック回帰、クラスター分析、K平均法、、といった機械学習の基礎をプログラムを作成しながら学びます。

その後、ディープラーニングに入っていきます。

StatsModelやScikitLearnを使いますが、ディープラーニングではTensorflowを使いますので、Tensorflowの講座としても良いと思います。

また、モデルだけではなく、モデルの検証方法やデータ可視化ツールとして人気のTableauを使った分析にも触れています。

ということで、機械学習・ディープラーニングの一通りの基礎をすべて学べる講座です

時間はかなりかかりますが、しっかりと理解したい人向けの講座です。

講座内容より抜粋

このコースはデータサイエンティストを志す人全ての方が、データサイエンスの世界で活躍するために必要な知識とスキルを、豊富なアニメーション、具体例、課題を通して自分のペースで確実に身につけれるように設計されています。

(省略)

つまり、ビジネスパーソンとして活躍するために必要なスキルをこの講座を通じて身につけることができるのです。

詳細はこちらをご参照ください。

『データサイエンティストを目指すあなたへ〜データサイエンス25時間ブートキャンプ〜』

『【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門』

【受講者数】 25218人
【レビュー数】4587
【評価】4.3
【講師】株式会社SIGNATE
【総時間】8時間20分

学習内容より
  • Pythonの基礎を身につけられます。
  • 2つのケースを通して、ビジネス上のデータ分析ができるようになります。

こちらは日本の分析コンペで有名なSIGNATE社の提供する講座です。

総学習時間は8時間20分とそこまで分量は多くありません。

データ分析コンペ企業の提供するプログラムなので、より実践的なデータを使って分析の仕方を学んでいきます。

お弁当の売り上げ予測や、銀行の優良顧客の予測など、実際の現場でも使いそうな題材を使っています

講座内容より抜粋

実践を重視し、リアルなデータと課題を教材として採用しています

言葉や概念を学習するスライドの章とプログラミングしながら実践する章の2つを用意しています

一問一答形式の教材を用意。問題を解き進めることでプログラミングが徐々に身につき、データサイエンスの流れが体験できるようになっています

詳細はこちらをご確認ください。

『【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門』

『ディープラーニング : Pythonでゼロから構築し学ぶ人工知能(AI)と深層学習の原理』

【受講者数】 5921人
【レビュー数】995
【評価】4.1
【講師】我妻 幸長
【総時間】6時間53分

学習内容より抜粋
  • ディープラーニングの原理を理解し、ゼロから実装できるようになります。
  • ディープラーニングのコードの読み書きができるようになります。
  • バックプロパゲーション(誤差逆伝播法)によりニューラルネットワークが学習する仕組みを理解できます。
  • 畳み込みニューラルネットワーク(CNN)の仕組みを理解できます。
  • 数学やプログラミングをディプラーニングで活用する具体的な方法を学べます。
  • TensorFlow、Chainerなどのフレームワークの学習コストが下がります。

こちらは『みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習 【2022年最新版】』の講師の方の講座です。

Pythonの基礎や数学の基礎から始まり、Tensorflowなどといったフレームワークは使わずに、Pythonでニューラルネットワーク、ディープラーニングを学習します

最後は画像処理でよく使われている畳み込みニューラルネットワーク(CNN)を実装します。

講座内容より抜粋

TensorFlowやChainerなどのフレームワークを使わずに、畳み込みニューラルネットワーク(CNN)までゼロから構築できるようになりましょう。

ディープラーニングをフルスクラッチで構築することにより、普遍的な原理がしっかりと身につきます。

詳細はこちらをご参照ください。

ディープラーニング : Pythonでゼロから構築し学ぶ人工知能(AI)と深層学習の原理

PyTorch

続いてディープラーニングを実装する際によく使われているライブラリであるPyTorchの講座です。

『【Hands Onで学ぶ】PyTorchによる深層学習入門』

【受講者数】 3055人
【レビュー数】521
【評価】4.4
【講師】Tetsuya T
【総時間】5時間13分

学習内容より抜粋
  • 研究者の間で急激に人気を伸ばしているPyTorchというAIフレームワークについてライブラリの基本から、深層学習の学習の手続きまでのプログラミング方法を理解できる
  • 多層NNや畳み込みNNといった基本的なモデルに加えて、転移学習、オートエンコーダー、ResNet、LSTMといった様々なモデルを構築する事で、深層学習の基礎を固める事が出来る
  • 過学習への対処方法や、GPUでの学習方法、自前で用意した画像データセットの使用方法など研究開発の現場で使用する実際的なスキルを身に付けることが出来る

Google Colabを使ってPyTorchを学習していきます。

線形回帰や多層パーセプトロンから始まり、畳み込みニューラルネットワーク(CNN)、転移学習、オートエンコーダ、ResNet、LSTMと基礎的なモデルを一通り手を動かしながら学習することができます。

講座内容より抜粋

本コースのゴールは"機械学習を知っている"から"機械学習を使える"へとステップアップする事です。

本コースはハンズオンという形式で、Google Colab上でデータの準備⇒深層学習のモデル作成⇒損失関数・オプティマイザの設定⇒学習・評価という一連の流れをスクラッチから講師と一緒に実装していきます

詳細はこちらでご確認ください。

『【Hands Onで学ぶ】PyTorchによる深層学習入門』

Tensorflow

Tensorflowは少なくともVersion 2に対応していないといけません。

『【4日で体験!】 TensorFlow, Keras, Python 3 で学ぶディープラーニング体験講座』

【受講者数】 14975人
【レビュー数】2212
【評価】4.3
【講師】井上 博樹
【総時間】4時間33分

学習内容より抜粋
  • TensorFlowを実行する環境を構築できます
  • Anacondaをインストールして、安全にPython 3 の実行環境を導入できます
  • Python 3.6 の実行環境を構築できます
  • Jupyter Notebookを使用して、対話的にコードを実行できるようになります。
  • GoogleのTensorFlow公式サイトの入門編とエキスパート編をコードを実行して理解できるようになります。
  • 畳み込み・プーリング・逆伝播など深層学習の基本的な仕組みを、わかりやすい図解で理解できます
  • TensorFlowによる画像認識AIプログラムの動作を体験できます。
  • 北斎やムンクのタッチで写真をレタッチするスタイル変換のAIを試せます。

Googleが提供するTensorflowのチュートリアルに沿って学習していきます。

4日で体験とあるように、合計時間は長くないので、まだTensorflowを触ったことがない人向けに入門的な内容を解説する講座です。

これからディープラーニングを理解したい、という方にオススメです。

講座内容より抜粋
  • 数学やプログラミングの知識がなくても、ディープラーニングのプログラムを体験できます。
  • 数式を理解できなくても、概念的にどういう処理をしているのか、を直感的に理解できるようになります。
  • 畳み込みやプーリングなど難解な処理の仕組みを図解で理解できるようになります。
  • Python 3 + TensorFlowを使って、パソコン上でディープラーニングを体験できます。

詳細はこちらをご確認ください。

『【4日で体験!】 TensorFlow, Keras, Python 3 で学ぶディープラーニング体験講座』

データ分析コンペ

データサイエンティストやそれを目指す人にとって非常に人気のあるKaggleなどのデータ分析コンペを利用して、Pythonや機械学習・AIを学んでいきます。

入門的な内容が多くなっていますので、これから勉強を始める人にとっても始めやすいと思います。

『【Kaggleで学ぼう】Python と Keras で学ぶディープラーニング開発入門』

【受講者数】4848 人
【レビュー数】771件
【評価】4.3
【講師】井上 博樹
【総時間】 4時間2分

学習内容より抜粋
  • Kerasを使用して高速にディープラーニングモデルを開発できるようになります。
  • ディープラーニング開発時のパラメーターチューニングのコツを理解し、実践できるようになります。
  • 畳み込みニューラルネットワークを使用した開発を実践できるようになります。
  • Kaggleへの登録・コンペへの参加方法、学習方法を理解できるようになります。

上記『【4日で体験!】 TensorFlow, Keras, Python 3 で学ぶディープラーニング体験講座』の講師の方の講座です。

こちらも時間は4時間2分と長くありません。

最近はデータ分析コンペが流行っているのでKaggleに挑戦したいという人は多いと思いますが、まさにそういった人向けに、Kaggleへの参加の仕方から解説されています

講座内容より抜粋

また、Kaggle(カグル)というデータサイエンティストコミュニティサイト上で、データサイエンスのコンペティションに参加する手順を解説し、オープンデータで学習を行います。Kaggleの参加者は "Kaggler" (カグラー)と呼ばれ、実力を証明するのに役立ちます。

Kagglerとなってメダル取得を目指して学習し、就職や転職に役立つポートフォリオを作り、AIエンジニアやデータサイエンティストとして活躍できるようになりましょう!

題材が画像認識なので、畳み込みニューラルネットワークを学びます。

詳細はこちらをご確認ください。

『【Kaggleで学ぼう】Python と Keras で学ぶディープラーニング開発入門』

『Kaggleで始めるPython AI機械学習入門コース|高評価現役講師が丁寧にレクチャー』

【受講者数】 2230人
【レビュー数】396件
【評価】4.4
【講師】奏大(かなた)
【総時間】6時間7分

学習内容
  • pythonの基本的なプログラミング
  • AI、機械学習の概要
  • Kaggleの使い方、コンペの参加方法
  • データ分析や機械学習のプログラミング方法
  • スキルアップに向けて次に学ぶべき指針

こちらはその前の講座と比べて、Pythonの解説もやや長くなっており、機械学習の基礎知識や可視化の方法など、より基礎的な内容にも触れられています。

技術も畳み込みニューラルネットワークといったディープラーニング技術ではなく、ロジスティック回帰や勾配ブースティングといった機械学習手法です。

ここで使用するLightGBMはデータ分析コンペでは非常に人気のある手法であり、実務でもよく使われています

講座内容より抜粋

AI機械学習の基本的なプログラミング方法を習得し、さらに目標に向けて自発的に踏み出せるようになる。

(省略)

機械学習による予測モデルの作成フローを理解し、自分で作成できる

自分に合ったKaggleのコンペを探し、参加できる

『Kaggleで始めるPython AI機械学習入門コース|高評価現役講師が丁寧にレクチャー』

『【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座』

【受講者数】 3417人
【レビュー数】 487件
【評価】4.3
【講師】ウマたん
【総時間】4時間14分

学習内容より抜粋
  • アニメーションで学ぶ統計学と機械学習の基礎
  • アニメーションで学ぶ各種手法の詳細
  • アニメーションで学ぶビジネスデータ分析の流れ
  • ハンズオンで学ぶデータ分析コンペの中古マンション売買データを題材にしたPython実践

アニメーションで学ぶとありますが、このコースはウマとYouTubeでよく見るイラストで説明があります。

その分非常にとっつきやすく、リラックスして受講できると思います。

Pythonの解説はありませんが、その分機械学習手法の解説が充実しています

中古マンション売買データを使って、特徴量の分析からLightGBMを使った価格予測モデルを行います。

講座内容より抜粋

このコースは、なかなか勉強する時間がないという方に向けてコンパクトに分かりやすく必要最低限の時間で重要なエッセンスを学び取れるように作成しています。

本コースはアニメーションを使った概要編とハンズオン形式で進む実践編に分かれています。

概要編では、データサイエンスの基礎やデータ分析の流れについて学びます。

データサイエンスの基礎について基本のキから学びつつ、なるべく堅苦しい説明は抜きにしてイメージを掴んでいきます。

(省略)

実践編ではデータコンペ(Nishika)のデータを題材にして、実際に手を動かしながら機械学習手法を実装していきます。

詳細はこちらをご確認ください。

『【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座』

なお、Udemyではなく“スタアカ”というデータサイエンティストに特化した講座を開講されています。

月額980円というかなり価格を抑えたライトプランや、98000円で買い切りで、手厚いサポートを受けることができるプレミアムプランがあり、こちらの講座を受講することでデータサイエンティストに必要な基礎知識を学ぶことができます。

詳細は以下にありますので、チェックしてみてください。

Webスクレイピング

自分でオリジナルの機械学習・AIのモデルを構築したい場合や業務でもデータ分析をする際に、データを集めてくる必要がある場合がよくあります。

ですのでデータサイエンティストにとって、Webスクレイピングを学んでおくことは非常に重要です。

『PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】』

【受講者数】 14754人
【レビュー数】2575件
【評価】4.2
【講師】今西 航平
【総時間】2時間41分

学習内容より抜粋
  • seleniumを用いてテキスト情報を抽出することができるようになります。
  • seleniumを用いて自動でログインすることができるようになります。
  • Webページからテキスト情報を取得することができるようになります。
  • Pillowを用いてPythonで画像を扱うことができるようになります。
  • ランキング形式のサイトからまとめて情報を収集することができるようになります。
  • Pandasを用いてデータを整理し、CSVへの掃き出しをできるようになります。

総時間2時間41分とかなり短めです。

Seleniumというライブラリを使って、自動的にログインする仕組みを作り、Webサイトをスクレイピングします。

Seleniumはブラウザを直接操作する方法なので、他のスクレイピング用のライブラリであるBeautifulSoupと比べて汎用性が非常に高いです。

テキストデータや画像データを実際に収集しながら学んでいきます。

講座内容より抜粋

Webスクレイピングとは、定期的な情報収集、大量の情報収集であれば、数行のコードを書くだけで自動で行ってくれる便利テクニックです。
このWebスクレイピング技術を用いることで、業務の効率化への第一歩を踏み出していきましょう。

詳細はこちらをご参照ください。

『PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】』

『Pythonによるビジネスに役立つWebスクレイピング(BeautifulSoup、Selenium、Requests)』

【受講者数】 4156人
【レビュー数】489件
【評価】4.3
【講師】清水 義孝
【総時間】9時間40分

学習内容より抜粋
  • Python3のスクレイピング用ライブラリBeautifulSoup、Selenium、Requests、Newspaper3k、Pandas(read_html)が扱えるようになります。
  • Beautiful Soupを用いて、複数のWebページを巡回し、目的の情報を取得する方法を理解することができます。
  • Seleniumを利用した、ログイン画面への対処、JavaScriptを用いた動的なサイトへの対処、画像を取得・ダウンロードする方法を理解することができます。
  • newspaper3kを用いて、ニュースサイトやブログのトップページに表示されている複数の記事を順に巡回し、記事や要約、キーワードをダウンロード・保存する方法を理解することができます。
  • Pandasのread_htmlを用いて、Webサイト上のテーブルに格納されているデータを取得する方法を理解することができます。
  • スクレイピングにおけるXPath、CSSセレクタ、正規表現の利用方法を学ぶことができます。
  • スクレイピングでデータを取得・抽出し、取得したデータを整形・グラフ化、保存する一連の流れを習得することができます。

総時間9時間40分と上記の講座よりだいぶ長くなっています。

その分、上記の講座がSeleniumだけだったのに対し、こちらはBeautifulSoupも扱います

私は基本的にBeautifulSoupをメインで使い、うまく取得できないサイトやページについてはSeleniumを使うので、これからスクレイピングを学ぶという方はこちらの方が良いかと思います。

講座内容より抜粋
  1. 様々なニーズや場面に応じて使い分けできるよう、Pythonのスクレイピングライブラリの中でも幅広いライブラリをカバーします。
    •    Beautiful Soup、Selenium、Requests、newspaper3k、Pandasのread_html
  2. ビジネスで活用するにおいて必要となる、スクレイピングにおける一連のプロセスをカバーします。
    •    データ取得・抽出から、整形、グラフ化、保存まで
  3. 特殊な技術が使われているWebサイトも考慮し、幅広いスキルを身につけれるよう、レクチャーを提供します。
    •    JavaScriptを用いた動的なサイトへの対処方法
    •    ログイン画面への対処方法
    •    リンクをたどり、複数のWebページを巡回する方法
    •    テキスト情報・画像ファイルの取得方法                                                                     など多数

詳細はこちらをご参照ください。

『Pythonによるビジネスに役立つWebスクレイピング(BeautifulSoup、Selenium、Requests)』

まとめ

今回はプロ・データサイエンティストになるためのUdemy講座ということで、データサイエンスを理解することができる人気の高い講座をご紹介しました。

本で勉強するというのもいいと思いますが、こういった講座を利用するとより効率よく学ぶことができると思いますので、皆さまも積極的に活用していただければと思います!

こちらではAI・機械学習を勉強するのにオススメの本を紹介していますので、あわせてご参考にしていただければと思います。

また以下の記事では、「独学は大変」という方向けにスクールの紹介をしていますので、こちらも参考にしていただければと思います。

では!

-学習, 本・勉強方法
-,