画像認識

AI・機械学習

社会人がAIを学ぶためのスクールをご紹介

人工知能・AI・データサイエンスといったブームはまだ続いており、今後もホットかつ重要な分野となりそうです。 これらの分野を学ぶことは社内でのキャリアアップや転職、独立などにおいて非常に役立つことは間違いありません。 しかしなが...
学習

【Cousera講座レビュー】DeepLearning.ai『Generative Adversarial Networks(GANs)』

今まで手付かずでしたがすごく興味があったGANを学びたいと思い、1ヵ月間Couseraの『Generative Adversarial Networks(GANs)』講座を受けましたので、その内容と感想を紹介したいと思います。 ...
AI・機械学習

【解説+実装】Sparsemax関数を理解する

今回は、テーブルデータの処理で良好な結果を残しているTabNetなどで使われているSparsemax関数について解説したいと思います。 Sparsemaxは複数ラベルのある分類問題に通常使われるSoftmax関数を変形したものです。...
AI・機械学習

【論文解説】OpenAI 『DALL-E』を理解する

さてさて、以前OpenAIの『DALL-E』のブログをもとに、モデルを想像しながら解説しましたが、もう既に論文が出ていますので、今回はきちんと論文に沿って解説をしていきたいと思います。 『DALL-E』は文章を与えると、...
AI・機械学習

【論文解説+Tensorflowで実装】VQ-VAEを理解する

今回は、VQ-VAE(Vector Quantised-Variational AutoEncoder)を解説したいと思います。 VQ-VAEもVAE(Variational AutoEncoder)と同じで潜在変数を使った画像など...
AI・機械学習

【Tensorflowによる実装付き】Variational Auto-Encoder(VAE)を理解する

今回は、2014年に提案された画像生成モデル“Variational Auto-Encoder(VAE)”について解説していきたいと思います。 まず、通常のオート・エンコーダと言えば、画像などの観測値を低次元の特徴量ベクトルに圧縮す...
AI・機械学習

Gumbel-Max Trick(ガンベル最大トリック)を理解する

さて、今回はカテゴリカル分布から効率的にサンプリングする方法であるGumbel-Max Trick(ガンベル最大トリック)について解説したいと思います。 Gumbel-Max Trickを使うと、Deep Learningなどでよく...
AI・機械学習

【論文解説】自然言語処理と画像処理の融合 – OpenAI 『CLIP』を理解する

今回はOpenAIの『CLIP(Contrastive Language-Image Pre-training)』を解説したいと思います。 CLIPは画像の分類に利用されるモデルですが、今までのモデルと何が違うかというと、自然言語処...
AI・機械学習

文章から画像を生成するOpenAI 「DALL-E」について解説

2021年1月5日にOpenAIのサイトに「DALL·E: Creating Images from Text」という記事が公開されました。 OpenAIは最近、自然言語処理技術を使って非常に自然なニュースを生成することができるGP...
AI・機械学習

【論文解説】Sparse Transformerを理解する

さて、今回はOpenAIから提案された、attentionを効率化することで長い系列を取り扱うことを可能にしたSparse Transformerの論文について解説したいと思います。 この仕組みはGPT-3やDALL-Eなどでも使わ...
タイトルとURLをコピーしました