自然言語処理

AI・機械学習

13億パラメータ日本語GPT-2を使ってみる

2022年1月にrinna社が13億パラメータを持つGPT-2の日本語モデルを公開し話題になっています。 rinna社は2021年8月にGPT2-mediumという3億強のパラメータを持つモデルを公開していましたが、今回のGPT-1...
AI・機械学習

OpenAI 『GLIDE』を使ってみる

こちらの記事ではOpenAIのテキストから画像を生成する『GLIDE(GuidedLanguage toImageDiffusion for Generation andEditing)』を見てみました。 今回はその『G...
AI・機械学習

【論文解説】OpenAI 『GLIDE』を理解する

さて、以下の記事ではDiffusionモデルについて解説をしましたが、今回はそのDiffusionモデルを応用してDALL-Eのようにテキスト情報から画像を生成するモデル「GLIDE(Guided Language to Image Di...
AI・機械学習

【入門者向け】Perplexityを直観的に理解する

今回は、BERTやGPT3などの言語モデルを評価する際に一般的に利用されているperplexity(パープレキシティ)について解説したいと思います。 ここでは、厳密な説明というよりは直観的にわかりやすく、論文等を読んでいてぱっとイメ...
AI・機械学習

OpenAI GPT-3 APIの使い方を解説

2021年11月18日にOpenAIが「GPT-3」のウェイティングリストを解除すると発表しました。 これにより申請すれば誰でもGPT-3のAPIを使用できるようになります。 ということで、GPT-3のAPIについて実...
AI・機械学習

【論文を使って丁寧に解説】ドロップアウト(Dropout)を理解する

今回はバッチ正規化(Batch Normalization)に続き、ディープラーニングでは一般的となっているドロップアウト(Dropout)について解説したいと思います。 ドロップアウトはオーバーフィッティングを減らすことができる非...
AI・機械学習

ドラクエ画像でOpenAI 『CLIP』を使う

さて今回は、以前こちらの記事で紹介しているOpenAIの『CLIP』を使って遊んでみたいと思います。 ここでは、CLIPの詳細については全く触れないので、興味がある方は以下の記事を参考にしてください。 CLIP(C...
AI・機械学習

社会人がAIを学ぶためのスクールをご紹介

人工知能・AI・データサイエンスといったブームはまだ続いており、今後もホットかつ重要な分野となりそうです。 これらの分野を学ぶことは社内でのキャリアアップや転職、独立などにおいて非常に役立つことは間違いありません。 しかしなが...
AI・機械学習

【解説+実装】Sparsemax関数を理解する

今回は、テーブルデータの処理で良好な結果を残しているTabNetなどで使われているSparsemax関数について解説したいと思います。 Sparsemaxは複数ラベルのある分類問題に通常使われるSoftmax関数を変形したものです。...
AI・機械学習

【論文解説】DialoGPTを理解する

さて、今回はMicrosoftから提案されたDialoGPTを解説したいと思います。 とは言っても、モデル構造自体はOpenAIによるGPTの仕組みと変わりませんので、モデルの解説はほとんどありません。 ですので、DialoG...
タイトルとURLをコピーしました