AI・機械学習

AI・機械学習

【論文解説】Sparse Transformerを理解する

さて、今回はOpenAIから提案された、attentionを効率化することで長い系列を取り扱うことを可能にしたSparse Transformerの論文について解説したいと思います。 この仕組みはGPT-3やDALL-Eなどでも使わ...
AI・機械学習

【論文解説】Image GPTを理解する

このサイトでは基本的に自然言語処理の論文等をご紹介してきましたが、今回はOpenAIが発表した画像生成モデル『Image GPT』の論文を解説したいと思います。 こちらはOpenAIの記事で紹介されている画像ですが、画像の上半分だけ...
AI・機械学習

【論文解説】ELECTRAを理解する

今回は自然言語処理のブレイクスルーとなったBERTの事前学習方法を改良し、GeneratorとDiscriminatorを使った事前学習することで、BERTを大きく上回る精度を出したELECTRAの解説をしたいと思います。 ELEC...
AI・機械学習

ビームサーチ(Beam Search)を理解する

今回は、文章生成やSeq2Seqモデルを使った機械翻訳などでよく使われるビームサーチ(Beam Search)について解説したいと思います。 より理解しやすくするために、以下の3つを手法を順番に説明していきます。 Greedy...
AI・機械学習

【論文解説】Longformerを理解する

では、今回は『Longformer: The Long-Document Transformer』について解説したいと思います。 LongformerもReformerやSparse Transformerと同じで、self-att...
AI・機械学習

【論文解説】OpenAI 「GPT-3」を理解する

今回は、LINEによる汎用的な超巨大言語モデルの開発の話題もあり、GPT-2以上に話題になっているOpenAI GPT-3について解説したいと思います。 結構長い論文ですが、論文の最後の方の内容も非常に興味深い内容になっている論文で...
AI・機械学習

条件付き確率場(Conditional Random Fields; CRF)を使った品詞タグ付け

今回は“条件付き確率場(Conditional Random Fields; CRF)”を使った品詞タグ付けについて解説したいと思います。 条件付き確率場は、例えば単語列xが与えられたときに、品詞ラベル列yなどの系列を予測するための...
AI・機械学習

固有表現抽出におけるビタビアルゴリズムを理解する

今回は、固有表現抽出などの系列ラベリングを行う上で、重要なアルゴリズムである“ビタビアルゴリズム(Viterbi Algorithm)”を解説したいと思います。 まず、各単語について固有表現かどうかをどのように予測するか、については...
AI・機械学習

【論文解説】OpenAI 「GPT-2」を理解する

さて、今回は以前ご紹介したOpenAI GPTの進化版OpenAI GPT2を解説したいと思います。 現時点ではすでにOpenAI GPT-3が開発されていますが、まずはOpenAI GPT-2を理解していきたいと思います。 ...
AI・機械学習

品詞タグ付け(part-of-speech tagging)を理解する – ビタビアルゴリズム

『品詞タグ付け(part-of-speech tagging)を理解する』では、隠れマルコフモデルを使って、単語列xが与えられたときに品詞ラベル列がyとなる確率の求め方を解説しました。 まだ、このままでは各単語列と品詞ラベル...
タイトルとURLをコピーしました