画像認識

AI・機械学習

【論文解説】Sparse Transformerを理解する

さて、今回はOpenAIから提案された、attentionを効率化することで長い系列を取り扱うことを可能にしたSparse Transformerの論文について解説したいと思います。 この仕組みはGPT-3やDALL-Eなどでも使わ...
AI・機械学習

【論文解説】Image GPTを理解する

このサイトでは基本的に自然言語処理の論文等をご紹介してきましたが、今回はOpenAIが発表した画像生成モデル『Image GPT』の論文を解説したいと思います。 こちらはOpenAIの記事で紹介されている画像ですが、画像の上半分だけ...
AI・機械学習

活性化関数GELUを理解する

GELU(Gaussian Error Linear Units)は、OpenAI GPTやBERTで使われている活性化関数(activation)です。 BERTの論文で出てきても、「何かしらの活性化関数を使ってるんだなー」、とか...
タイトルとURLをコピーしました