AI・機械学習

AI・機械学習

【論文解説】Longformerを理解する

では、今回は『Longformer: The Long-Document Transformer』について解説したいと思います。 LongformerもReformerやSparse Transformerと同じで、self-att...
AI・機械学習

【論文解説】OpenAI 「GPT-3」を理解する

今回は、LINEによる汎用的な超巨大言語モデルの開発の話題もあり、GPT-2以上に話題になっているOpenAI GPT-3について解説したいと思います。 結構長い論文ですが、論文の最後の方の内容も非常に興味深い内容になっている論文で...
AI・機械学習

条件付き確率場(Conditional Random Fields; CRF)を使った品詞タグ付け

今回は“条件付き確率場(Conditional Random Fields; CRF)”を使った品詞タグ付けについて解説したいと思います。 条件付き確率場は、例えば単語列xが与えられたときに、品詞ラベル列yなどの系列を予測するための...
AI・機械学習

固有表現抽出におけるビタビアルゴリズムを理解する

今回は、固有表現抽出などの系列ラベリングを行う上で、重要なアルゴリズムである“ビタビアルゴリズム(Viterbi Algorithm)”を解説したいと思います。 まず、各単語について固有表現かどうかをどのように予測するか、については...
AI・機械学習

【論文解説】OpenAI 「GPT-2」を理解する

さて、今回は以前ご紹介したOpenAI GPTの進化版OpenAI GPT2を解説したいと思います。 現時点ではすでにOpenAI GPT-3が開発されていますが、まずはOpenAI GPT-2を理解していきたいと思います。 ...
AI・機械学習

品詞タグ付け(part-of-speech tagging)を理解する – ビタビアルゴリズム

『品詞タグ付け(part-of-speech tagging)を理解する』では、隠れマルコフモデルを使って、単語列xが与えられたときに品詞ラベル列がyとなる確率の求め方を解説しました。 まだ、このままでは各単語列と品詞ラベル...
AI・機械学習

【論文解説】Don’t Stop Pretraining – 追加で事前学習を行う効果について

今回は、RoBERTaを使って、さらなる事前学習することによる効果を分析している“Don't Stop Pretraining: Adapt Language Models to Domain and Tasks”という論文を解説したいと...
AI・機械学習

【論文解説】DistilBERTを理解する

今回は、BERTをDitillation(蒸留)という手法を使って軽量化したDistilBERTについて、こちらの原論文をもとに解説したいと思います。 DistilBERTとは DistilBERT(a Distill...
AI・機械学習

【入門者向け】自然言語処理(Natural Language Processing; NLP)とは

今回は自然言語処理の概要を解説したいと思います。 自然言語処理とはそもそも何か?、どういったことができるのか?、どんな課題があるのか?ということを中心に見ていきたいと思います。 本を読んでしっかりと勉強したいという方は、こちら...
AI・機械学習

活性化関数GELUを理解する

GELU(Gaussian Error Linear Units)は、OpenAI GPTやBERTで使われている活性化関数(activation)です。 BERTの論文で出てきても、「何かしらの活性化関数を使ってるんだなー」、とか...
タイトルとURLをコピーしました