投稿

5月, 2020の投稿を表示しています

漢字歌詞クイズのヒント機能をTFIDFで作った

イメージ
こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 今回は、コロナによる外出自粛で暇なので休日に開発が進んでいる漢字歌詞クイズアプリに追加した新機能について書いてみようと思います。 ここまではあまり工夫した点もなく実装できていたのですが、今回つけたヒント機能は少し凝った(データサイエンスっぽい?)ことをしたので、せっかくなので記事にします。 ### 漢字歌詞クイズって? 趣味で開発しているTwitter BotとWebアプリです。 漢字のみで書かれた歌詞からタイトルを当てる、というクイズです。 記事執筆時点では、Twitterは問題のみ掲載、Webアプリでは四択形式で答えあわせあり、といった形式になっています。 [Webアプリ版](https://kanji-lyric.herokuapp.com/quiz) [Twitter Bot](https://twitter.com/kanji_lyric) 最初はTwitter Botとして運用を始め、しばらく運用していましたが、せっかくHerokuを使っているのでWebアプリの方もプランを変えずに同時に公開できるじゃんと思い、Web版も作り、今に至ります。 ### 新機能開発の背景 Webアプリ版を公開して、友人などにお試しで使ってもらって、いくつかフィードバックをもらったのですが、方々から **そもそも問題が難しすぎる** という意見をいただきました。 そもそもTwitter Botの方はアーテイストのコアなファンが多いので、そのような意見があまり出てこなかったのですが、一般には難しいのだな、という認識に変わりました。 そこからは、今回の記事では書かないですが、難易度を選べる機能をつけたりなど「いかに解きやすくするか」に焦点を当てて改善してきています。 今回つけた新機能であるヒント機能も、問題の難易度を下げる工夫の一つです。 ### 新機能 : ヒント機能 百聞は一見にしかず、ということでこんなかんじです。 RADWIMPSのEasyモードで試してみましょう。RADWIMPSの曲を幾つか知ってる方はわかるかな? (そういえばRAD、サブスク解禁し…

【論文紹介】Learning a Deep ConvNet for Multi-label Classification with Partial Labels (CVPR 2019)

イメージ
こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 今回は、マルチラベル画像分類において、全ての画像に対し部分的にのみラベルが得られるという問題設定を扱う論文を読んだので、まとめていきたいと思います。 ### 論文リンク [[1902.09720] Learning a Deep ConvNet for Multi-label Classification with Partial Labels](https://arxiv.org/abs/1902.09720) ちなみに、本体は11ページなのに全体で30ページあるappendixもりもり論文で、自分は本体のみ読んだのでappendixは興味を持たれた方に読んでいただければと思います。 ### 3行まとめ Multi-label Classificationタスクにおいて、全ての画像に対し部分的にラベルが得られるという問題設定を扱う手法を提案した。得られているラベルの割合の情報を考慮した損失Partial BCEの提案、ラベルのクラス間の関係を扱うためにGNNを利用、未知のラベルを予測し学習に用いるカリキュラム学習の利用などを行っている。 ### 問題設定 Multi-label Classificationは、その名の通りラベルが複数ある分類問題です。 多くの研究では画像に対して考えており、画像に対して複数のタグがつくと想定していて、タグの個数も画像によって変わります。 今回は、このMulti-label Classificationの問題に対し、Partial labelな設定を追加しています。 通常のMulti-label Classificationではデータセットとしてラベルの情報は全て与えられる状況を想定しています。 例えば、画像に対して、tag猫 = 1, tag 車= -1といったものが全てのタグ分与えられる、という状況です。 一方Partial labelというのは、画像に与えられるラベルが+1と-1のほかに、0(unknown)もある、という状況です。 未知であるラベルの種類の個数は画像によって変わります。 このような部分的にラベル…

【論文紹介】Improving Pairwise Ranking for Multi-label Image Classification (CVPR 2017)

イメージ
こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 今回は画像に複数のラベルを予測するMulti label image classificationを扱った論文を読んだので、まとめます。 ### 3行まとめ Multi label image classificationを扱った論文。 損失関数log-sum-exp pairwise (LSEP) lossを提案し、 ランキングをだしてから、実際に上位のどこまで予測に入れるかを扱うlabel decision moduleを提案した。 論文リンクはこちら。 [[1704.03135] Improving Pairwise Ranking for Multi-label Image Classification](https://arxiv.org/abs/1704.03135) ### Multi label image classification ある画像に対して、対応するタグが複数あり、そのタグを予測するタスクを解きたい。 対応するタグは画像によって個数が異なる状況を考えている。 ランキング学習の手法を用いて解く研究では、まずタグのランキングを予測し、その後上位いくつかを最終的な予測に含める、といった手法が主流そう。 論文中ではこちらの図のようにまとめられている。 <div class="separator" style="clear: both; text-align: center;"><a href="https://3.bp.blogspot.com/-ATvxjWXRgsA/Xq4uYnW_NwI/AAAAAAAAEYk/d53WDBST1dwuC_PlpXaL9W1Ys-v891jLACLcBGAsYHQ/s1600/%25E3%2582%25B9%25E3%2582%25AF%25E3%2583%25AA%25E3%2583%25BC%25E3%2583%25B3%25E3%2582%25B7%25E3%2583%25A7%25E3%2583%2583%25E3%2583%…