NLP2018 にスポンサーとして参加してきました

機械学習エンジニアの @hurutoriya です。

2018年 3月12日(月)- 3月16日(金)に岡山で開催された 言語処理学会第24回年次大会(NLP2018) にプラチナスポンサーとして参加してきました。

メンバーは

の3人での参加です。

今回は過去最多である、1000人近くの参加があり自然言語処理学会の盛り上がりを感じました。

f:id:hurutoriya:20180323155131p:plain

こちらがスポンサー展示で使用したポスターになります。

f:id:hurutoriya:20180323170209p:plain

ポスターでも触れていますが、メルカリでは出品時にお客さまが商品に情報を付与するシステムになっているので、アノテーション済のデータセットが日々増加しており、自社のデータにたいして機械学習を適用しやすい環境が整っています。

スポンサー展示では、数多くの人にメルカリ内の自然言語処理・機械学習の取り組みをお話しさせていただきました。

f:id:hurutoriya:20180323164425p:plain

個人的に面白かった研究3選

今回、全ての研究発表を見て回ることはできなかったのですが、個人的に面白いと感じた研究を紹介させていただきます。

C4-5 読解による解答可能性を付与した質問応答データセットの構築 ○鈴木正敏, 松田耕史 (東北大), 岡崎直観 (東工大), 乾健太郎 (東北大/理研AIP) link

読解タスクを考える際に問題設定として、必ず答えが存在している前提で考えられているものが多いです。
しかし実応用では、質問に対する正解文書が存在するとは限らないので存在しない場合には「読解不可能」という出力可能なモデルを想定した着眼点が面白かったです。
データセットも公開されているので、非常によい取り組みだと思いました。

C5-4 自然言語処理における解釈可能な敵対的摂動の学習 ○佐藤元紀 (NAIST), 鈴木潤 (NTT), 進藤裕之, 松本裕治 (NAIST) link

自然言語処理における敵対的学習の解釈の難しさは、単語ベクトル空間上に存在する単語ベクトルがスパースにしか存在しない事に起因しています。
この発表は敵対的摂動を加える際に単語が存在する方向に対して限定することで解決しており、摂動の可視化や摂動後の疑似データを人間が解釈可能な形で確認できる点が面白かったです。
敵対的学習もComputer Vision分野でアツい分野なのですが、自然言語処理に適用してその結果が解釈可能な形で可視化されているのが面白かったです。

P7-13 共起性を利用した物体認識における言語情報の有効性 ○黒澤郁音, 菊池康太郎, 小林哲則, 林良彦 (早大) link

物体検出の精度を向上させるために、言語特徴量を用いて物体間の共起性を利用した研究です。
物体の共起性とは、例えば車と信号テーブルと椅子のように同一画像内にいくつかの物体が共起しやすい性質の事を指します。
私の視点だと画像の特徴量のみを使って物体検出の精度の向上を考えがちですが、マルチモーダルなアプローチとして言語特徴量の共起性を使うことで検出精度を高めるアプローチは面白かったです。

感想

私は自身の専門分野がComputer Visionなので、自然言語処理系の学会に参加するのは今回が初体験になりました。
口頭発表やポスター発表でも、NLP独特の問題やComputerVisonで効果的だった手法がNLPで使われているなど、とても勉強になりました。

今回のスポンサー展示で、メルカリで行っている自然言語処理の取り組みが社外に伝わっていないと感じたため、これから積極的にメルカリにおける自然言語処理の取り組みを公開していきます。

また、来年のNLP2019では、スポンサー展示だけではなくメルカリの自然言語処理の取り組みを発表していきたいと考えています。

さいごに

NLP2018の開催にご尽力いただいた大会委員、その他関係者の皆様に感謝します。

また、メルカリでは、自然言語処理の技術を大量のデータに対して活用しサービスを改善することができるエンジニアを積極的に募集しておりますので、ご興味ありましたらご連絡ください。

Software Engineer, Machine Learning/Natural Language Processing

関連記事

tech.mercari.com

tech.mercari.com

  • X
  • Facebook
  • linkedin
  • このエントリーをはてなブックマークに追加