マ シケン   MA TZU-HSUAN
  麻 子軒
   所属   京都外国語大学  外国語学部 日本語学科
   職種   講師
言語種別 日本語
発行・発表の年月 2024/03
形態種別 論文
査読 査読あり
標題 LDAを使った専門用語の教師なしクラスタリング
執筆形態 共著
掲載誌名 言語処理学会 第30回年次大会 発表論文集
掲載区分国内
巻・号・頁 2858-2863頁
著者・共著者 ◎黒田 航, 相良 かおる, 東条 佳奈, 麻 子軒, 西嶋 佑太郎, 山崎 誠
概要 医療、(政治)経済、法律、出版の4分野の用語の、LatentDirichetAllocation(LDA)を使った教師なしクラスタリングの実用性を検討した。単語をdocumentとし、文字の(不)連続n-gram(n<4)をtermとしてLDAを実行した。結果から判った事は2つある。小さなtopic数で用語を分野別に分ける課題が実現できる。大きなtopic数では語構成パターンの分類が可能になる。