マ シケン
MA TZU-HSUAN
麻 子軒 所属 京都外国語大学 外国語学部 日本語学科 職種 講師 |
|
言語種別 | 日本語 |
発行・発表の年月 | 2024/03 |
形態種別 | 論文 |
査読 | 査読あり |
標題 | LDAを使った専門用語の教師なしクラスタリング |
執筆形態 | 共著 |
掲載誌名 | 言語処理学会 第30回年次大会 発表論文集 |
掲載区分 | 国内 |
巻・号・頁 | 2858-2863頁 |
著者・共著者 | ◎黒田 航, 相良 かおる, 東条 佳奈, 麻 子軒, 西嶋 佑太郎, 山崎 誠 |
概要 | 医療、(政治)経済、法律、出版の4分野の用語の、LatentDirichetAllocation(LDA)を使った教師なしクラスタリングの実用性を検討した。単語をdocumentとし、文字の(不)連続n-gram(n<4)をtermとしてLDAを実行した。結果から判った事は2つある。小さなtopic数で用語を分野別に分ける課題が実現できる。大きなtopic数では語構成パターンの分類が可能になる。 |