マ シケン   MA TZU-HSUAN
  麻 子軒
   所属   京都外国語大学  外国語学部 日本語学科
   職種   講師
言語種別 日本語
発行・発表の年月 2022/08
形態種別 論文
標題 『日本語話題別会話コーパス:J-TOCC語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討
執筆形態 共著
掲載誌名 言語資源ワークショップ2022発表論文集
掲載区分国内
巻・号・頁 53-58頁
著者・共著者 ◎中俣 尚己, 麻 子軒
概要 『日本語会話話題別コーパス:J-TOCC』の語彙表を公開した。15ある話題間での特徴度を比較するための粗頻度ならびにLLRの表と、各話題ごとに、240名の調査協力者がそれぞれ何度その語を使用したかというデータを収めた表である。語の使用者の幅を見る指標としてはtf-idfなども存在するが、検討の結果、本データでは使用総頻度の影響が大きすぎることがわかった。一方で、LLRは語の特徴語を効率よく抽出できるが、多義語など、他の話題の影響で値が低くなることもある。使用者割合はその点をカバーすることができる。