マ シケン
MA TZU-HSUAN
麻 子軒 所属 京都外国語大学 外国語学部 日本語学科 職種 講師 |
|
言語種別 | 日本語 |
発行・発表の年月 | 2022/08 |
形態種別 | 論文 |
標題 | 『日本語話題別会話コーパス:J-TOCC語彙表』の公開と日本語教育むけ情報サイトにむけた指標の検討 |
執筆形態 | 共著 |
掲載誌名 | 言語資源ワークショップ2022発表論文集 |
掲載区分 | 国内 |
巻・号・頁 | 53-58頁 |
著者・共著者 | ◎中俣 尚己, 麻 子軒 |
概要 | 『日本語会話話題別コーパス:J-TOCC』の語彙表を公開した。15ある話題間での特徴度を比較するための粗頻度ならびにLLRの表と、各話題ごとに、240名の調査協力者がそれぞれ何度その語を使用したかというデータを収めた表である。語の使用者の幅を見る指標としてはtf-idfなども存在するが、検討の結果、本データでは使用総頻度の影響が大きすぎることがわかった。一方で、LLRは語の特徴語を効率よく抽出できるが、多義語など、他の話題の影響で値が低くなることもある。使用者割合はその点をカバーすることができる。 |