科学研究費助成金によるプロジェクト
歌ことばの歴史的変遷の特徴を解析するツール群とデータセットの開発
科学研究費助成金基盤研究(C)2023--2026
研究代表者:山元啓史(東京工業大学教授)
可視化モデル一覧[更新中]
- 研究種目: 基盤研究(C)(一般) 小区分02070: 日本語学関連
- 課題番号: 23K00545
- 研究題目: 歌ことばの歴史的変遷の特徴を解析するツール群とデータセットの開発
概要:
代表者は2007年に和歌用の形態素解析ツールを開発した。
その解析対象は八代集(およそ905年から1205年)に限定されていた。
本研究の大きな目的の一つは、
八代集から二十一代集にまで解析可能対象を拡大することであり、
その辞書を開発することである。
しかしながら、従来八代集解析で用いられていた最長一致法では、
すべての出力を確認しなければならないので膨大な作業を必要とする。
そこで、本研究では八代集の解析済みデータを用いて、
連接規則をコンピュータ処理によって獲得する。
その獲得した規則を二十一代集の解析処理に応用し、
二十一代集の品詞タグづけを行う。
その作業を通して、
二十一代集から獲得された連接規則から
和歌用語の語彙的結束性、
あるいは連接規則の理論化を試みる。
- スパコン(Tsubame)とCRF++による連接規則の学習
- 二十一代集歌ことば検索システム
- 可視化プログラム
- グラフモデル描画システム
科研費申請書
参考文献
関連データ
- 八代集辞書辞書
- 八代集解析済みデータ
- 国文学研究資料館編二十一代集データのうち八代集相当和歌解析済みデータ
- シソーラス(旧版分類語彙コード付きシソーラス)
- 品詞体系表
関連ツール
- 単位分割と品詞タグつけシステム
- シソーラスタグつけシステム
- graphviz dot language 生成と cw 計算システム
研究事例
- 古今集における春のモデル
日本語
英語
- 古今集における秋のモデル
日本語
英語
- 共出現バターンの作り方
- 分析単位
- 品詞体系
- 平安時代を分析するには奈良時代の単位を見直す。
- 本質的に必要な単位とは何か。
付録
- 八代集とは
- 二十一代集とは
- グラフモデルの特徴と注意点