=begin = 構文解析実習レポート 総合政策学部2年 酒井政裕 学籍番号: 70103970 == 和文課題 文法は問1,問2で共通のものを使った。 文法の記述については、文脈自由文法を書くことには慣れていたので、ほとん ど何も考えずに出来たが、品詞名など日本語の文法概念についての知識が無かっ たために、その辺りで苦労し、結局満足のいくような構成の文法を書くことが 出来なかった。やはり、美しい文法を書くことは難しい。 用言の語幹と語尾を分けて扱うことも検討したが、今回の実験の本質には関係 ないと考えたため、今回は文法の簡易化のためにあえて行わなかった。 === 文法 (文 ((連用句 t) (文 t)) nil) (文 ((時の名詞 t) (文 t)) nil) (文 ((用言 t)) nil) (連用句 ((体言 t) (連用助詞 t)) nil) (連用句 ((用言 t) (連用助詞 t)) nil) (連体句 ((体言 t) (連体助詞 t)) nil) (体言 ((連体句 t) (体言 t)) nil) (体言 ((用言 t) (体言 t)) nil) (体言 ((名詞 t)) nil) (名詞 ((固有名詞 t)) nil) === 問題1 酒井政裕はきょうかいに行く。 ==== 辞書 (酒井政裕 固有名詞 nil nil) (きょうかい 名詞 nil nil) (きょう 時の名詞 nil nil) (は 連用助詞 nil nil) (に 連用助詞 nil nil) (かい 用言 nil nil) (行く 用言 nil nil) ==== 実行結果 enter sentence ==> 酒井政裕はきょうかいに行く。^ 2 tree |-*TOP* |-文 | |-連用句 | | |-名詞句 | | | |-名詞 | | | |-固有名詞---酒井政裕 | | | | | |-連用助詞---は | | | |-文 | |-時の名詞---きょう | |-文 | |-連用句 | | |-用言---かい | | |-連用助詞---に | | | |-文 | |-用言---行く | |-END---。 semantic analysis start?(y/n) ===>more(y/n) ===>y |-*TOP* |-文 | |-連用句 | | |-名詞句 | | | |-名詞 | | | |-固有名詞---酒井政裕 | | | | | |-連用助詞---は | | | |-文 | |-連用句 | | |-名詞句 | | | |-名詞---きょうかい | | | | | |-連用助詞---に | | | |-文 | |-用言---行く | |-END---。 ==== 考察 最初のツリーでは「きょうかいに」の部分が「時の名詞 + 用言 + 連用助詞」 としてパーズされているのに対して、後者のツリーでは「名詞 + 連用助詞」 とパーズされている。 ここから、この文が形態素解析レベルでの曖昧さを持っている事が読み取れる。 また、日本語では時の名詞が文中に表れることは少ないので、後者の解析木が 最初に出てくるのが望ましいと考えられるが、文法を書き換えることでそれが 実現できるのかどうかについては分からなかった。 === 問題2 白い犬の子が生まれる。 ==== 辞書 (生まれる 用言 nil nil) (白い 用言 nil nil) (犬 名詞 nil nil) (子 名詞 nil nil) (の 連体助詞 nil nil) (が 連用助詞 nil nil) ==== 実行結果 enter sentence ==> 白い犬の子が生まれる。^ 2 tree |-*TOP* |-文 | |-連用句 | | |-体言 | | | |-連体句 | | | | |-体言 | | | | | |-用言---白い | | | | | |-体言 | | | | | |-名詞---犬 | | | | | | | | | |-連体助詞---の | | | | | | | |-体言 | | | |-名詞---子 | | | | | |-連用助詞---が | | | |-文 | |-用言---生まれる | |-END---。 semantic analysis start?(y/n) ===>more(y/n) ===>y |-*TOP* |-文 | |-連用句 | | |-体言 | | | |-用言---白い | | | |-体言 | | | |-連体句 | | | | |-体言 | | | | | |-名詞---犬 | | | | | | | | | |-連体助詞---の | | | | | | | |-体言 | | | |-名詞---子 | | | | | |-連用助詞---が | | | |-文 | |-用言---生まれる | |-END---。 ==== 考察 この2つのツリーの違いは単に形容詞「白い」の修飾しているのが、「犬」で あるか、「犬の子」であるかだけである。 したがって、この文の曖昧性は問1とは別種の曖昧性であり、ウィノグラドが 示した4種の文脈曖昧性のうちの「構造曖昧性」にあたると考えられる。 また、句構造文法で日本語文の解析木は一般に左下がりになるといわれるが、 この文の解析木は下部に比べて上部が深くなっており、(特にはじめの木は) 非常に典型的な例と言える。 == 感想 今回の実験で、自然言語のパーズは人工言語のそれと比べて、 曖昧な部分や例外が多くて難しいが、工夫しがいのある分野であると感じた。 また、今回は句構造文法を使った実験だったが、Link Grammer 等の 他の文法体系が自然言語をどのように扱うかについても興味を感じた。 == 参考文献 (1) 『自然言語処理』 石崎俊 著 (2) 『言語理論とオートマトン』 J.E.ホップクロフト/J.D.ウルマン 共著 野崎昭弘 木村泉 共訳 (3) Link Grammer (()) =end