概要

本講義では、自然言語の構文解析器を実装するために必要な基礎技術を解説する。構文解析は、単語列を入力とし、その単語列の内部構造である構文木を出力する技術である。自然言語の構文木は一般に曖昧性があることから、多数の構文木候補の中から人間の解釈に合致する構文木をいかに高精度かつ高速に選び出すかが問題の本質である。したがって、構文解析はスコア付き木構造の最適解探索問題として定式化できる。この問題を解くための基礎として、形式文法、動的計画法、木構造の確率モデル、探索アルゴリズムについて詳述する。また、深層学習を利用した最近の構文解析手法と、構文解析に関する最近の研究動向を紹介する。