生成言語学をこっそり学ぶ(その2)

では早速、

Peters,P.S, Ritchie,R.W. 『On the generative power of transformational Grammars』INFORMATION SCIENCES 6,49-83(1973)

に取り掛かろうと思います。この文献は、まあ40年前のものですのでまじめに読むというよりも、これを生成言語学の勉強のとっかかりにしようという意図です。念のためお断りですが、私は無論、生成文法の専門家でもなく、言語学についても正しいバックグランドがあるわけでもないですので、内容や解釈については素人のかってな思い込みが多分に含まれていると思われますのでご注意ください。もちろん誤りや誤解などをご指摘いただくのは大歓迎です。


歴史的に言うと生成文法チョムスキーの著作順に

  • 句構造文法(Syntactic Structures 1957)
  • 標準理論−変換文法(Aspects of the Theory of Syntax 1965)
  • GB理論(Lectures on Government and Binding 1981)
  • ミニマリストプログラム(The Minimalist Program 1995)

というような変遷を経ているわけですが、この論文は標準理論の初期にあたる Aspects of the Theory of Syntaxの内容を形式化しようとしているわけです。
まずはアブストラクトを訳してみます(あえて直訳気味)。独断による解説付けました...

句構造文法(PSG)の数学的モデルは、言語学者がこの文法の研究する際にたくさんの有用な結果を提供してきた。たとえばチョムスキーによる自己埋め込みを使った正規文法でない文脈自由文法の特徴づけがある。近年、言語理論においては変換文法へと関心が移行しているが、(PSGに対する数学モデルのような)変換に対する数学的技術の応用は伴ってはいない。

<解説>
句構造文法は数学的に結構調べられてるけど、変換文法はまだだったのでこの論文で数学的なモデルを作ったということを言いたいわけです。前半のチョムスキーうんぬんは、本論とはあんまり関係ないのですが、自己埋め込みとは句構造文法理論で、ある非終端記号Aから生成していって、ふたたびAを含むような形式が生じること、つまり

A\to^* \alpha A \beta

で、ここでいう特徴づけとは『自己埋込みを含まない文脈自由文法は正規文法』という定理です(文脈自由文法に対するチョムスキー標準形からなんとなく証明できそうです)。ここは実は正確に述べないといけないのですが、『自己埋め込みを含まない文脈自由文法の言語に対して、ある正規文法が存在して同じ言語を生成する』、つまり『自己埋め込みを含まない文脈自由文法に対して、弱生成力が同じ正規文法が存在する』ということです。弱生成力のみを問題にしている点に注意です。

本論文の目的は、文法的変換を解析木(あるいは同値だが、ラベル付けされたカッコを持つ形式)の上に定義された写像としてモデル化する一般的な定義により、そのような数学的技術を開発すること、そして、たとえば変換文法により生成された言語の再帰性といったような、現在の言語学上の関心ある問題を研究することにある。

<解説>
まだ論文の本文をちゃんと見てないので不正確かもしれませんが、現代の知識からいうところの標準理論の枠組み:


 句構造規則
   ↓ ← レキシコン
(深層構造)… 意味に結びつく
   ↓
 変換規則
   ↓
(表層構造)… 音声に結びつく


の形式化であると思います。ただ、70年代は、標準理論から拡大標準理論、修正拡大標準理論と変遷があるのですが、それは意味と結びつく解析木が深層構造から表層構造へとシフトしていくだけ(?)であるので、生成される言語(表層構造)だけを問題にしている本論文の根幹の部分は何も変わりません。

本研究の最初の結果は、言語学上の動機から変換文法には複雑な制約が課されているにもかかわらず、どんな再帰的可算な文字列の集合に対しても、それを生成する変換文法が存在する(定理5.1)ことである。
帰納的集合を生成できるという変換文法のこの力は、変換ルールを回数の制限なしに繰り返し適用できることの結果であることを示す(系6.6)。

<解説>
うわーこれですね、チョムスキーが『生成文法の企て』でダメ出ししてたのは。制限なしだと再帰的可算クラス(まあ、なんでもかんでも)の言語でもそれを生成できる変換文法が存在するというのは数学的には面白いのですが、言語理論としては理想的には自然言語だけを生成するようなものが欲しいわけで、ありがたくない結果になります。

ルールの繰り返しに制限を設けた変換文法での決定手続きの解析により、文法が許す繰り返しの総量と文法が生成する再帰集合の複雑さの関係が明らかになる;もし繰り返し回数が初等的再帰関数(あるいは原始再帰的関数、または \mathcal{E}^n\quad n>3に属する関数)で抑えられていたら、生成された言語の特性関数も同じクラスの関数である(系6.7)。
これらの結果の応用により、自然言語再帰的、実のところは原始再帰的に決定可能であるという考えの経験的な支持を得る。
我々の結果はまた、もし、変換文法理論が自然言語を正確に制限するという目的に到達しようとするなら、言語論的な動機によってさらに制限しなくてはならない一つの特徴を抽出するのである。

<解説>
まあ、ここはそれらしく訳しただけです。正確な内容は本文を解読してみないとなんともです。言語を再帰集合に制限するためにはどうする?というような議論のようですが、それでも広すぎる... 気になる 『一つの特徴』の中身ですが、7節によると変換規則による削除の能力に関するもののようで、これもチョムスキーが『生成文法の企て』で言及しています。