Futrell & Mahowald (2025)について

この記事は, Futrell & Mahowald (2025) “How Linguistics Learned to Stop Worrying and Love the Language Models” (以下, F&M) の内容を自分なりに噛み砕いた結果と, それを踏まえた上で自分の研究について言えることを記したものになります。この論文が公開されたのが2025年5月末であること（それとLLM研究の更新の速さ・スピード感）を考えるともう少し早く書くべきだったのでしょうが, 読んだのが2026年3月ということでほぼ1年遅れです。とはいえ自分がLLMに強く関心を持ちつつも元々は言語学側の人間であることを考慮すれば, 遅すぎず早すぎずのちょうどいいタイミングなのかもしれません。

この記事を書く気になったきっかけは, ある研究者の方が書いたF&Mの書評です。書評の中でF&Mの主張をなかなか痛烈に批判していたのですが, その方の捉え方と自分の捉え方にかなり乖離がある気がして「本当にそうか?」「そういうことを言いたいんじゃないのでは?」と思うところがあったので, 備忘録的に自分の見解を示しておこうと思いました。研究をする上で1つの論文に対して各研究者が異なった捉え方をするなんていうのは日常茶飯事なので, どちらかの解釈が正しいか決めるといった解釈学のようなことをするつもりは毛頭ありません。ただ自分はこう感じた/考えたということを記すだけです。

自分について（この記事に関連することに限定）

学部生の頃は, 理論言語学に興味を惹かれいわゆる英語学のゼミで認知言語学・構文文法・生成文法など一通り「言語理論」と呼ばれているものに触れました。数多ある言語現象をそれぞれの理論の中でどのように分析するのか, またはそれらが「言語」をどのようなものと捉えようとしているかについてよく考えていました。卒論は生成文法の枠組みで書きました。この頃は漠然と「言語理論」は人間言語の理屈を捉えるためにある割にそれを担っている人間の脳や神経計算に関しては何も言わないんじゃないのとか思っていました。

その後, 修士に進んで, 理論言語学から徐々に心理言語学/計算言語学的なアプローチにも興味を持ち始めました。離散表現である/あろう言語とそれを処理する連続的なシステムがどのように関連しあっているのか, その関係を計算論的に捉えることはできるんだろうかという疑問をぼんやりと持つようになりました。その中で「言語」（に限らずですが）を処理・理解するシステムは, 人間言語に対して構築された理論体系のほかに複数存在しうるのではないかと思い始めました。ちょうど流行り始めでよく名前を耳にしたこともあり, おそらく人間の神経計算よりも容易に中身を検証することができるであろう言語モデルの内部機序にも興味を持つようになりました。

そのまま博士課程に進学し, 今に至ります。現在の研究分野を表すとすれば, 統語論・文処理・計算言語学をそれぞれ研究しつつ, いずれどこかでこれらを橋渡しするような大きな話ができればいいなと考えているという感じです。

なので, F&Mの話は大変面白く自分がずっと抱いていた問題意識を（全部ではないですが）ある程度明確に言語化してくれた感じがしました。自分が言語学出身であり, 今も形式言語学や心理言語学を研究している立場だからこそ, 彼らの言っていることを好意的に解釈しすぎている可能性はあります。一方で, 内容に関して懐疑的に思うところや理解しきれていないところもあったので, その点も正直に書き記しておこうと思います。

F&Mの言いたかったこと

彼らがこの論文で言いたかったことは以下のようなことだと個人的には読めました。

「言語理論」（論文中では”linguistic structure”と呼ばれていた）は, 「（必ずしも”人間の”とは限らない）言語的な振る舞い」に関するかなり抽象化された表示・規則の集合 (リアルパターン)であるので, 人間の言語理解であろうがLLMの言語理解であろうが, その特徴を含み込んで捉えることが可能である。
「言語理論」は神経計算を直接捉えるものではない。
言語モデルのニューラルネットワークが人間の脳神経構造に着想を得ている（完全に同じ・並行的とは言っていない）背景を踏まえると, 「言語理論」が人間の言語理解とLLMの言語理解を橋渡しするのに不必要だとは言い切れない（一方で, 絶対に必要・有用であるとも断言はできない）。
人間の言語的振る舞いの神経計算についてほとんど何もわかっていないことを踏まえると, 言語モデルの内部機序と言語理論がうまく接続されれば, 人間側の言語的振る舞いの神経計算について何か言えるかもしれない
このフレームに則った場合, 「言語理論」のあり方自体が「表現体系に関係なく雑多に押し込められる」という方向に再検討されるべきである

要は, ここで言っている“linguistic structure”というのは, あくまで「理論」であり, 抽象的な表示・規則体系なので, 直接神経計算で実装したり能力・知識獲得の過程で学んだりする対象ではないということだと思われます。このことは全くその通りだと思いますし, ある程度まともな理論言語学者なら誰でも心得ていると思います（一部そうでない人がいることも確かなので… 「たまにtree構造や演算子-変項関係のような表示が人間の脳に内臓されているのだ」みたいなことを言っている統語論研究者を見かけますが, ちょっとそれはどうなのかなと思ってしまいます）。Chomsky (1980) “Rules and Representations”で人間言語に関する統語理論は, 心的実在性 (psychological reality)の観点から「心内の認知構造（特に言語構造）についての仮説」と位置付けることを表明していることからも, 「理論」はひとまず神経計算/脳内実装については直接は何も言わない態度をとっていることが分かるかと思います。

*ここで言う「実在性」とは, 理論的に仮定される表示や規則そのものが物理的対象として存在するという意味ではなく, それらの理論が捉えようとしている構造的な情報が何らかの形で人間の心内に実装されていると仮定されるという意味で「実在」すると言っています。これもこれで難解な概念なので別で何か書いてみようかなと思っています。

言語モデル側の話で言うと, モデルが学習しているのは, あくまでパラメータの重みであり, 言語知識や表示・規則そのものではないと考えるわけです (論文で直接そう書かれていたわけではないので, あくまでそう理解すると本文に書いてあることが少なくとも私にとってはすんなり理解できた, ということですが)。

「言語理論」は, その学習が済んだ神経計算（人間か言語モデルかは問わない）の挙動を（少なくとも言語の科学的研究という範疇に落とし込みたいのであれば）人間に理解できる形で抽象化した結果物だと捉えられるでしょうと言っているのではないかと思います。

ただ「理論」として抽象化できるということは, それと等価の「情報量」を何らかの形で神経計算できているということになって欲しいので, そこを解釈できるように接続してやらないと言語に関する科学研究としては何もわかったことにならないぞ, ということです。