2014年7月19日土曜日

県別大学進学率の規定要因

 昨年の9月12日の記事では,都道府県別の大学進学率を出したのですが,この記事を見てくださる方が多いようです。地方出身の方(私もそう)にすれば,日頃の実感が数値化された,ということでしょうか。

 また,各県の進学率は県民所得と非常に強く相関していることも知りました。大学進学率の都道府県差は,生徒個々人の意向や能力の差ではなく,外的な条件の違いに由来する教育機会の不平等の表れであることもうかがえます。わが国の大学の高学費・都市部偏在を思うと,さもありなんです。

 ところで,各県の大学進学率と強く関連しているのは,県民所得のような経済指標だけではありません。今回は,他のメジャーな要因をも考慮した分析をしてみようと思います。

 私は,47都道府県の大学進学率の要因として,県民所得の他に2つを考えました。高学歴人口率と大学収容力です。地域に大卒人口が多いことは,子どもの進学をプッシュするクライメイト要因になるでしょう。また地元に大学があることは,自宅からの進学が容易になるなど,費用負担の緩和にもなるでしょう。こんな見方です。

 ①県民所得は経済要因,②高学歴人口率は文化要因,③大学収容力は地理要因,と考えていただければよいと思います。ごく単純なフレームですが,この3要因だけで,大学進学率の県間分散の大方を説明できるのも事実です。

 ②と③について,計算の方法を説明します。高学歴人口率は,各県の学卒人口のうち,大学ないしは大学院を出た者がどれほどいるかです。資料は,2010年の『国勢調査』。県別にみると,最高の25.1%(東京)から最低の9.1%(青森)までのレインヂがあります。

 大学収容力は,各県の18歳人口に対し,大学入学枠のイスがどれほど用意されているかを表す指標です。計算式は,<県内の大学への入学者数/推定18歳人口>なり。分母は,3年前の中学校・中等教育学校前期課程卒業者を充てます。資料は,文科省『学校基本調査』。県間のレインヂは,138.5%(京都)から15.5%(和歌山)と甚だ大きくなっています。

 被説明変数である大学進学率と,3つの説明変数の県別一覧表を掲げます。いずれも,現時点で得ることのできる最新の数値です。県民所得は住民一人当たりの額であり,『日本統計年鑑2014』に掲載されていたものを使っています。

 大学進学率の計算方法は,お手数ですが,昨年の9月12日の記事をご参照ください。18歳人口ベースの浪人込みの進学率です。


 前の記事でも触れましたが,2013年春の大学進学率は,最高の東京(71.3%)と最低の岩手(33.9%)では倍以上も違います。同じ日本かと思うほどのすさまじい格差ですね。

 さて,このような地域差を説明する要因指標を3つ用意したのですが,大学進学率との単相関係数を出すと,県民所得は+0.759,高学歴人口率は+0.881,大学収容力は+0.797となります。ほう。費用負担能力(所得)よりも,地域に大卒者がどれほどいるかというクライメイトの効果が大きいのですね。まあ,個々の家庭でも,大卒の親のほうが進学に理解があるでしょうし。

 しかるに,上記の3要因は互いに強く相関しています。3つの要因との単相関を個々バラバラにみるのではなく,これらを同時に取り込み,各要因の独自の規定力を取り出す作業をしてみましょう。そのための分析手法として知られているのが,いわゆる重回帰分析です。

 重回帰分析とは,複数の説明変数から被説明変数を求める計算式をつくるものです。県民所得をA,高学歴人口率をB,大学収容力をCとすると,各県の大学進学率を最も高い精度で予測する式は以下のようになります。

 大学進学率=0.0054A+1.0251B+0.0878C+11.8792

 この式から各県の大学進学率の予測値を出し,上表の実測値と照合してみましょう。横軸に予測値,縦軸に実測値をとった座標上に,47都道府県を位置づけると下図のようになります。


 実線の斜線は均等線ですが,多くの県がこの線の近辺に収束しています。上下の点斜線は±5%の線ですが,43の県がこの範囲内に収まっています。先ほどの予測式の精度はかなり高いとみてよいでしょう。

 つまるところ,所得,高学歴率,および収容力の3要因が分かれば,各県の大学進学率をほぼ正確に予測できる,ということです。ちなみに,重回帰分析の精度は決定係数という指標で測られますが,今回の値は0.8712にもなります。大学進学率の都道府県分散の87%が,上記の3要因だけで説明されることを示唆します。

 さて,大学進学率に対する各要因の(独自の)規定度は,上記の予測式の係数で表されますが,3要因の単位を考慮した標準化が必要になります。詳細は省きますが,標準化された係数は,県民所得が0.2508,高学歴人口率が0.5124,大学収容力が0.2879です。これが標準化偏回帰係数(β値)であり,被説明変数に対する独自の規定力を表します。

 算出されたβ値をみると,高学歴人口率が最も高いですね。単相関でみた場合よりも,この要因の優位性が際立っています。やっぱ,経済要因や地理要因よりも,こういう文化的要因の影響が大きいのだなあ。たとえ貧しくとも,大卒の親は無理をしてでも子を大学にやるみたいな・・・。

 なお,男子と女子で分けてみると,大学進学率の要因構造はちょっと違っています。男子の進学率,女子の進学率を別個に被説明変数に立て,3要因による重回帰分析をしてみました。下の図は,算出されたβ値を図示したものです。


 所得の規定力はほぼ同じですが,高学歴人口率のそれは「男子>女子」です。男子の場合,進学に理解のある(高学歴)の親は,無理をしてでも進学させる。こういうことでしょうか。

 しかるに,大学収容力の影響力は女子のほうが大きくなっています。女子の場合は,保護者が自宅外に出すのを躊躇うためでしょう。私が高校の頃も,こういう女子生徒がいました。九大に行ける能力があるのに,女子だからということで,自宅から通える地元の鹿大に行けと。

 重回帰分析による,都道府県別大学進学率の要因分析でした。話を分かりやすくするために,ごく単純な枠組みの分析としましたが,より多くの要因を取り入れた精緻な分析もあります。教育社会学の代表テーマといえるものですしね。これまでの先行研究の到達点を教えてくれるものとして,朴澤泰男氏による以下の論文があります。
http://ci.nii.ac.jp/naid/130003397431

 私が今回,重回帰分析を使った分析記事を書いたのは,この手法についての質問を学生さんから受けたからです。まあ,基本的な考え方を分かってもらえればよいと思います。重回帰式の求め方や,β値の計算方法などは,別に理解しなくてもよいでしょう。今はコンピュータの時代。統計ソフト「エクセル統計」にて,被説明変数と説明変数の範囲をカバーし,ワンクリックすれば,立ちどころに必要な値が出てきます。

 学部の学生さんで重回帰分析とは。卒論で使うとのことでしたが,スゴイなあ。でもね。クロス集計や単相関だけでも,大抵のことは分かりますよ。

 今はエクセルとかSPSSで,高度な手法も簡単にできるため,それに振り回されるあまり,本質を見失うこともしばしば。果ては,難しい数式を並べて誤魔化すなんていう非道も・・・。本当の必要に迫られたらやる。これでいいではありませんか。