2014年7月27日日曜日

東京都内23区の学力の推計

 矢野和男氏の筆になる『データの見えざる手-ウエアラブルセンサが明かす人間・組織・社会の法則-』(草思社)という本が話題になっています。アダム・スミスの「神の見えざる手」を模したグッド・ネーミングですね。

 内容紹介の文章に,「人間の行動を支配する隠れた法則を方程式で表す」という一文があります。これは統計学の基本テーゼであり,重回帰分析や数量化Ⅱ類なども,この考え方に依拠しています。

 7月19日の記事では,所得,高学歴率,大学収容力という3要因から各県の大学進学率を推計する重回帰式をつくりましたが,今回は,子どもの学力についても同じことをしてみようと思います。タイトルにあるような,東京都内23区の学力の推計です。

 東京都は毎年,独自の学力調査を実施しています。『児童・生徒の学力向上を図るための調査』です。私は都教委に情報公開申請をして,2013年度の都内市区別の結果を入手しました。地域分散の大きい,公立小学校5年生の算数の平均正答率を分析対象とします。
http://www.metro.tokyo.jp/INET/CHOUSA/2013/11/60nbs400.htm

 言わずもがな,各区の平均正答率は,地域の社会経済指標と強く相関しています。後者が分かれば,前者をほぼ正確に予測できるほどです。私は3つの指標をもとに,各区の学力を推計する重回帰式をつくってみました。その3要因について説明します。

 まずは,①住民一人当たり課税額です。地域住民の富裕度を表す指標ですが,こういう経済指標と学力は強く相関しているでしょう。通塾するにもお金がかかりますしね。出所は,2012年度の『東京都税務統計年報』です。

 その②は,高学歴人口率です。親の教育熱心度や文化嗜好と関わるものであり,こちらも学力と強く関連しているとみられます。大学・大学院卒人口が,学校卒業人口の何%を占めるかです。資料は,2010年の総務省『国勢調査』です。

 あと一つの要因として,③教育扶助受給率も計算に入れましょう。教育扶助とは生活保護の一種であり,学齢の子がいる生活困窮世帯に支給されます。貧困と学力の相関はよく指摘されますが,この指標も学力を強く規定しているでしょう。教育扶助受給率は,2012年度の教育扶助受給世帯数を,同年5月時点の公立小・中学生数で除して算出しました。分子の出所は『東京都福祉・衛生統計年報』,分母は都教委の『公立学校統計調査』です。

 下の表は,被説明変数である算数の平均正答率と,説明変数の3指標の一覧です。最高値には黄色,最低値には青色のマークをつけています。


 大都市という基底的特性を同じくしながらも,学力や社会経済指標の値は大きく違っていますね。学力のマックスは文京区,一人当たり課税額は,六本木ヒルズのある港区が最高ですか。さもありなんです。

 算数平均正答率と3要因との単相関係数を出すと,一人当たり課税額とは+0.6889,高学歴人口率とは+0.9052,教育扶助受給率とは-0.7969となります。いずれも1%水準で有意です。高学歴率との相関はスゴイですね。

 では,3要因を同時に投入して,各区の算数平均正答率を推計する重回帰式をつくってみましょう。3要因は互いに強く相関しているので,多重共線の問題が出るかと思いましたが,線形結合している変数はありませんでした。

 一人当たり課税額をA,高学歴人口率をB,教育扶助受給率をCとおくと,各区の算数の平均正答率を最も高い精度で予測する式は以下のようになります。

 算数の平均正答率=0.0354A+0.4431B-0.0978C

 各要因の規定力の強さは係数から分かりますが,各々の単位を考慮して標準化した標準化偏回帰係数(β値)にすると,Aが+0.0731,Bが+0.7084,Cが-0.1789となります。高学歴率の規定力がダントツですね。やっぱり,保護者の教育熱心度とかでしょうなあ。

 ちなみに,この分析の精度を表す決定係数は0.831であり,学力の区別分散の83%がこれらの3要因で説明されることが示唆されます。つまり,A~Cの3要因が分かれば,各区の学力をほぼ正確に予測できる,ということです。

 さて,上記の重回帰式を使って,各区の算数平均正答率の理論値を出し,上表の観測値と照合してみます。下の表は,両者の残差をとったものです。


 ほとんどの区が,±2ポイントの範囲内に収まっていますね。課税所得,高学歴率,教育扶助率だけで,子どもの学力はかなり予測できちゃうんだなあ。

 しかしここで注目すべきは,地域条件から期待されるよりも高い結果を出している区です。新宿区と足立区は,観測値が理論値を3ポイント以上上回っています。「がんばっている」区と評してよいでしょう。

 地域別の学力テストの結果は,こういう視点からも読むべきでしょう。報告書に記載されているままの観測値だけが問題にされますが,それはある意味,アンフェアというものです。地域条件も考慮すると,各地域の違った側面も見えてきます。足立区は,正答率の絶対水準は低いものの,地域条件から期待される水準に比せば高い結果を出している,「がんばっている」区と評されるわけです。

 はて,この区ではどういう取組がなされているのか気になりますが,区のホムペをみたところ,経済的理由により通塾が叶わない子どもを対象とした「足立はばたき塾」や,学習支援ボランティアを活用した学力向上施策が実施されているようです。
http://www.city.adachi.tokyo.jp/k-kyoiku/kyoiku/gakuryoku/index.html

 なるほど,こういう実践の成果ともいえるでしょう。その成果は,観測値だけでは分かりにくいですが,地域条件から演繹される期待値との残差という数値によって可視化されていますね。

 ちなみに,足立区の公立小学校の教育条件指標をみると,教員一人あたり児童数は18.8人,一学級あたりの児童数は29.0人であり,いずれも23区平均よりも高くなっています(2012年度)。私が前にやった分析では,学力の社会的規定性の克服に際しては少人数教育が有効という結果が出たのですが,ここでは違うのかな。
http://ci.nii.ac.jp/naid/110006793455

 現在,学力テストの地域別結果を公表する・しないで激論が交わされていますが,私は市区町村レベルのデータは公表してほしいと思っています。理由の1は,学力の社会的規定性を実証するには,県単位のマクロデータでは難しいからです。あと一つは,今回やったような残差分析に使いたいからです。

 観測値をそのまま読むのではなく,地域条件から期待される理論値と照合し,両者の差(残差)によって,各地域のガンバリ度を評価する。さらに,「がんばっている」地域でどういう実践が行われているかを丹念に観察し,それを広める努力をする。この仕事は,教育による社会的不平等の克服にも寄与することでしょう。

 長くなりましたので,この辺りで。学力テストの結果の読み方に関する,一つの問題提起でした。今日も酷暑ですが,よい休日をお過ごしください。