収入の少ない人ほど、松井候補に投票?


2011年の大阪府知事選挙で、「大阪維新の会」の松井一郎候補が当選しましたが、松井候補の市町村別の得票率と平均所得は逆相関、つまり所得の低い市町村ほど松井候補の得票率が高かったことが、わかりました。

という分析がありました。これを、もう少し別の角度から分析をしてみたいと思います。



知事選各候補の市町村毎の得票率を計算して見ていたら、ある事に気づきました。松井候補は主に南部で得票率が高く、北部で得票率が高くないように見える、ということです。どうやら、得票率と地域性に関係があるように見えます。

大阪では、「豊中箕面・吹田といった北部は所得が多く、逆に泉佐野貝塚のような南部では所得が低い」というイメージがあります。となると、松井候補の得票率と、市町村毎の平均所得との間に、関係があるかもしれません。そこで、検証してみる事にしました。

所得と得票率の相関は、R^2 = 0.1578 で、t検定は1%有意ですから、関係はあるといえるでしょう。ただし、そもそも地域性それ自体が最も重要である可能性が高い気もします。なぜなら、松井候補の地元の八尾市は松井候補の得票率が2位、逆に倉田候補の地元の池田市では松井候補の得票率がワースト2位だからです。要するに、候補者の地元が有利であったということです。

そこで、各自治体の市町村役場の場所から、(池田市役所からの距離)−(八尾市役所からの距離)を求めて*1、それと松井候補の得票率の相関を見てみました。その結果、R^2 = 0.3538 で、t検定は0.1%有意となりました。つまり、所得より自治体の位置のほうが得票率との相関が強いことがわかります。

よって、「収入の少ない人ほど、松井候補に投票」しているように見えるのは、

  • 候補者の地元近辺において得票率が高くなること
  • 池田市近辺(大阪府北部)は八尾市近辺(南部)より平均所得が高い*2こと

から導き出された「擬似相関」であり、「収入の少ない人ほど、松井候補に投票」ということ自体には因果関係は薄いと見るのが妥当ではないかと思われます。


Rで計算した結果を以下に載せます。

R version 2.13.0 (2011-04-13)
Copyright (C) 2011 The R Foundation for Statistical Computing
ISBN 3-900051-07-0
Platform: x86_64-pc-mingw32/x64 (64-bit)

Rは、自由なソフトウェアであり、「完全に無保証」です。 
一定の条件に従えば、自由にこれを再配布することができます。 
配布条件の詳細に関しては、'license()'あるいは'licence()'と入力してください。 

Rは多くの貢献者による共同プロジェクトです。 
詳しくは'contributors()'と入力してください。 
また、RやRのパッケージを出版物で引用する際の形式については 
'citation()'と入力してください。 

'demo()'と入力すればデモをみることができます。 
'help()'とすればオンラインヘルプが出ます。 
'help.start()'でHTMLブラウザによるヘルプがみられます。 
'q()'と入力すればRを終了します。 

> matsuivoting<-c(64.1,61.2,61,60.9,60.5,60.4,60.1,60,59.7,59.3,59.2,59.1,58.7,58.7,58.7,58.7,58.6,58.5,58.5,57,56.8,56.6,56.4,56,56,55.6,55.6,55.3,55.1,55,54.8,54.6,53.6,53,52.8,52.5,51.9,51.9,51.3,51.2,49.8,35.6,33.5)
> income<-c(320,350,332,349,340,335,325,364,347,349,359,318,332,321,333,387,323,311,364,332,398,323,373,384,335,380,359,369,351,332,372,358,389,373,380,339,421,420,356,464,418,403,332)
> summary(lm(matsuivoting~income))

Call:
lm(formula = matsuivoting ~ income)

Residuals:
     Min       1Q   Median       3Q      Max 
-24.0829  -1.1936   0.4059   3.0643   5.6962 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 80.29594    8.88834   9.034 2.65e-11 ***
income      -0.06841    0.02468  -2.772  0.00834 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 5.343 on 41 degrees of freedom
Multiple R-squared: 0.1578,     Adjusted R-squared: 0.1373 
F-statistic: 7.683 on 1 and 41 DF,  p-value: 0.008345 

> northlat<-c(34.406847,34.626863,34.437662,34.359582,34.504279,34.366004,34.737695,34.520717,34.579305,34.73994,34.483526,34.487092,34.67933,34.316977,34.460634,34.458084,34.712015,34.73915,34.401282,34.577879,34.503795,34.777356,34.81434,34.518681,34.766092,34.816338,34.566226,34.491636,34.558034,34.393774,34.574277,34.846158,34.787943,34.883924,34.499527,34.657518,34.759452,34.781265,34.464587,34.82693,34.937174,34.821705,34.97255)
> eastlon<-c(135.327337,135.600978,135.358452,135.23967,135.410464,135.273339,135.563904,135.442452,135.628642,135.639533,135.423557,135.401323,135.601012,135.142139,135.370829,135.564226,135.623659,135.586893,135.355785,135.55185,135.555693,135.561817,135.650658,135.647661,135.6281,135.568505,135.482556,135.629699,135.606212,135.291174,135.597474,135.617272,135.679953,135.66297,135.597128,135.497547,135.51686,135.469739,135.622537,135.470463,135.450524,135.428444,135.414274)
> distance<-sqrt((northlat-34.821705)^2+(eastlon-135.428444)^2)-sqrt((northlat-34.626863)^2+(eastlon-135.600978)^2)
> summary(lm(matsuivoting~distance))

Call:
lm(formula = matsuivoting ~ distance)

Residuals:
    Min      1Q  Median      3Q     Max 
-14.486  -2.043   1.339   2.937   8.312 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  53.9217     0.8126  66.356  < 2e-16 ***
distance     24.5910     5.1905   4.738  2.6e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 4.68 on 41 degrees of freedom
Multiple R-squared: 0.3538,     Adjusted R-squared: 0.338 
F-statistic: 22.45 on 1 and 41 DF,  p-value: 2.597e-05 

> summary(lm(income~distance))

Call:
lm(formula = income ~ distance)

Residuals:
    Min      1Q  Median      3Q     Max 
-51.795 -24.821   3.204  20.957  83.777 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  364.568      5.537  65.838   <2e-16 ***
distance     -79.657     35.370  -2.252   0.0297 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 31.89 on 41 degrees of freedom
Multiple R-squared: 0.1101,     Adjusted R-squared: 0.08838 
F-statistic: 5.072 on 1 and 41 DF,  p-value: 0.02973 

*1:http://www.geocoding.jp/で各市役所の緯度・経度を調べ、距離を得ています。緯度または経度が1離れている距離を1としています。池田市役所と八尾市役所の中点は0、そこから池田市役所に近づくにつれマイナスに、八尾市役所に近づくにつれプラスになります。

*2:距離と所得の相関を見てみると、R^2 = 0.1101 で、t検定は5%有意。