Informaatioteoreettisia laskuja HS:n vaalikonevastauksista

Tämä sivu sisältää matemaattisia tuloksia vastauksista, jotka vuoden 2011 eduskuntavaalien ehdokkaat ovat antaneet Helsingin Sanomien vaalikoneeseen. Käytetty tietokanta on saatavissa osoitteesta: http://blogit.hs.fi/hsnext/hsn-vaalikone-on-nyt-avointa-tietoa.

Päivitys 17.4.2011

Päivitys 13.4.2011

Menetelmät

Jokaisen vaalikoneen varsinaisen kysymyksen eri vastausvaihtoehto (esim. "kyllä" tai "ei") on diskreetin satunnaismuuttujan yksi arvo. Kun vastaajia on useita (esim. saman puolueen kaikki ehdokkaat), voidaan laskea havaittu jakauma vastausvaihtoehtojen yli. Saatuja jakaumia voidaan tutkia ja verrata informaatioteoreettisilla mitoilla, kuten:

Tuloksissa ovat mukana kaikki monivalintakysymykset samalla painolla. Kysymykset on oletettu toisistaan riippumattomiksi. Kysymyksissä, joissa on pitänyt valita kerrallaan useampi vaihtoehto, valinnat on oletettu toisistaan riippumattomiksi. Ehdokkaat, joiden kaikki vastaukset olivat tyhjiä, on poistettu.

Vastausjakaumien entropiat puolueittain

Pienempi luku tarkoittaa pienempää hajontaa vastauksissa. Maksimientropia (tasajakautuneet vastaukset) on 68.38 bittiä.

  1. KTP: 35.01 bittiä (8 ehdokasta)
  2. SKP: 37.38 bittiä (96 ehdokasta)
  3. VAS: 38.61 bittiä (195 ehdokasta)
  4. KA: 39.27 bittiä (10 ehdokasta)
  5. SDP: 39.31 bittiä (214 ehdokasta)
  6. PS: 40.61 bittiä (203 ehdokasta)
  7. KESK: 41.37 bittiä (205 ehdokasta)
  8. VIHR: 41.43 bittiä (215 ehdokasta)
  9. VP: 43.31 bittiä (29 ehdokasta)
  10. SEN: 43.40 bittiä (18 ehdokasta)
  11. STP: 43.80 bittiä (20 ehdokasta)
  12. RKP: 44.40 bittiä (69 ehdokasta)
  13. KOK: 44.58 bittiä (209 ehdokasta)
  14. KD: 44.82 bittiä (167 ehdokasta)
  15. IPU: 47.33 bittiä (42 ehdokasta)
  16. M2011: 50.43 bittiä (57 ehdokasta)
  17. PIR: 54.09 bittiä (83 ehdokasta)

Vastausjakaumien entropiat vaalipiireittäin

Entropiat voidaan yhtä hyvin laskea vaalipiireittäin:

  1. Satakunnan vaalipiiri: 47.71 bittiä (77 ehdokasta)
  2. Pohjois-Savon vaalipiiri: 47.84 bittiä (93 ehdokasta)
  3. Etelä-Savon vaalipiiri: 47.85 bittiä (76 ehdokasta)
  4. Vaasan vaalipiiri: 47.98 bittiä (113 ehdokasta)
  5. Oulun vaalipiiri: 48.60 bittiä (126 ehdokasta)
  6. Pohjois-Karjalan vaalipiiri: 48.68 bittiä (77 ehdokasta)
  7. Kymen vaalipiiri: 48.70 bittiä (101 ehdokasta)
  8. Keski-Suomen vaalipiiri: 49.31 bittiä (111 ehdokasta)
  9. Hämeen vaalipiiri: 49.43 bittiä (107 ehdokasta)
  10. Lapin vaalipiiri: 50.13 bittiä (85 ehdokasta)
  11. Pirkanmaan vaalipiiri: 50.18 bittiä (149 ehdokasta)
  12. Varsinais-Suomen vaalipiiri: 51.60 bittiä (149 ehdokasta)
  13. Uudenmaan vaalipiiri: 52.05 bittiä (346 ehdokasta)
  14. Helsingin vaalipiiri: 54.03 bittiä (236 ehdokasta)

Verrattaessa puolueittaisiin entropioihin voidaan todeta esimerkiksi että Satakunnan vaalipiirin ehdokkaat ovat yksimielisempiä kuin PIR- ja M2011-puolueiden ehdokkaat. Suurimmalla osalla puolueista entropia on kuitenkin selvästi pienempi.

Puheejohtajien erot oman puolueensa ehdokkaisiin

Seuraavassa on laskettu suhteellinen entropia kunkin puolueen puheenjohtajan ja puolueen kaikkien ehdokkaiden jakauman välille. Suurempi luku tarkoittaa, että ehdokkaat ovat useammin eri mieltä kuin puheenjohtajansa. Kunkin puolueen ja puheenjohtajan kohdalla on listattu viisi kysymystä, joissa ero on suurin, ja niistä puheenjohtajan vastaukset sekä ehdokkaiden yleisimmät vastaukset.

Puolueet ovat järjestyksessä suhteellisen entropian mukaan, alkaen suurimmasta erosta. SDP:n Jutta Urpilaisen ja KTP:n Hannu Harjun kohdalla vaalikoneessa ei ollut vastauksia, joten SDP ja KTP puuttuvat listasta.

| M2011 | PIR | IPU | VP | STP | KOK | KD | PS | VAS | RKP | SEN | VIHR | KESK | KA | SKP |

Vastausten väliset etäisyydet puolueittain

Taulukkoa varten on laskettu informaatiosäteet eri puolueiden vastausjakaumien välille.

Puolueet ovat taulukossa ehdokasmäärän mukaisessa järjestyksessä. Pienempi luku tarkoittaa, että vastausten jakaumat ovat lähempänä toisiaan.
VIHR SDP KOK KESK PS VAS KD SKP PIR RKP M2011 IPU VP STP SEN KA KTP
VIHR - 5.69 11.72 8.85 15.70 5.33 9.94 11.06 8.66 6.94 14.22 12.75 16.80 9.92 14.61 11.43 16.10
SDP 5.69 - 10.00 6.39 8.78 3.39 5.55 10.70 8.70 8.56 10.36 8.74 11.01 7.37 8.43 7.62 13.44
KOK 11.72 10.00 - 4.49 11.56 16.25 6.81 23.20 9.38 4.57 10.91 13.77 14.34 16.54 10.76 16.48 23.89
KESK 8.85 6.39 4.49 - 8.09 10.48 3.24 17.28 8.78 5.45 9.68 8.95 9.97 12.00 9.08 11.48 18.36
PS 15.70 8.78 11.56 8.09 - 11.38 5.14 16.48 9.86 15.24 4.18 6.30 4.43 11.56 5.13 9.76 16.53
VAS 5.33 3.39 16.25 10.48 11.38 - 8.80 4.50 9.42 11.93 11.98 8.23 12.24 4.56 12.09 7.45 9.10
KD 9.94 5.55 6.81 3.24 5.14 8.80 - 14.80 8.50 8.04 7.48 6.34 7.20 9.82 6.72 8.19 16.10
SKP 11.06 10.70 23.20 17.28 16.48 4.50 14.80 - 13.57 17.93 15.33 9.35 13.98 4.10 17.61 11.10 5.36
PIR 8.66 8.70 9.38 8.78 9.86 9.42 8.50 13.57 - 9.74 4.77 8.83 10.69 10.52 11.05 11.45 16.14
RKP 6.94 8.56 4.57 5.45 15.24 11.93 8.04 17.93 9.74 - 13.99 14.08 17.15 13.83 13.80 15.27 20.69
M2011 14.22 10.36 10.91 9.68 4.18 11.98 7.48 15.33 4.77 13.99 - 5.90 5.17 10.89 7.41 10.51 15.60
IPU 12.75 8.74 13.77 8.95 6.30 8.23 6.34 9.35 8.83 14.08 5.90 - 4.13 5.80 8.71 7.14 9.57
VP 16.80 11.01 14.34 9.97 4.43 12.24 7.20 13.98 10.69 17.15 5.17 4.13 - 9.52 7.20 10.07 13.81
STP 9.92 7.37 16.54 12.00 11.56 4.56 9.82 4.10 10.52 13.83 10.89 5.80 9.52 - 11.77 9.00 5.60
SEN 14.61 8.43 10.76 9.08 5.13 12.09 6.72 17.61 11.05 13.80 7.41 8.71 7.20 11.77 - 11.43 17.89
KA 11.43 7.62 16.48 11.48 9.76 7.45 8.19 11.10 11.45 15.27 10.51 7.14 10.07 9.00 11.43 - 12.39
KTP 16.10 13.44 23.89 18.36 16.53 9.10 16.10 5.36 16.14 20.69 15.60 9.57 13.81 5.60 17.89 12.39 -

Alla on etäisyysmatriisista multidimensional scaling (MDS) -menetelmällä laskettu projektio kaksiuloitteiseen avaruuteen. Kuvassa ympyröiden ala on verrannollinen ehdokasmääriin. Ympyröiden keskipisteiden välisten etäisyyksien pitäisi keskimäärin vastata taulukon antamia etäisyyksiä. Esimerkiksi Piraattipuolueen (PIR) osalta projektio ei ole onnistunut kovin hyvin, koska sen tulisi olla lähempänä M2011:sta kuin KD:tä tai Keskustaa. Todennäköisesti kovin hyvää 2D-projektiota ei ole edes mahdollista saada, vaan puolueiden välisten suhteiden kuvaaminen vaatii useamman dimension.
MDS-projektio etäisyysmatriisista

Vastausten väliset etäisyydet vaalipiireittäin

Vastaavasti kuin puolueiden tapauksessa, taulukkoon on laskettu informaatiosäteet eri vaalipiirien vastausjakaumien välille. Pienempi luku tarkoittaa, että vastausten jakaumat ovat lähempänä toisiaan.
Uudenmaan Helsingin Varsinais-Suomen Pirkanmaan Oulun Vaasan Keski-Suomen Hämeen Kymen Pohjois-Savon Lapin Satakunnan Pohjois-Karjalan Etelä-Savon
Uudenmaan - 0.69 0.83 0.89 1.19 1.31 1.20 0.84 1.14 1.44 1.26 1.33 1.51 1.58
Helsingin 0.69 - 1.40 1.67 2.37 2.56 1.89 1.55 2.25 2.27 1.92 2.10 2.23 2.51
Varsinais-Suomen 0.83 1.40 - 0.63 1.01 1.09 0.83 0.93 1.18 1.19 1.12 1.36 1.16 1.64
Pirkanmaan 0.89 1.67 0.63 - 0.66 0.93 0.82 0.69 0.81 1.10 1.14 0.98 0.98 1.35
Oulun 1.19 2.37 1.01 0.66 - 0.70 1.05 1.02 0.72 0.99 0.95 0.98 1.00 1.06
Vaasan 1.31 2.56 1.09 0.93 0.70 - 1.35 1.11 0.89 1.16 1.30 1.22 1.38 1.38
Keski-Suomen 1.20 1.89 0.83 0.82 1.05 1.35 - 1.06 1.33 1.16 1.25 1.38 1.00 1.53
Hämeen 0.84 1.55 0.93 0.69 1.02 1.11 1.06 - 0.96 1.18 1.21 0.98 1.20 1.50
Kymen 1.14 2.25 1.18 0.81 0.72 0.89 1.33 0.96 - 1.25 1.22 1.03 1.22 1.32
Pohjois-Savon 1.44 2.27 1.19 1.10 0.99 1.16 1.16 1.18 1.25 - 1.15 1.17 1.23 1.06
Lapin 1.26 1.92 1.12 1.14 0.95 1.30 1.25 1.21 1.22 1.15 - 1.11 1.11 1.27
Satakunnan 1.33 2.10 1.36 0.98 0.98 1.22 1.38 0.98 1.03 1.17 1.11 - 1.11 1.28
Pohjois-Karjalan 1.51 2.23 1.16 0.98 1.00 1.38 1.00 1.20 1.22 1.23 1.11 1.11 - 1.50
Etelä-Savon 1.58 2.51 1.64 1.35 1.06 1.38 1.53 1.50 1.32 1.06 1.27 1.28 1.50 -
Erot ovat pieniä verrattuna puoluekohtaisiin eroihin. Eniten muista poikkeavat Helsingin vaalipiirin ehdokkaiden vastaukset. Helsingin vaalipiiriä lähinnä on, kuten oli odotettavissa, Uudenmaan vaalipiiri. Uudenmaan ehdokkaiden vastausjakauma on lähellä muitakin eteläisiä vaalipiirejä, kuten Varsinais-Suomi, Pirkanmaa ja Häme. Yksittäisistä kysymyksistä Helsingin ja Uudenmaan ehdokkaita muista erottaa ylivoimaisesti eniten kysymys 30, joka koskee kuntien verotulojen tasausta köyhemmille kunnille. Helsingin ja Uudenmaan ehdokkaita toisistaan taas erottaa eniten kysymys 29, joka koskee pääkaupunkiseudun kaupunkien yhdistämistä.

Samankaltaisimmat puolueet ja niitä yhdistävät ja erottavat kysymykset

Tätä listaa varten on laskettu suhteellinen entropia vastausten alkuperäisestä jakaumasta p toisen puolueen vastausjakauman q kanssa yhdistettyyn jakaumaan (p+q)/2. Tulos kertoo kuinka monta bittiä ylimääräistä informaatiota tarvitaan jos mallinnetaan alkuperäinen jakauma yhdistelmällä.

Jokaista puoluetta kohti on listattu kolme vastausten perusteella lähintä puoluetta sekä kauimmaisin puolue ja jokaisen niistä kohdalta kolme vähiten ja eniten erottavaa kysymystä. Suurempi luku tarkoittaa suurempaa etäisyyttä vastausten välillä.

| VIHR | SDP | KOK | KESK | PS | VAS | KD | SKP | PIR | RKP | M2011 | IPU | VP | STP | SEN | KA | KTP |


2011-04-17
Sami Virpioja
sami.virpioja ät gmail.com

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.