Direktlänk till inlägg 29 maj 2012

Försvarstal för statistiken

Av Marie Lindén - 29 maj 2012 19:53





(För kort version läs andra och sista stycket).




"There are three kinds of lies: lies, damned lies, and statistics." (Mark Twain), "Statistics: the mathematical theory of ignorance" (Morris Kline) och "Statistik är som en bikini, visar det mesta men döljer det viktigaste" (oklart vem) är bara några kända citat om statistik. Citaten speglar en väldigt skeptisk, lite nedsättande attityd till statistik. En attityd som jag tycker är rätt vanlig. Jag tycker man ofta hör folk säga "man kan bevisa allt med statistik". En annan vanlig åsikt om statistik är att det är det gråaste, torraste och tråkigaste som finns. Men jag tycker att statistiken är missförstådd! 


Jag tycker statistik är fantastiskt! Nästan magi! Man samlar in sina fakta för att undersöka sitt ämne: skickar ut formulär, ställer frågor, räknar besökare, samlar in siffror, hur man nu väljer att göra det. Så sitter man sen där med en massa siffror. Siffror som är ofta är oöverskådliga, som inte säger en något, som bara är en röra av nummer och kommatecken på lappar eller i excel-diagram. Så börjar man bearbeta dem med statistik och plötsligt kommer mönster, samband och diagram fram. Siffrorna berättar tillsammans något för oss och vi kan se dem visuellt som linjer och figurer. Eller få dem sammanfattade i medelvärden, typvärden och standardavvikelser. Från att ha varit en grå oförståelig massa blir det plötsligt något relativt lättläst, lättillgängligt.  Den är ett redskap för oss att undersöka världen omkring oss. Att undersöka om det vi misstänker vara ett samband faktiskt kan vara det. Att sammanfatta världen omkring oss. Att hålla koll på vår omgivning. Att se om saker förändrats.


Men visst finns det dålig/otillförlitlig statistik. Som allting som är gjort av en människa beror kvalitén hos produkten på kunskapen och noggrannheten hos den som gjort den. Precis som smaken i en maträtt beror på kockens skicklighet. Dessutom beror kvalitén på slutprodukten av kvalitén på råvaran. Precis som man inte kan laga god mat på dåliga ingredienser, kan man inte få tillförlitlig statistik om man inte har ett bra data-sampel. Men vi säger inte att all mat smakar illa bara för att det finns mat som gör det. Så varför kasta all statistik över bord bara för att det finns dålig? 


Dessutom bär också den som tolkar statistik ett ansvar. Den som läser statistik måste ha hjärnan påkopplad. Man måste förutom att kunna läsa ut fakta ur diagram och karakteristikor också till exempel kunna bedöma rimligheten. För statistik är aldrig exakt, det är alltid fråga om en uppskattning. Den gör inte heller anspråk på att vara exakt. Därför finns det konfidensintervall, som berättar sannolikheten för att de resultat vi fått stämmer överens med verkligheten. Dessutom jämför statistiken bara siffror, det är människor som drar slutsatser. Därför är det den som tolkar statistiken som måste avgöra om det verkligen finns ett samband (till exempel mellan utomhustemperaturen och antalet sålda glassar) eller om det inte finns ett direkt samband utan att korrelationen till exempel beror på att de två fenomenen beror av en tredje variabel (t.ex. kanske både antalet sålda hus och antalet sålda datorer har gått ner de senaste åren, men att antalet sålda datorer minskar inte pga att antalet sålda hus minskar utan de kanske båda minskar pga den ekonomiska krisen). Vi kan alltså inte skylla dåligt tolkade resultat på statistiken, för statistiken är inte en människa som kan göra bedömningar.




För att vi ska kunna bedöma rimligheten på statistiken krävs dock kunskap inom det området som undersöks. För att bedöma kvalitén av undersökning, och därmed tillförlitligheten i resultaten, borde vi ha tillgång till information som till exempel konfidensintervall och sampelstorlek. Enligt anvisningar hur man bör hantera statistik ska dessa också redovisas, just av den här orsaken. Men när statistik presenteras i t.ex tidningar finns det sällan med. Antagligen inte för att den som publicerar statistiken försöker undanhålla information, utan antagligen på grund av att den som publicerar statistiken saknar tillräcklig kunskap om statistik. Och här kommer vi till det som jag tycker är problemet med statistik: att många av de som håller på med statistik saknar tillräcklig kunskap om statistik. Och då syftar jag förstås inte på typ statistikcentralen utan t.ex såna som forskar i andra ämnen en statistik, t.ex psykologi, eller någon som typ sitter på ett kommunkansli och har som en av alla sina uppgifter att sammanställa lite statistik. Dagstidningar som publicerar statistik verkar för det mesta också sakna tillräcklig kunskap om statistik. Bristen på kunskap kan förutom brister i kvalitén leda till omedvetet fusk. Som fusk med statistik räknas bland annat avklippta axlar och användning av felaktigt formade figurer (t.ex. att använda konformade staplar istället för fyrkantiga). Metoder som gör att t.ex en ökning ser större ut än de egentligen är. Visst finns det de som fuskar medvetet. Men jag tror att när Expressen byter ut staplarna i sina diagram över glassförsäljningen till glasstrutar är de inte medvetna om att de samtidigt får ökningen att verka större. Jag tror de tycker det är klatschigt med bilder som relaterar till artikeln. Samtidigt tror jag att de flesta läsare inte är medvetna om att valet av glasstrutar istället för klassiska staplar gör att de uppfattar ökningen som större än vad den egentligen är. Ett annat problem är alltså att många av dem som läser och tolkar statistik inte har tillräckligt med kunskap. Dessutom tror jag att det ibland nästan finns en övertro, eller kanske snarare "överförväntan", på statistik, att det skulle vara hundraprocentiga sanningar det är frågan om. Ifall det är det man väntar sig är det klart man blir besviken och börjar tycka allt är bluff. Men som jag sa, statistiken har aldrig påstått att den är hundraprocentig.  


Men varför är den då så bra om den ändå inte är hundraprocentig? Om det ändå bara är en uppskattning? Enligt mig är det för att det är ett av de bästa redskapen vi har för att undersöka saker. Framför allt för att sammanfatta siffror. Det är lite som Winston Churchill sa om demokratin, det är den sämsta bortsett från alla de andra. Och många av de problemen med statistik som folk påpekar tycker jag dessutom att problemet oftare ligger i att den som utfört undersökning och tolkat resultaten har för lite kunskap om statistik, snarare än att statistik skulle vara någonting dåligt. Så sluta klanka ner på statistik! Du sitter ändå och läser den sen när det är fråga om sportresultat och eurovisionsvinnare. 

 
 
Ingen bild

Marie

1 juni 2012 18:56

Appro på intressant statistik: http://www.gapminder.org/videos/religions-and-babies/

Från
    Kom ihåg mig
URL

Säkerhetskod
   Spamskydd  

Kommentar

Av Marie Lindén - 19 november 2020 10:16

Jag hoppas verkligen att ingen efter #metoo missat hur vanligt det tyvärr är med sexuella trakasseri mot kvinnor av män. Förhoppningsvis har vi tagit ett steg närmare att utrota dessa, men tyvärr är det nog långt kvar ännu. När vi nu ändå tar tag i s...

Av Marie Lindén - 19 november 2019 06:53

Jag läste någon gång ett citat som gick ungefär så här: många blir feminister när de får flickor, men man borde bli feminist när man får pojkar. Jag var feminist innan jag fick barn och jag har fått pojkar och fortsatt vara det. Uppvuxen med mest kvi...

Av Marie Lindén - 8 november 2019 15:04

Egentligen är det inte konstigt att en massa me-too-tillfällen händer hela tiden och kvinnojourer behövs för kvinnor som måste få skydd från sina x när man hör på texterna till ”romantiska” låtar eller ser på hur ”kvinnokarlar&rdquo...

Av Marie Lindén - 31 oktober 2019 22:21

Ibland verkar det som att folk tycker det är fritt fram att vara taskiga mot någon bara för att de är lyckade eller tillhör en privilegierad grupp. Till exempel då Alex Shulman i ”Min sanning” ( https://www.svtplay.se/video/23592046/min-s...

Av Marie Lindén - 14 juli 2019 22:34

Anna Ingman skriver i sin ledare i Nya Åland måndagen den 8 juli att forskningsrapporter bör skrivas så att den ”vanliga människan” ska förstå innehållet och locka till läsning så att den når en bred publik. Resonemanget kan kanske verka ...

Ovido - Quiz & Flashcards