Varför visualisera data?
Jag brukar säga åt uppsatsstudenter att visualisera data med scatterplots innan de börjar köra stata eller SPSS. Tack vare Richard Öhrvall har jag numera ett dunderargument för detta, hämtat från en klassisk artikel av Anscombe, vari presenteras 4*11 datapunkter med den intressanta egenskapen att medelvärde, standardavvikelse är identiska för samtliga fyra datamängdet – och en OLS-regression ger i samtliga fyra fall sambandet y=3+0,5x (p = 0,03, R2 = 0,67).
Den som visualiserar data ser dock snabbt att regressionen inte ger riktigt hela bilden:
Tack Richard!
Reader Comments (1)