Varför visualisera data?
10 apr 2012, kl 13:51
bergh in Lite väl akademiskt, uppsatstips

Jag brukar säga åt uppsatsstudenter att visualisera data med scatterplots innan de börjar köra stata eller SPSS. Tack vare Richard Öhrvall har jag numera ett dunderargument för detta, hämtat från en klassisk artikel av Anscombe, vari presenteras 4*11 datapunkter med den intressanta egenskapen att medelvärde, standardavvikelse är identiska för samtliga fyra datamängdet – och en OLS-regression ger i samtliga fyra fall  sambandet y=3+0,5x (p = 0,03, R2 = 0,67).

Den som visualiserar data ser dock snabbt att regressionen inte ger riktigt hela bilden:

image

Tack Richard!

Article originally appeared on (http://andreasbergh.se/).
See website for complete article licensing information.