Stel dat we onomstotelijk de oorzaken van depressie zouden kunnen vaststellen. Helaas is het aantonen van causaliteit ingewikkeld en zijn beschikbare data vaak niet ideaal. Vandaar dat veel statistische technieken geen causaal verband aan kunnen tonen maar evidentie opleveren die al dan niet consistent is met een causale hypothese. Maar wat is eigenlijk evidentie die consistent is met een causale hypothese?
Stelt u zich voor dat neuroticisme een veroorzaker is van depressie. Ik meet de mate van neuroticisme en depressiviteit eenmaal bij een heleboel mensen. Op die verzamelde data voer ik een variantieanalyse uit. In het geval dat neuroticisme een veroorzaker is van depressiviteit, zou ik moeten vinden dat de gemiddelde depressiescore in een hoog-neurotische groep hoger is dan die in een laag-neurotische groep. Dit is evidentie die consistent is met een causale hypothese maar die niet afdoende is om causaliteit vast te stellen: je kunt niet uitsluiten dat het causale verband andersom is (depressie neuroticisme).
Waarom? In het voorbeeld