Van Maanen Hans van Maanen
klikklikklikklik

Pil en depressie

Skepter jg. 30 (2017), nr. 2, p. 12-18.


Het artikel in Skepter staat op de website. Hier een korte update - het wordt alleen maar erger...

In juli 2017 publiceerde JAMA Psychiatry een aantal correcties waaronder die van Skovlund e.a. over de raadselachtige standaarddeviaties: 'Incorrect SD values in Table 1':

In the Original Investigation titled 'Association of Hormonal Contraception With Depression', published in the November 2016 issue of JAMA Psychiatry, the SD values for mean age in Table 1 were incorrect. The correct values have now been added to the table. This article was corrected online.
En inderdaad, in tabel 1, waar de vrouwen worden beschreven, staat nu voor de leeftijden van de niet-pilgebruiksters een gemiddelde van 24,4 jaar met een standaardafwijking van 6,6 jaar en voor de pilgebruiksters 24,3 jaar met een standaardafwijking van 5,2 jaar. Of deze correctie de helderheid voor argeloze belangstellenden vergroot, is echter de vraag. In de resultatensectie van de Abstract staan immers, ook in de online-versie, nog de oude cijfers:
A total of 1 061 997 women (mean [SD] age, 24.4 [0.001] years; mean [SD] follow-up, 6.4 [0.004] years) were included in the analysis.
Al evenmin is een verbetering doorgevoerd onder het kopje Results in de hoofdtekst van het artikel. Daar staat:
The study population included 1 061 997 women (mean [SD] age, 24.4 [0.001] years; mean [SD] follow-up, 6.4 [0.004] years).
en even verderop, ook onverbeterd en nog steeds een factor 10 groter:
Women using hormonal contraception were a mean (SD) of 24.3 (0.01) years of age; nonusers were a mean (SD) of 24.4 (0.01) years of age.
De chaos is, kortom, compleet. We hebben nu drie standaardafwijkingen voor de vrouwen in het verbeterde artikel: 0,001, 0,01 en rond de 6. Los daarvan, met een standaardafwijking van 6 jaar komen we uit op een onnauwkeurigheid van het gemiddelde (de 'standaardfout') van 6 gedeeld door de wortel uit 1 061 997 is 0,0058 - het aanvankelijke verweer dat die 0,001 in hun artikel eigenlijk per ongeluk de standaardfout was, zoals Lidegaard mij suggereerde, klopt dus inderdaad ook niet (dat was ook toen al wel duidelijk, maar dat ging wat te ver voor mijn verhaal in Skepter - uit het hoofd of met een statistiekboekje kun je direct al schatten dat de spreiding rond de 5,5 jaar moet liggen). In de verbeterde tabel die ik eind november 2016 van Lidegaard kreeg, was de gemiddelde leeftijd van het totale cohort trouwens iets gezakt, van 24,4 naar 24,3 jaar, met een standaardafwijking van 5,6 jaar. Ook dat heeft de correctieafdeling van JAMA Psychiatry niet gehaald.

Blijft de vraag, of de verse standaardafwijkingen wél geloofwaardig zijn - voor de niet-pilsliksters 6,6 jaar en voor de pilsliksters 5,2 jaar. Het studiecohort bestond uit alle Deense vrouwen tussen 15 en 34 jaar, van wie de onderzoekers 13 jaar gegevens hadden. Het kan haast niet anders of er zitten van elke leeftijdsgroep ongeveer evenveel vrouwen in het cohort: de verdeling is uniform. Gebruikelijker is, dat de meeste waarden zich in de buurt van het gemiddelde bevinden en de rest daaromheen, met uiterste waarden steeds minder vaak optredend - dan is de spreiding dus kleiner. Maar hoe ziet een leeftijdsverdeling met een standaardafwijking van maar liefst 6,6 jaar eruit?
Links een grafiek met de uniforme verdeling: in elke leeftijdsgroep 53 100 vrouwen, voor een totaal van 1 062 000 vrouwen, een gemiddelde van 24,5 jaar en een standaardafwijking van 5,77 jaar. Tot zo ver niets aan de hand. Veel lastiger is het construeren van een verdeling met een standaardafwijking van 6,6 jaar zoals de auteurs die geven. Een mogelijkheid staat rechts: 1 062 000 vrouwen, een gemiddelde van 24,5 jaar en een standaardafwijking van 6,57 jaar.

Er zijn uiteraard wel andere verdelingen te bedenken, maar deze is, met dank aan Jan Willem Nienhuys, soepel kwadratisch en elegant.
Wat hebben de auteurs in hemelsnaam uitgespookt? Hier kan toch amper sprake zijn geweest van een representatieve steekproef, met zeker vijf keer zoveel vrouwen aan de uiteinden als in het midden? Je mag toch hopen dat ze alles gecheckt en gedubbelcheckt hebben voordat ze hun correcties naar JAMA Psychiatry stuurden. Of zou het wederom een tikfout van Skovlund zijn? Of toch uit de lucht gegrepen?