Achtergronden | Representativiteit


Wat is representativiteit?

"Het onderzoek is uitgevoerd onder een representatieve steekproef van 1000 Nederlanders". Dergelijk uitspraken zijn vaak terug te vinden in publicaties over surveys en peilingen. Maar wat betekent die uitspraak nu eigenlijk? Dat is hemelaal niet duidelijk. Iedereen heeft er wel een vaag gevoel over, maar niemand weet precies wat representativiteit betekent. En als een steekproef representatief is, houdt dit dan ook in dat de uitkomsten van het onderzoek betrouwbaar zijn?

William Kruskall     Frederick Mosteller

 

De twee statistici William Kruskal en Frederick Mosteller hebben al in 1979 uitgebreid onderzoek gedaan naar gebruik van het woord representatief in zowel de wetenschappelijke als de niet-wetenschappelijke literatuur. Daaruit bleek dat er aan het begrip representativiteit vaak een heel verschillende uitleg wordt gegeven. Hieronder staat een opsomming van een aantal mogelijke interpretaties.


Representatief = Statusverhoging

Dit is een nogal negatief gebruik van het begrip dat je vaak in de media tegenkomt. Door de steekproef representatief te noemen stel je de kijker, luisteraar of lezer gerust. Maak je geen zorgen. Het zit wel goed met de steekproef. En daarom zijn de uitkomsten natuurlijk ook betrouwbaar. Helaas wordt er meestal niet bij uitgelegd waarop deze bewering is gebaseerd. Soms kunnen we ons afvragen of de bewering wel ergens op is gebaseerd.


Representatief = Geen selectief mechanisme

Representativiteit betekent dat er bij de selectie van de steekproef geen mechanisme is gebruikt dat bepaalde personen bevoordeeld of benadeeld heeft. Er waren geen selectieve krachten aan het werk. Onder deze interpretatie valt een aselecte steekproef met gelijke kansen voor iedereen. Maar een loting die met 50% kans alle mannen oplevert en met 50% kans alle vrouwen, is dan ook representatief. Dat is toch niet een steekproef die we graag willen hebben.


Representatief = Miniatuur van de populatie

Een steekproef is representatief als hij een miniatuur van de populatie is. Een soort schaalmodel dus. Alle eigenschappen (verhoudingen) van de populatie moeten je in de steekproef terug vinden. Consequent vasthouden aan deze voorwaarde is vooral bij kleine steekproeven niet haalbaar. Er zijn dan teveel combinaties van kenmerken te bedenken (bijv. een hoog opgeleide, gescheiden, allochtone vrouw, tussen de 50 en 60 jaar, wonend in Friesland, enz), die allemaal met de juiste percentages in de steekproef moeten zitten.


Representatief = Groep typische vertegenwoordigers

De steekproef is representatief want hij is samengesteld uit vertegenwoordigers of afgevaardigden die 'typisch' zijn voor de groep. De term 'representatief' staat dan meer voor de personen dan voor de steekproef als geheel. Begrippen als 'Jan Modaal' of 'Jan met de pet' zijn wat meer informele vertalingen van dit begrip. Probleem hierbij is dat een dergelijke steekproef alleen uitspraken doet over de 'gemiddelde mens' en onvoldoende rekening houdt met de verschillen die tussen mensen kunnen bestaan.


Representatief = Houdt rekening met variatie in de populatie

Representatief betekent dat we alle variatie die in de populatie zit, ook in de steekproef kunnen terugvinden. De steekproef bevat dus niet alleen 'typische' personen maar ook 'atypische' personen. Deze interpretatie biedt onvoldoende houvast om in de praktijk betrouwbare uitspraken te kunnen doen over de populatie.


Representatief = Geloot met gelijke kansen

Representativiteit wordt soms ook gekoppeld aan de loting van de steekproef. Representativiteit houdt dan in dat personen door loting in de steekproef zijn getrokken, en bovendien dat alle personen dezelfde kans hebben gehad op selectie. Merk hierbij op dat de aselecte steekproef slechts één manier is om zo'n steekproef te trekken. Het kan bijvoorbeeld ook met een gestratificieerde steekproef.


Representatief = Goed genoeg

Een steekproef is representatief is als hij goed genoeg is voor het doel waarvoor we hem trekken. Dit is een erg vage interpretatie. Een voorbeeld is een onderzoek waarin we willen aantonen dat een bepaald (zeldzaam) verschijnsel zich voordoet in een populatie. Dan doet het er niet toe hoe we de steekproef trekken, als het verschijnsel zich maar voordoet in de steekproef.


Betere definitie: Representatief met betrekking tot ...

Als we willen dat representatief betekent dat we betrouwbare uitspraken kunnen doen over de populatie, dan moet de voorkeur uitgaan naar de interpretatie 'geloot met gelijke kansen'. Immers, we weten dan zeker dan iedereen dezelfde kans heeft gehad om in de steekproef te komen, dat niemand bevoordeeld of benadeeld is, en dat de steekproef daarom een goede afspiegeling van de populatie is.

Helaas is het zo dat zich in de praktijk nog allerlei problemen kunnen voordoen. Eén van die problemen is non-respons. Personen zijn weliswaar in de steekproef geloot, maar allerlei redenen (weigering, niet-thuis, niet-in-staat) krijgen we niet de gewenste gegevens. De kans om gegevens over een persoon te krijgen is dan niet meer alleen afhankelijk van de steekproeftrekking maar ook van zijn of haar gedrag. Als de respons vooral laag is bij bepaalde groepen, dan zijn die ondervertegenwoordig in de steekproef en wordt dus de representativiteit aangepast.

Gezien de hierboven beschreven problemen rondom het begrip 'representatief' geven we de voorkeur aan een geheel andere definitie. We het hebben het alleen nog over representativiteit met betrekking tot een specifiek kenmerk. We zeggen dan, bijvoorbeeld, dat de steekproef representatief is met betrekking tot het kenmerk geslacht. Daarmee bedoelen we dat de percentages mannen en vrouwen overeenkomen met de percentages mannen en vrouwen in de populatie. En de steekproef is representatief met betrekking tot leeftijd als de leeftijdsverdeling in de steekproef gelijk is aan de leeftijdsverdeling in de populatie.

De achterliggende gedachte is dat als de steekproef representatief is met betrekking tot zoveel mogelijk kenmerken, hij het wellicht ook wel is met betrekking tot de kenmerken die we aan het onderzoeken zijn.


Voorbeeld: een luisteronderzoek

In een online-onderzoek vragen we naar het geslacht en de leeftijd van de respondenten. Omdat we de verdeling over de geslachten en over de leeftijd in de gehele bevolking kennen, kunnen we de verdelingen van beide kenmerken voor de steekproef vergelijken met die in de populatie.

  Man Vrouw   Jong Middelb Oud
Populatie 50% 50%   30% 40% 30%
Steekproef 51% 49%   60% 30% 10%

 

De steekproef bestaat voor 51% uit mannen en 49% uit vrouwen. Die percentages liggen dicht in de buurt van de percentages in de populatie. We kunnen de steekproef dus representatief noemen met betrekking tot geslacht.

Kijken we naar leeftijd, dan is er wat mis. Er zitten veel meer jongeren en veel minder ouderen dan verwacht in de steekproef. De steekproef is dus niet representatief met betrekking tot leeftijd.