Overheidsdata voor wetenschappelijk onderzoek verzamelen
Voor je data kan analyseren, zal je natuurlijk eerst data moeten hebben om te analyseren. Op deze pagina gaan we nader in op hoe je overheidsdata kan verzamelen voor wetenschappelijk onderzoek. Hierbij besteden we ook aandacht aan de wettelijke rechten die je hebt om informatie van de overheid te ontvangen op grond van de Wet open overheid (Woo), en de wettelijke rechten die je hebt om zulke informatie te hergebruiken op grond van de Wet hergebruik van overheidsinformatie (Who).
Het is hierbij eerst van belang om het onderscheid te maken tussen een verzoek om informatie en een informatieverzoek onder de Wet open overheid, een Woo-verzoek.
Je kunt een beroep doen op de Wet open overheid als je op zoek bent naar bestuurlijke informatie. Daarbij wordt in de wet en in de praktijk vaak de term ‘documenten’ gebruikt. Documenten kunnen volledige stukken tekst zijn, vol informatie, of het kan een enkel bericht zijn dat zonder context nog geen informatie biedt. Onder dit begrip vallen ook datasets die bestaan uit enkel cijfers.
Wil je echter een antwoord op je vraag in de vorm van informatie, bijvoorbeeld een vraag over waarom X wel en Y niet gedaan wordt? Dan doe je een verzoek om informatie. Hoe je de vraag stelt bepaalt dus hoe en wat je ontvangt.
Er is dus een belangrijk onderscheid te maken tussen een informatieverzoek en een Woo-verzoek. Bij een Woo-verzoek mag de overheid niet bepalen wat jij als verzoeker als ‘informatie’ krijgt maar ontvang je de documenten (deels gelakt). Nadeel is dat je dan zelf de informatie (de context) zelf moet vinden in de documenten.
Verder is belangrijk dat het doen van een informatieverzoek of Woo-verzoek gratis moet zijn. Er mogen wel kosten in rekening gebracht worden als je vraagt om fysieke stukken, de printkosten.
Stap 0: Wat wil je onderzoeken?
Het beginpunt van je zoektocht naar data is natuurlijk jouw onderzoek. Wat zijn jouw onderzoeksvragen, en wat voor soort overheidsinformatie heb je nodig om deze vragen te beantwoorden?
Stap 1: Welke overheidsinformatie zoek je?
Als je weet wat je wil onderzoeken, kan je gaan kijken naar welke overheidsinformatie je precies nodig hebt. Bij deze eerste stap is het belangrijk om drie zaken voor jou vast te stellen:
- Heeft de overheid de informatie waar je naar zoekt? Moet de overheid bijvoorbeeld deze gegevens verzamelen bij de uitvoering van een taak of wettelijke plicht?
- In welke vorm wordt deze informatie (waarschijnlijk) door de overheid verzameld?
- Bij welke overheden is deze informatie te vinden?
Een zoektocht naar de juiste informatie begint daarom met een stukje vooronderzoek. Hierbij kan het Register van Overheidsorganisaties van pas komen, en natuurlijk relevante wetgeving.
Stap 2: Waar is de data mogelijk te vinden?
Nu je weet naar wat voor informatie je op zoek bent, kan je hiernaar op zoek gaan. Vaak zal je de documenten die je wil analyseren zelf bij elkaar moeten verzamelen uit verschillende bronnen.
Mogelijk is de data die je zoekt al openbaar. Echter, openbaar betekent niet dat je het makkelijk kunt vinden. Het is dan ook aan te raden om eerst ‘de weg’ te vragen naar al openbare data. Je begint dan bij het bestuursorgaan waarvan je vermoedt dat deze ‘bronhouder’ is. Openbare informatie is niet per se goed verzameld in een dataset overigens, daarover meer in stap 3.
Je kunt ook beginnen met het construeren van de logische weg die de informatie heeft afgelegd. Bij welke bestuursorganen is de informatie gemaakt, bewerkt of behandeld? Is het bijvoorbeeld in een volksvertegenwoordigend orgaan behandeld dan bestaan er soms verslagen van de vergadering, schriftelijk of in de vorm van een video. Ook kunnen er nog externe partijen bij betrokken zijn geweest, bijvoorbeeld in een publiek-private samenwerking.
Zelfs als je het volledige plaatje nog niet hebt kun je dus al wel beginnen met je zoektocht bij het bestuursorgaan dat (een deel van) de data volgens jou zou moeten hebben. De Woo-contactpersoon aldaar kan je vervolgens helpen om andere relevante plekken te vinden. Dit is een vraag om informatie en nog geen Woo-verzoek! Om een Woo-contactpersoon te vinden kan het helpen om de Woo-index, onderdeel van het Register van Overheidsorgnisaties, te raadplegen.
Het kan zo zijn dat de documenten waar je naar op zoek bent wel al opgenomen zijn in grotere verzamelingen, zoals alle uitspraken of alle kamerstukken. WetSuite heeft een catalogus met een aantal datasets waar je wellicht kan vinden wat je zoekt. Mocht je niets in de WetSuite datacatalogus kunnen vinden, dan zijn het Dataregister van de Nederlandse overheid en het dataregister van de Europese Unie ook goede plekken om te kijken of de gegevens die je zoekt al beschikbaar zijn in een bestaande dataset. Probeer hierbij altijd in het oog te houden dat er waarschijnlijk geen kant en klare dataset is voor jouw onderzoek.
Tot slot kan je natuurlijk ook een zoekmachine gebruiken om de data te vinden. Belangrijk om te weten is dat niet alle openbare informatie geïndexeerd is door zoekmachines en dus niet vindbaar.
Samengevat heb je dus drie belangrijke plekken waar je op zoek kan gaan naar je informatie:
- Bij de vermoedelijke bronhouder
- In catalogi zoals de WetSuite datasetcatalogus, data.overheid.nl of data.europa.eu
- Via zoekmachines
Stap 3: Een Woo- en/of Who-verzoek indienen
Als de eerste twee stappen niets op hebben geleverd is een goede vraag om te stellen of de informatie die je zoekt wel bestaat. Wordt de (wettelijke) taak wel uitgevoerd of wordt de data wel verzameld? Of ligt jouw gewenste dataset als losse delen verspreid bij meerdere bestuursorganen. Dit wordt hét moment om de Woo in te gaan zetten.
Neem (nogmaals) contact op met de bronhouder waarvan je denkt dat ze er iets over zouden kunnen weten. Stel je vraag dit keer als een Woo-verzoek op. Dat betekent in eerste instantie dat je jouw informatieverzoek liever iets te ruim formuleert dan te krap. Maar let op: als je de vraag stelt “geef mij maar alles”, dan zal de eerste reactie van de ambtenaar niet blijdschap zijn. Hou er dus rekening mee dat er een mens aan de andere kant zit. Biedt daarom ook aan om al direct om tafel te gaan zitten, met de druk van een Woo-verzoek kan het zijn dat het gesprek anders verloopt dan wanneer je een gewone informatievraag stelt.
Denk hierbij ook alvast vooruit over de manier waarop je de informatie nodig hebt. Alvast een beroep doen op de Who is mogelijk. De Who geldt alleen voor openbare informatie, daarom kun je dit verzoek koppelen aan het Woo-verzoek door te verzoeken om de geopenbaarde documenten in een herbruikbaar formaat beschikbaar te stellen. Geef daarbij ook aan wat voor jouw doel ‘herbruikbaar’ betekent. Dus bijvoorbeeld, geen pdf bestanden maar Word (docx) bestanden of odt bestanden
Daarnaast kan je je zoektocht uitbreiden naar aanverwante bronhouders (overheidsorganisaties of private organisaties). Hoewel het bestuursorgaan waar je het verzoek hebt gedaan jouw verzoek ook moet doorzenden als ze de informatie zelf niet hebben kan er natuurlijk sprake zijn van meerdere bestuursorganen die de informatie hebben.
Stap 4: de Wet hergebruik van overheidsinformatie (Who) nader uitgelegd
De Wet hergebruik van overheidsinformatie (Who) geeft iedereen het recht om openbare overheidsinformatie te hergebruiken. De Who is dus ook van toepassing op informatie die op grond van de Woo openbaar gemaakt moet worden. Van de Who wordt minder vaak gebruik gemaakt, deels omdat deze wet weinig bekend is, en deels omdat voor de meeste doeleinden de informatie die openbaar beschikbaar is gemaakt (via websites of gepubliceerde PDF documenten) prima te gebruiken is. Als je echt een machine-leesbare dataset wil maken, zijn zulke vormen van informatie minder bruikbaar. Dan wil je de informatie in een herbruikbaar bestandsformaat ontvangen, zoals in een spreadsheet, docx of odt bestand.
Voor een overheidsorganisatie is een vraag op grond van de Who vaak ook nieuw. Je redelijk opstellen en ze de tijd bieden om het een en ander uit te zoeken helpt om de relatie goed te houden. We gaan hier kort in op wat de Who inhoudt, en daarna hoe deze nuttig kan zijn voor juridisch onderzoekers.
De Wet hergebruik van overheidsinformatie (Who) voor wetenschappelijk onderzoek
De Wet hergebruik van overheidsinformatie (Who) is een implementatie van de Open Data Richtlijn van de Europese Unie (Richtlijn (EU) 2019/1024 van het Europees Parlement en de Raad van 20 juni 2019 inzake open data en het hergebruik van overheidsinformatie (herschikking)). De wet komt erop neer dat informatie die openbaar is op grond van de wet ook hergebruikt mag worden door iedereen en dat de overheid dat moet ondersteunen.
De Who werkt dan ook complementair aan de Wet open overheid (Woo). De Woo gaat immers vooral over dat informatie openbaar gemaakt moeten worden. De Who geeft vervolgens regels over hoe deze openbare informatie beschikbaar gesteld moet worden en dat hergebruik ervan mogelijk moet zijn. Als documenten op grond van de Woo of andere wetgeving al openbaar moet zijn is een los Woo-verzoek naast je Who-verzoek in principe niet nodig.
In een Who verzoek vraag je om herbruikbare bestanden, maar vaak zijn de bestanden waar intern mee gewerkt wordt al herbruikbaar, die worden echter meestal niet gepubliceerd (hoewel dat ook op grond van de Woo gewenst is). Vragen naar deze bestanden kun je als alternatief bieden voor het arbeidsintensievere werk van de data omzetten naar precies het formaat dat jij nodig hebt, bijvoorbeeld herbruikbare excel bestanden.
Een Woo-verzoek kun je stellen zonder dat je aangeeft waarvoor je de informatie/data wil hebben. Als je hem combineert met een Who verzoek kan dit echter wel handig zijn om te delen, dan kan men met je meedenken over de mogelijkheden van omzetting voor hergebruik.
De Who voor onderzoeksdoeleinden
Op grond van de Who moet informatie, voor zover mogelijk en passend, beschikbaar worden gemaakt in een elektronisch, open, toegankelijk, vindbaar, herbruikbaar en machinaal leesbaar formaat, inclusief metadata.
Deze verplichting over de manier waarop informatie wordt gedeeld is precies wat de Who zo nuttig kan maken voor onderzoeksdoeleinden. In plaats van documenten zelf te crawlen van websites, of handmatig gescande documenten uit Woo-verzoeken door te gaan, kan je verzoeken dat je de informatie op een manier aangeleverd krijgt die werkbaarder is voor automatische verwerking in je onderzoek.
In de ideale wereld zorgt de Who ervoor dat je makkelijker aan een machinaal leesbare dataset kan komen. Dit verlaagt de drempel om NLP-technieken toe te passen in je onderzoek. Houdt echter wel realistische verwachtingen bij het doen van een Who-verzoek: de behandeling ervan kan lang duren, en je zal waarschijnlijk altijd zelf nog enige verwerking van de gegevens moeten doen om deze zelf te kunnen gebruiken.
Hou er rekening mee dat de Who een stuk minder bekend is dan de Woo. De behandeling van je verzoek kan daardoor een stuk minder soepel verlopen.
Voorbereiden van je Who-verzoek
Vergewis je vóór het indienen van je Who-verzoek van het volgende:
- Naar welke informatie ben je op zoek?
- Bij welke overheidsorganisatie is deze informatie te vinden?
- Op welke wettelijke grondslag berust de openbaarheid van de informatie? Als er niets specifiek geregeld is over de informatie, kijk dan in de Woo. Wordt de informatie al openbaar gemaakt maar niet in een herbruikbaar formaat, dan kan je wellicht aannemen dat het bestuursorgaan dit actief openbaar gemaakt heeft onder art. 3.1 Woo.
- Is de Who van toepassing? Controleer altijd art. 2 Who om te kijken of wat je zoekt niet uitgezonderd is van de Who.
- In wat voor formaat zou je de informatie het liefst ontvangen?
Kosten van een Who-verzoek
Belangrijk is dat voor hergebruik van gegevens in beginsel geen vergoeding gevraagd mag worden (art. 6 lid 1 Richtlijn (EU) 2019/1024, art. 9 Who). Alleen marginale kosten voor vermenigvuldiging, verstrekking, verspreiding, anonimisering en bescherming van commerciële vertrouwelijkheid kunnen worden gevraagd. Worden er kosten gevraagd in reactie op een hergebruikverzoek? Dan kan je op dat punt in bezwaar of beroep gaan.
Algemene tips voor het gebruik van de Who
- Maak duidelijk dat je open staat voor overleg met de overheidsorganisatie, en denk constructief mee hoe zij het beste aan het verzoek kunnen voldoen. Mogelijk kunnen ze al een selectie maken voor je, en scheelt dat iedereen tijd.
- Informatie die binnen een overheidsorganisatie wordt verwerkt, is vaak al in een herbruikbaar formaat. Het publiceren in datzelfde formaat is vaak makkelijker dan omzetten in een PDF, zoals vaak gedaan wordt bij Woo-verzoeken.
Meer informatie over de Who
- De Handleiding Herziene Who nav de Wet implementatie open data richtlijn is een handleiding voor overheidsorganisaties opgesteld door BZK, VNG, IPO, UvW, Nationaal Archief en Kenniscentrum Europa Decentraal. Deze handleiding kan een inzicht geven in hoe een overheidsorganisatie met je verzoek om kan gaan.
- “Hergebruik van overheidsinformatie” op europadecentraal.nl: https://europadecentraal.nl/onderwerp/digitale-overheid/data-en-technologie/hergebruik-overheidsinformatie/
Stap 5
Als het niet meezit dan zul je een langzame afhandeling van je verzoek tegenkomen of in het ergste geval, onwil om mee te werken. Een Woo-verzoek is echter een wettelijk verzoek waar termijnen op staan voor de afhandeling.
Het is daarbij altijd aan te raden om niet te snel je hakken in het zand te zetten; dat kan weerstand vergroten. Maar tegelijkertijd is het belangrijk dat je de rechtsmiddelen zoals de ingebrekestelling wel tijdig stuurt en het bezwaar en beroep instellen niet (te lang) uitstelt onder het mom van welwillend zijn.
Als juridisch onderzoeker heb je een extra optie naast de wegen van een burger. Je kan als wetenschapper namelijk bij het Adviescollege openbaarheid en informatiehuishouding (ACOI) vragen om bemiddeling van je Woo-verzoek. Zij bieden bemiddeling aan in de fase van bezwaar. Dit pauzeert de termijnen en kan een vastgelopen proces weer los trekken.
Tips om sneller informatie te krijgen:
- Leg afspraken en toezeggingen schriftelijk vast.
- Geef uitleg of specificeer je vraag indien het als omvangrijk of onduidelijk wordt geduid. Niet meewerken aan specificering kan ertoe leiden dat je verzoek buiten behandeling wordt gesteld.
- Maak afspraken om hele grote hoeveelheden data in stukken te ontvangen, hiermee kun jij alvast aan de slag en heeft het bestuursorgaan iets meer ruimte om langer te doen over het verstrekken van de informatie.
- Bij een aantal organisaties zoals het CBS kun je toegang krijgen tot een wetenschappelijke online werkomgeving waar je de data kunt gebruiken. Bij het CBS gaat het bijvoorbeeld om de microdata. Maar je kunt ook via andere portalen zoals op ODISSEI, toegang krijgen tot gesloten datasets.
- Neem contact op met Open State Foundation of SPOON, Expertisecentrum voor Woo-verzoekers, zij kunnen vaak ook helpen. Een kleine vraag is kosteloos, bij uitgebreider advies of hulp zitten er wel kosten aan verbonden.
Video’s OSF
Hoe begin ik als ik onderzoek wil doen naar tekstuele overheidsdata?
Wat te doen als verschillende zoekmethoden niets opleveren?
Waar vind ik overheidsdocumenten die ik als dataset kan onderzoeken?
Veelgestelde vragen
Welke mogelijkheden zijn er als je niet de informatie ontvangt waar je om vraagt?
Waar moet ik op letten als ik als juridisch wetenschapper gebruik wil maken van generatieve AI?
Wat te doen bij geen antwoord op een Woo- of Who-verzoek?
Hoe kom ik aan een dataset?
Last updated: 25-Mar-2025