Overheidsdata voor wetenschappelijk onderzoek verzamelen
Voor je data kan analyseren, zal je natuurlijk eerst data moeten hebben om te analyseren. Op deze pagina gaan we nader in op hoe je overheidsdata kan verzamelen voor wetenschappelijk onderzoek.
Stap 0: Wat wil je onderzoeken?
Het beginpunt van je zoektocht naar data is natuurlijk jouw onderzoek. Wat zijn jouw onderzoeksvragen, en wat voor soort overheidsinformatie heb je nodig om deze vragen te beantwoorden?
Stap 1: Welke overheidsinformatie zoek je?
Als je weet wat je wil onderzoeken, kan je gaan kijken naar welke overheidsinformatie je precies nodig hebt. Bij deze eerste stap is het belangrijk om drie zaken voor jou vast te stellen:
- Heeft de overheid de informatie waar je naar zoekt? Moet de overheid bijvoorbeeld deze gegevens verzamelen bij de uitvoering van een taak of wettelijke plicht?
- In welke vorm wordt deze informatie (waarschijnlijk) door de overheid verzameld?
- Bij welke overheden is deze informatie te vinden?
Een zoektocht naar de juiste informatie begint daarom met een stukje vooronderzoek. Hierbij kan het Register van Overheidsorganisaties van pas komen, en natuurlijk relevante wetgeving.
Stap 2: Waar is de data mogelijk te vinden?
Nu je weet naar wat voor informatie je op zoek bent, kan je hiernaar op zoek gaan. Vaak zal je de documenten die je wil analyseren zelf bij elkaar moeten verzamelen uit verschillende bronnen.
De allereerste vraag is of de data die je zoekt niet al openbaar is. Het startpunt van die zoektocht kun je bijvoorbeeld beginnen bij het bestuursorgaan waarvanje vermoedt dat ze ‘bronhouder’ is. Openbare informatie is niet perse goed verzameld in een dataset overigens, daarover meer in stap 3.
Het kan zo zijn dat de documenten waar je naar op zoek bent wel al opgenomen zijn in grotere verzamelingen, zoals alle uitspraken of alle kamerstukken. WetSuite heeft een catalogus met een aantal datasets waar je wellicht kan vinden wat je zoekt. Mocht je niets in de WetSuite datacatalogus kunnen vinden, dan zijn het Dataregister van de Nederlandse overheid en het dataregister van de Europese Unie ook goede plekken om te kijken of de gegevens die je zoekt al beschikbaar zijn in een bestaande dataset. Probeer hierbij altijd in het oog te houden dat er waarschijnlijk geen kant en klare dataset is voor jouw onderzoek, maar je wel door bestaande datasets te filteren en combineren een heel eind komt. Tot slot kan je natuurlijk ook een zoekmachine gebruiken om de data te vinden. Belangrijk om te weten is echter dat niet alle openbare informatie ook geïndexeerd is door zoekmachines, en daardoor niet vindbaar zijn.
Omdat veel openbare informatie niet goed vindbaar is, is het een optie om eerst ‘de weg’ te vragen naar al openbare data. Je kunt ook beginnen met het construeren van de logische weg die de informatie heeft afgelegd. Bij welke bestuursorganen is de informatie gemaakt, bewerkt of behandeld? Is het bijvoorbeeld in een volksvertegenwoordigend orgaan behandeld dan bestaan er soms verslagen van de vergadering, schriftelijk of in de vorm van een video. Ook kunnen er nog externe partijen bij betrokken zijn geweest, bijvoorbeeld in een publiek-private samenwerking.
Zelfs als je het volledige plaatje nog niet hebt kun je dus al wel beginnen met je zoektocht bij het bestuursorgaan dat (een deel van) de data volgens jou zou moeten hebben. De Woo-contactpersoon aldaar kan je vervolgens helpen om andere relevante plekken te vinden. Dit is een vraag om informatie en nog geen Woo-verzoek! Om een Woo-contactpersoon te vinden kan het helpen om de Woo-index, onderdeel van het Register van Overheidsorgnisaties, te raadplegen.
Samengevat heb je dus drie belangrijke plekken waar je op zoek kan gaan naar je informatie:
- Bij de vermoedelijke bronhouder
- In catalogi zoals de WetSuite datasetcatalogus, data.overheid.nl of data.europa.eu
- Via zoekmachines
Stap 3: Een Woo- en/of Who-verzoek indienen
Als de eerste twee stappen niets op hebben geleverd is een goede vraag om te stellen of de informatie die je zoekt wel bestaat. Wordt de taak wel uitgevoerd of wordt de data wel verzameld? Vaak komt het ook voor dat informatie verspreid ligt over meerdere bestuursorganen. Dit wordt hét moment om de Woo in te gaan zetten.
a. Neem contact op met de bronhouder waarvan je denkt dat ze er iets over zouden kunnen weten. Stel je vraag als een Woo-verzoek op. Dat betekent in eerste instantie dat je jouw informatieverzoek liever iets te ruim formuleert dan te krap. Maar let op: Als je de vraag stelt, geef mij maar alles, dan zal de eerste reactie van de ambtenaar niet blijdschap zijn. Hou er dus rekening mee dat er een mens aan de andere kant zit. Biedt daarom ook aan om al direct om tafel te gaan zitten, met de druk van een Woo-verzoek kan het zijn dat het gesprek anders verloopt dan wanneer je een gewone informatievraag stelt.
Denk hierbij ook alvast vooruit over de manier waarop je de informatie nodig hebt. Alvast een beroep doen op de Who is mogelijk. De Who geldt alleen voor openbare informatie, daarom kun je dit verzoek koppelen door te verzoeken om de geopenbaarde documenten in een herbruikbaar formaat beschikbaar te stellen. Geef daarbij ook aan wat voor jouw doel ‘herbruikbaar’ betekent. Dus bijvoorbeeld, geen pdf bestanden maar word bestanden.
b. Breid je eigen zoektocht uit naar aanverwante bronhouders (overheidsorganisaties of private organisaties). Hoewel het bestuursorgaan waar je het verzoek hebt gedaan jouw verzoek ook moet doorzenden als ze de informatie zelf niet hebben kan er natuurlijk sprake zijn van meerdere bestuursorganen die de informatie hebben.
De Wet open overheid (Woo) en Wet hergebruik van overheidsinformatie (Who) voor wetenschappelijk onderzoek
Mochten de documenten waar je naar op zoek zijn niet gepubliceerd zijn, of niet in een makkelijk herbruikbaar formaat beschikbaar zijn, dan kunnen de Wet open overheid (Woo) en de Wet hergebruik van overheidsinformatie (Who) mogelijk uitkomst bieden. Op basis van de Woo zijn overheden verplicht bepaalde documenten te publiceren. De Who stelt vervolgens eisen aan dat zulke openbare gegevens ook hergebruikt moeten mogen en kunnen worden.
We gaan hier kort in op wat de Who inhoudt, en daarna hoe deze nuttig kan zijn voor juridisch onderzoekers.
Wat is de Who?
De Wet hergebruik van overheidsinformatie (Who) is een implementatie van de Open Data Richtlijn van de Europese Unie (Richtlijn (EU) 2019/1024 van het Europees Parlement en de Raad van 20 juni 2019 inzake open data en het hergebruik van overheidsinformatie (herschikking)). De wet komt er op neer dat informatie die openbaar is op grond van de wet ook hergebruikt mag worden door iedereen. Bijvoorbeeld dus voor wetenschappelijk onderzoek.
De Who werkt dan ook complementair aan de Wet open overheid (Woo). De Woo gaat immers vooral over dat bepaalde overheidsdocumenten openbaar gemaakt moeten worden. De Who geeft vervolgens regels over hoe deze openbare informatie beschikbaar gesteld moet worden en dat hergebruik ervan mogelijk moet zijn. Als documenten op grond van de Woo openbaar moeten zijn, is een los Woo-verzoek naast je Who-verzoek in principe niet nodig. Het kan wel nuttig zijn om te benadrukken dat je verzoek gebaseerd is op zowel de Woo als de Who.
De Who voor onderzoeksdoeleinden
De informatie die op grond van de Who hergebruikt wordt, moet beschikbaar worden gesteld zoals die bij de organisatie aanwezig zijn. Daarnaast moet de informatie ook, voor zover mogelijk en passend, beschikbaar worden gemaakt in een elektronisch, open, toegankelijk, vindbaar, herbruikbaar en machinaal leesbaar formaat, inclusief metadata.
Deze verplichtingen over de manier waarop informatie wordt aangeleverd is precies wat de Who zo nuttig kan maken voor onderzoeksdoeleinden. In plaats van documenten zelf te crawlen van websites, of handmatig gescande documenten uit Woo-verzoeken door te gaan, kan je verzoeken dat je de informatie op een manier aangeleverd krijgt die werkbaarder is voor automatische verwerking in je onderzoek.
In de ideale wereld zorgt de Who er dus voor dat je makkelijker aan een machinaal leesbare dataset kan komen. Dit verlaagt de drempel om NLP-technieken toe te passen in je onderzoek. Houdt echter wel realistische verwachtingen bij het doen van een Who-verzoek: de behandeling ervan kan lang duren, en je zal waarschijnlijk altijd zelf nog enige verwerking van de gegevens moeten doen om deze zelf te kunnen gebruiken.
Belangrijk om te weten is verder dat de Who een stuk minder bekend is dan de Woo. De behandeling van je verzoek kan daardoor een stuk minder soepel verlopen.
Voorbereiden van je Who-verzoek
Vergewis je vóór het indienen van je Who-verzoek van het volgende:
- Naar welke informatie ben je op zoek?
- Bij welke overheidsorganisatie is deze informatie te vinden?
- Op welke wettelijke grondslag berust de openbaarheid van de informatie? Als er niets specifiek geregeld is over de informatie, kijk dan in de Woo. Wordt de informatie al openbaar gemaakt maar niet in een herbruikbaar formaat, dan kan je wellicht aannemen dat het bestuursorgaan dit actief openbaar gemaakt heeft onder art. 3.1 Woo.
- Is de Who van toepassing? Controleer altijd art. 2 Who om te kijken of wat je zoekt niet uitgezonderd is van de Who.
- In wat voor formaat zou je de informatie het liefst ontvangen?
Kosten van een Who-verzoek
Belangrijk is dat voor hergebruik van gegevens in beginsel geen vergoeding gevraagd mag worden (art. 6 lid 1 Richtlijn (EU) 2019/1024, art. 9 Who). Alleen marginale kosten voor vermenigvuldiging, verstrekking, verspreiding, anonimisering en bescherming van commerciële vertrouwelijkheid kunnen worden gevraagd. Worden er kosten gevraagd in reactie op een hergebruikverzoek? Dan kan je op dat punt in bezwaar of beroep gaan.
Algemene tips voor het gebruik van de Who
- Maak duidelijk dat je open staat voor overleg met de overheidsorganisatie, en denk constructief mee hoe zij het beste aan het verzoek kunnen voldoen. Mogelijk kunnen ze al een selectie maken voor je, en scheelt dat iedereen tijd.
- Informatie die binnen een overheidsorganisatie wordt verwerkt, is vaak al in een herbruikbaar formaat. Het publiceren in datzelfde formaat is vaak makkelijker dan omzetten in een PDF, zoals vaak gedaan wordt bij Woo-verzoeken.
Meer informatie over de Who
- De Handleiding Herziene Who nav de Wet implementatie open data richtlijn is een handleiding voor overheidsorganisaties opgesteld door BZK, VNG, IPO, UvW, Nationaal Archief en Kenniscentrum Europa Decentraal. Deze handleiding kan een inzicht geven in hoe een overheidsorganisatie met je verzoek om kan gaan.
- “Hergebruik van overheidsinformatie” op europadecentraal.nl: https://europadecentraal.nl/onderwerp/digitale-overheid/data-en-technologie/hergebruik-overheidsinformatie/
Video’s OSF
Hoe begin ik als ik onderzoek wil doen naar tekstuele overheidsdata?
Wat te doen als verschillende zoekmethoden niets opleveren?
Waar vind ik overheidsdocumenten die ik als dataset kan onderzoeken?
Veelgestelde vragen
Welke mogelijkheden zijn er als je niet de informatie ontvangt waar je om vraagt?
Waar moet ik op letten als ik als juridisch wetenschapper gebruik wil maken van generatieve AI?
Wat te doen bij geen antwoord op een Woo- of Who-verzoek?
Hoe kom ik aan een dataset?
Last updated: 18-Dec-2024