Het kost heel wat energie om energiegegevens te verzamelen

GISOD.nl is op verschillende terreinen actief. Zowel nationaal als internationaal helpen wij bedrijven en organisaties bij het structureren van hun eigen databronnen, het vinden van nieuwe databronnen en het combineren van databronnen. Soms gaat het om kleine projecten waar we klanten bijvoorbeeld helpen bij het controleren van hun adresbestanden met een actuele versie van de BAG. Maar steeds vaker gaat het ook om complexere projecten zoals het optimaliseren van de bagage afhandeling op Schiphol.

Het merendeel van onze projecten start vaak met het opzoek gaan naar beschikbare (open) databronnen en het in kaart brengen de data die onze klanten zelf al hebben verzameld. Dat laatste is vaak nog niet eenvoudig. Zeker bij wat grotere organisaties zien we dat informatie verspreid is over verschillende systemen en databases. Daarnaast hebben ze vaak minstens zoveel ongestructureerde informatie in de vorm van Excel, Word en PDF bestanden.

Recentelijk zijn we gestart met het begeleiden van het opzetten van grootschalige zonneparken in Nederland. Wij helpen bedrijven onder andere bij het bepalen van de optimale locatie voor dergelijke zonneparken. Een van de bepalende factoren is de afstand van een beoogde locatie tot de dichtstbijzijnde aansluiting op het elektriciteitsnetwerk. Een andere factor is de mogelijkheid opgewekte energie lokaal af te kunnen zetten, direct of indirect in de vorm van lokale participatie.

Om onze klanten zo goed mogelijk te helpen bij het bepalen van geschikte locaties zijn wij opzoek gegaan naar informatie over het elektriciteitsnetwerk. En zoals vaker bij het zoeken naar informatie op het internet loop je ook tegen dingen aan waar je niet direct opzoek naar bent, maar die bij nader onderzoek toch interessant blijken te zijn. In dit geval liepen wij bij toeval tegen informatie aan over het energieverbruik van kleinverbruikers op het niveau van 6 cijferige postcodes (gas tot en met een capaciteit van 40 m3/h en elektriciteit tot en met een capaciteit van 3x80 ampère).

Even los van de vraag wat je met deze data kunt doen is een van de eerste vragen of het ook landsdekkend is? Na even zoeken blijkt dat inderdaad het geval. Even zoeken....ja...elke netbeheerder heeft op zijn eigen site bestanden staan met informatie over het jaarlijkse verbruik van kleinverbruikers. Bij de ene direct te vinden, bij de andere naar wat beter zoeken. Dan de volgende vraag: is de data van de acht verschillende netwerkbeheerders vergelijkbaar? Ook in dit geval is het antwoord ja, maar de interpretatie van CSV (Comma-Separated Value) is niet bij elke netbeheerder hetzelfde. Maar naar even prutsen is ook dit probleem snel verholpen en kunnen we de data inlezen (ruim 50 bestanden).

Na het inlezen van de data valt op dat de ene netwerkbeheerder de aanduiding van netbeheerders in tekst aan biedt  terwijl de ander doet dat in codes. Of bij de een straatnamen in hoofdletters en kwantitatieve gegevens in gehele getallen, bij de ander in kleine letters en met 2 posities achter de komma. Of: attribuut wel gedefinieerd maar niet of slechts gedeeltelijk gevuld.

Dan komt het leuke gedeelte.....is de data van alle netbeheerders over alle jaren volledig en juist ? Om dat te kunnen beoordelen hebben we vergelijkingen gemaakt van de data met andere databronnen. Bijvoorbeeld met de BAG en CBS data om te checken of van alle woonplaatsen gegevens zijn opgenomen en of de gehanteerde postcodes juist zijn en bestaan. Maar ook hier zien we dat niet alle netbeheerders gebruik maken van de meest recente BAG gegevens en bijvoorbeeld niet de officiële schrijfwijze van straatnamen toepassen.

Uiteindelijk hebben we een van onze klanten blij kunnen maken met een landsdekkend en bruikbaar bestand met data over kleinverbruikers. Door een koppeling naar de actuele BAG adresgegevens hebben we niet alleen een indruk over volledigheid en juistheid maar is het ook mogelijk om los van wie de netbeheerder is op diverse niveaus gemiddelde verbruikscijfers per jaar per aansluiting te bepalen. Maar zoals je hebt kunnen lezen gaat dat niet vanzelf. Onze drie tips voor bedrijven en organisaties die hun data beschikbaar willen stellen als open data:

Vindbaarheid   Zorg ervoor dat je potentiele gebruikers van data de data makkelijk kunnen vinden.

Bruikbaarheid  Probeer zoveel mogelijk aan te sluiten bij bijvoorbeeld landelijke basisregistraties zoals de BAG. Dit vergroot de bruikbaarheid van de data. En probeer actueel te blijven.

Standaarden    Zorg ervoor dat je gebruik maakt van dezelfde standaarden.

Nu wij een totaal, landsdekkend bestand over diverse jaren hebben biedt dit weer nieuwe toepassingsmogelijkheden in aanvulling op de verbruikscijfers (en de ontwikkelingen daarin) op zich. Bijvoorbeeld het vergelijken van het verbruiksprofiel van een 6 cijferige postcode gebied met de kenmerken van de adressen en panden in dat gebied uit de BAG: ouderdom woningen, type woningen etc. Om hiermee aanvullende informatie over buurten te krijgen en om de verbruikscijfers verder te kunnen interpreteren en analyseren.

Wilt u meer weten neem dan contact met ons op.