donderdag 10 juli 2014

Schaduwbestanden

Iedereen heeft wel een Excel sheet met daarin gegevens die eigenlijk in het formele informatiesysteem moeten. Een schaduwbestand. Ik ontkom er ook niet aan. Ik zal enkele voorbeelden geven. Wij voeren zelf de cijfers in, in de studentenadministratie. In dat systeem mag je ook deelcijfers invoeren. Dat zijn cijfers van bijvoorbeeld werkstukken. Er is echter een probleem. Er mogen alleen voldoendes worden ingevoerd. Waarom weet ik niet. Niemand heeft me dat kunnen vertellen, maar je moet het er mee doen. Dus hebben we een schaduwadministratie waarin alle deelcijfers (dus ook de onvoldoendes) staan. Voor de studentenadministratie is een deelcijfer een cijfer gelijk of hoger dan 5.5. In onze eigen administratie mag een deelcijfer iedere waarde aannemen. Als het maar tussen 1 en 10 ligt. Ik heb ook lijsten van studenten per klas. Die kan ik ook uit ons systeem exporteren. Daarin staan alle studenten die voor een studie staan ingeschreven. Het zal u niet verbazen dat de presentielijsten die ik op basis hiervan maak anders zijn. Studenten geven soms aan dat ze niet meer op de lessen komen, omdat ze gestopt zijn. Maar het komt ook voor dat studenten van studierichting veranderen. En dat ze dus bij mij lessen volgen. In beide gevallen hoeft het niet zo te zijn dat deze veranderingen ook administratief zijn verwerkt. In mijn administratie staan studenten die ook informeel al zijn gestopt of overgestapt. In de officiële lijsten niet. Kortom een andere definitie. In mijn vorige werk moest ik uren boeken. In een prachtig Excel sheet hield ik bij hoeveel uren ik aan een project werkte. In het urenregistratiesysteem nam ik de uren op die ik officieel, volgens het contract, aan een project mocht werken. Ook hier weer twee definities: de uren die ik heb gewerkt in mijn Excel sheet, de uren die ik mag declareren in het urenregistratiesysteem. 
Schaduwbestanden ontstaan vaak omdat ze in een informatiebehoefte voorzien waarin de officiële systemen niet voorzien. Als oplossing wordt vaak voorgesteld om een database te maken waarvan iedereen gebruik gaat maken. Een canonieke database. Dat is goedkoper, het beheer van data is eenvoudiger, de data zijn van betere kwaliteit (actueel, consistent etc.) en al die schaduwbestanden kunnen eindelijk de deur uit. Wat ik met mijn voorbeelden wil duidelijk maken is dat dit helaas niet gaat werken. Schaduwbestanden bevatten data die wel erg lijken op de data in de officiële databases, maar ze zijn vaak toch net anders. Andere taken zorgen voor andere informatiebehoeften en dus voor andere definities van data. Semantische verschillen zijn principieel niet uit te roeien. Anders worden alle andere waarheden als niet relevant of, nog erger, als niet bestaand beschouwd. Gelukkig hebben we Excel. Dat is de grote redder van de canonieke database. Zo kunnen we toch nog doen wat we willen doen. Ik vraag iedereen om eens de proef op de som te nemen. Ga maar eens na welke data er in de Excel sheets staan en wat de exacte definities zijn van die data. Ik voorspel dat heel veel data net iets anders gedefinieerd zijn als de data die in de officiële systemen zit. Daardoor zijn de Excel sheets ook niet overbodig. Koester de verschillen. Ze zorgen voor pluriformiteit in uw organisatie. En voor medewerkers die de informatie gebruiken die ze echt nodig hebben.

Dit artikel verscheen eerder in Ingovernment