Data gap analysis voor botanische literatuur en collecties

Sinds de start van de digitalisering van waarnemingen eind jaren ‘80 zijn soortenorganisaties bezig met het toevoegen van nieuwe en historische waarnemingen aan databanken. De oprichting van de Nationale Databank Flora en Fauna en GBIF hebben de vraag naar waarnemingen voor onderzoek doen toenemen. Ook is er inmiddels zo’n grote hoeveelheid data verzameld, dat het aantal mogelijke toepassingen ook vergroot is. Met het digitaliseren zitten we nu in de eindfase. De afgelopen jaren zijn veel grote digitaliseringsprojecten afgerond, voor veldnotities (streeplijsten), publicaties en collecties.

In dit project kijken we naar wat er is gedaan aan het ontsluiten van historische waarnemingen, en wat er nog moet gebeuren om de kwaliteit en herkenbaarheid van de data te verbeteren. Zo maken we een compleet overzicht van alle gedigitaliseerde en de belangrijkste nog te digitaliseren bronnen. Doel is om tot een compleetheid van circa 95% van alle historische bronnen te komen, zodanig dat het haalbaar is om deze op een redelijke termijn te digitaliseren en de bijdrage niet teveel dubbelt ten opzichte van andere bronnen.

Technisch gezien maken we een workflow voor het digitaliseren en ontsluiten van data in GBIF en de NDFF. Ook voeren we een pilot uit om een betere inschatting te maken van de tijd en de kosten voor het digitaliseren van de resterende bronnen. Het project levert dus ook nieuwe gedigitaliseerde waarnemingen op, namelijk alle plantenwaarnemingen uit de Prodromus Florae Batavae (1840) en paddenstoelenwaarnemingen uit de tijdschriftenreeks Nederlands Kruidkundig Archief.