Data validatie

Het valideren van data is een "big issue" bij GBIF en NLBIF. Momenteel ligt de verantwoordelijkheid voor de data kwaliteit bij de dataleveranciers. Middels handleidingen, trainingen, en tools worden dataleveranciers ondersteund bij het valideren en verbeteren van de kwaliteit van hun data. Bij een eerste dataleverantie levert NLBIF een datarapport met daarin vooral opmerkingen over data-technische onmogelijkheden zoals lege datavelden, tijdsaanduidingen die niet bestaan of locaties die niet kunnen kloppen.

Als datasets voor internationale publicatie worden geïndexeerd door GBIF dan worden taxonomische namen in een data set vergeleken met de namen in de Catalogue of Life (CoL) (http://www.catalogueoflife.org). Indien nodig wordt ontbrekende hogere taxonomische informatie aangevuld. Hetzelfde proces vindt plaats voor wat betreft geografische informatie. De geconstateerde fouten of onjuistheden kunnen worden afgelezen in de GBIF log-files waarmee iedere GBIF dataset automatisch wordt uitgerust. 

Er is een validatietool specifiek voor DarwinCore gestandaardiseerde data, Darwin Test, ontworpen door GBIF Spanje (http://www.gbif.es/darwin_test/Darwin_Test_in.php).