Verslag FAAD-studiedag Data-archivering

Het is een feestjaar voor het FAAD, we bestaan namelijk 25 jaar. Ook de MANAMA-opleiding archivistiek staat voor een nieuw tijdperk nadat we vorig jaar afscheid namen van Frank Scheelings als hoofd van de opleiding. Bart Ballaux neemt de fakkel over en wordt daarbij bijgestaan door drie nieuwe docenten: Erwin Steegen, Geert Leloup en (de eerste vrouw!) Jelena Dobbels. Hoewel de opleiding en het lesprogramma de laatste jaren wijzigingen heeft ondergaan, gaat men de komende jaren nog enkele verbeteringen doorvoeren. Zo wil men onder meer de vereisten voor de stages aanpakken. Pas afgestudeerden kunnen hierover meedenken en hun ervaringen te delen door zich aan te melden voor de focusgroep. 

Bart Ballaux brengt de studiedag op gang met een inleiding over de impact van het datagedreven werken. Volgens hem blijven de archivistische basisprincipes grotendeels overeind als het aankomt op data-archivering. Deze data moet eveneens geanalyseerd, geordend en bewaard worden. Een belangrijk element in het beheer is het bewaken van de kwaliteit aan de hand van procedures en meetsystemen. Daarnaast speelt de archivaris of informatiebeheerder een rol bij het inzichtelijk maken van de datastromen en moet hij toezien op een correct (her)gebruik en beheer (privacy, autorisaties) van de data. Bart nodigt ons vooral uit om een actieve rol op te nemen binnen onze organisatie op vlak van data-archivering. Probeer in samenwerking met collega’s de data veilig te stellen voor de toekomst, want niets doen zal automatisch tot informatieverlies leiden.

Een introductie over moderne data-architectuur werd gegeven door Michiel De Keyzer van PWC. Eén van de tendensen binnen data-architectuur die hij aanhaalt, is de loskoppeling van applicaties en data. De data blijven zo veel mogelijk in hun bronapplicatie zitten en worden opgehaald door of gevisualiseerd in andere applicaties. Databanken moeten ook steeds flexibeler ingezet kunnen worden en bereikbaar zijn via de cloud. Een goed beheer van data én zijn metadata zijn essentieel voor het opzetten van data-oplossingen binnen een organisatie. Opdat alle systemen op een goede manier met elkaar kunnen communiceren is het werken met standaarden essentieel, ook voor de data en metadata. Daarbij verwijst hij naar de OSLO-standaard die ontwikkeld werd door de Vlaamse overheid en (bijna) geïmplementeerd is binnen Digitaal Archief Vlaanderen. Op die manier worden de data een echte troef voor je organisatie.

Vanuit Lissabon gaf Luis Faria van Keep Solutions ons meer uitleg over concepten, strategieën en tools voor data-archivering. In zijn verhaal ligt de focus vooral op relationele databases. Keep Solutions promoot de strategie van het converteren van data in een archiveringsformaat en het  inkapselen van alle documentatie die latere preserveringsacties mogelijk maken. Daarbij maken ze gebruik van SIARD (Software Independent Archiving of Relational Databases), een open-source archiveringsformaat voor relationele databases. Dit op internationale standaarden gebaseerde formaat wordt gebruikt en ondersteund door de Europese Commissie. Om de archivering van databases in de praktijk om te zetten, heeft Keep Solutions de Database Preservation Toolkit (DBPTK) ontwikkeld. Met de tool zet je een relationele database om naar een archiveringsformaat en kan je het valideren en doorzoeken. Het SIARD-pakket is vervolgens klaar voor opname in een e-depot.

Jef Scheepers lichtte nadien zijn thesis over sensordata uit 2019 toe. Daarbij bestudeerde hij data die wordt geregistreerd door sensoren (zoals klimaatsensoren archiefdepot, tellingen van fietsers op de openbare weg, …). Voor het verwerken van sensordata moet rekening gehouden worden met een aantal aandachtspunten: 1) de betrouwbaarheid van de data en de aannames die we maken, 2) op welke manier deze data iets vertellen over personen en ze dus privacygevoelig zijn, en 3) de al dan niet voorspelbare aangroei van de data. Het verzamelen van de data wordt ook vaak uitbesteedt, waardoor de aanbestedende instelling de data moet ophalen via een portaalsite. Je maakt best op voorhand afspraken over de overdracht van de data van zodra het contract met de leverancier afloopt. Zo niet, dan zijn alle data verloren. Tijdens zijn stage kwam Jef tot de conclusie dat datastromen perfect beschreven kunnen worden via ISAD(G) en PREMIS. Een moeilijkere oefening was deze van de selectie van sensordata. Deze data zijn belangrijk in het kader van later wetenschappelijk onderzoek, en wetenschappelijk hergebruik is niet helemaal hetzelfde als historisch hergebruik. De selectie van sensordata zou dus nog meer onderzocht moeten worden. Vanuit zijn thesis, en ook vanuit zijn huidige job bij ManGO (platform voor beheer actieve onderzoeksdata van de KU Leuven) wil Jef ons vooral bijbrengen dat we geen angst moeten hebben om ons verder te verdiepen in het beheer en de archivering van data.

Tenslotte kwam Mathias Dillen van de Plantentuin van Meise aan het woord. Bij deze erfgoedinstelling maken ze gebruik van Zenodo voor de archivering en wereldwijde ontsluiting van hun wetenschappelijk onderzoeksmateriaal. Zo’n 75% van de collectie is momenteel gedigitaliseerd. De TIFF-bestanden worden reeds gearchiveerd door Meemoo. Maar daarnaast experimenteert de Plantentuin met Zenodo als een archiveringsoplossing voor gedigitaliseerde natuurhistorische data en documentatie. Zenodo wordt gehost door CERN en zij beloven dat de applicatie minstens 20 jaar ondersteund zal worden. Ze zetten de tool ook in voor het beschrijvingen van hun content door het grote publiek. Na enkele pilootprojecten waarbij grote datasets geüpload werden, kwam men tot de volgende conclusies: enerzijds is Zenodo een gratis en toegankelijk platform, relatief eenvoudig in gebruik en je krijgt garanties op lange termijn; anderzijds is de ondersteuning beperkt en werken de API’s niet altijd even goed.

Data is geen nieuw gegeven voor veel organisaties, maar er zijn wel veel uitdagingen. Data-archivering is één van die uitdagingen. De sprekers toonden aan dat, ondanks het feit dat er nog veel onontgonnen terrein is, er ook oplossingen zijn, al zijn ze niet altijd evident om uit te voeren. Dat dit onderwerp leeft onder afgestudeerden wordt duidelijk door de hoge opkomst (ca. 60 deelnemers). Het toont ook aan dat de archivaris een belangrijke rol te spelen heeft in het omgaan met data, niet alleen bij archivering, maar ook al bij de opbouw van data. Het wordt boeiend om de ontwikkelingen te volgen en dit leidt ongetwijfeld tot nieuwe boeiende use cases waar afgestudeerden aan hebben deelgenomen.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *