met de steun van

"Door automatische metadatageneratie kunnen we stukken ontsluiten die nooit eerder vindbaar waren."

Aan het woord Geschreven op 30 jan. 2024
Peter

Het GIVE-project is een ongezien digitaliseringsproject: meer dan 800.000 krantenpagina's, topstukken en glasplaten worden gedigitaliseerd en digitaal gearchiveerd, en met de hulp van artificiële intelligentie krijgen zo’n 130 audiovisuele collecties extra beschrijvingen. Dat zijn niet alleen indrukwekkende cijfers, het project valt ook op door de nauwe samenwerkingen die werden aangegaan: tussen erfgoedorganisaties, experten ter zake, technische partijen, enzovoort.

Ben je benieuwd wie er zijn of haar schouders onder het project heeft gezet? In dit artikel duik je via 10 vragen achter de schermen en maak je kennis met iemand die heeft bijgedragen aan het project. 'Aan het woord' is Peter Vanden Berghe, AI architect bij Ordina.

Fotocv 1

Hoe ben jij betrokken bij het GIVE-project? Wat is jouw rol?

Ik ben de AI architect van het metadataluik van het GIVE project. Door middel van artificiële intelligentie hebben we gezichtsherkenning, spraakherkenning en entiteitsherkenning toegepast op 170.000 uur audiovisueel materiaal. Hierdoor konden we extra beschrijvingen toevoegen aan de objecten, om bijvoorbeeld alle fragmenten te kunnen opzoeken waar het gezicht van een bekende persoon werd herkend.

Mijn rol was om het technische AI team bij te staan en te sturen vanaf het onderzoeksproces, doorheen de ontwikkelings- en de productionalisatiefase van de AI metadatatools. Ik moest ook de architectuur uitwerken om de AI metadatapipelines te implementeren en te integreren met de bestaande on-prem en cloud infrastructuur.

Wat maakt de digitalisering van de topstukken/manuscripten/kranten/glasplaten zo belangrijk en waardevol volgens jou?

Het metadataluik van het GIVE project heeft voor mij aangetoond dat alle digitaliseringsefforts die geleverd zijn in het verleden heel waardevol zijn geweest en zullen zijn, zelfs al is het op moment van digitaliseren nog onduidelijk wat ermee gedaan kan worden. Door de automatische metadatageneratie kunnen we stukken ontsluiten die nooit eerder vindbaar waren en kunnen we er nieuwe technologieën gebruiken om inzichten te verkrijgen. Ik zie dit enkel toenemen in de toekomst.

Welke impact hoop je dat het GIVE-project zal maken?

Een boost voor alle andere digitaliseringsprojecten waar sceptici de vraag stellen wat er met die gedigitaliseerde stukken zal worden gedaan. De inzichten komen misschien niet onmiddellijk bij digitalisatie, maar zonder digitalisatie komen ze waarschijnlijk nooit.

De inzichten komen misschien niet onmiddellijk bij digitalisatie, maar zonder digitalisatie komen ze waarschijnlijk nooit.

Welke uitdagingen kwam je tegen in jouw werkzaamheden in het project en hoe ging je daarmee om?

Omgaan met 170.000 uur audiovisueel materiaal dat moet worden verwerkt is een hoeveelheid informatie die gewoon niet te overzien is. AI data pipelines bouwen die hiermee overweg kunnen is heel uitdagend en de problemen die je intuïtief zou verwachten blijken toch minder groot dan andere problemen waar je nooit van had verwacht dat die zo lastig zouden zijn.

Wat heb je bijgeleerd of ontdekt tijdens dit project?

Hoeveel materiaal van onschatbare waarde dat er beschikbaar is in Vlaanderen en met hoeveel enthousiaste mensen er gewerkt wordt om dit erfgoed te bewaren en te ontsluiten.

Welke samenwerkingen binnen het project hebben de grootste indruk op je gemaakt, en waarom?

Ik was vooral verwonderd door de samenwerking en de logistiek die nodig was om de grote hoeveelheid glasplaten te transporteren en in te scannen.

Metadata

Wat kan AI betekenen voor archiefwerking?

Wat is jouw favoriete topstuk, krant (en artikel), glasplaat of stukje metadata en waarom?

Wij moesten heel veel testen doen op videomateriaal om onze gezichtsherkennings-pipeline te ontwikkelen. Hiervoor werkten we heel vaak met een fragment uit de kampioenen en een fragment over Kim Clijsters. Ik denk dat ik ze honderden keren heb bekeken. Een ander speciaal fragment was de Mount Olympus theatervoorstelling van Jan Fabre. Deze video duurde 24 uur en was technisch een uitdaging om correct te verwerken omdat dit zo’n groot bestand was.

Welk topstuk, manuscript, krant of glasplaat moet voor jou zeker nog worden gedigitaliseerd? Waarom?

Ik heb mijn PhD onderzoek gedaan over 3D-geprinte heupimplantaten, dus heb een grote affectie voor alles wat 3D is. Ik was zeer gecharmeerd door de 3D-digitalisatie van de beeldhouwwerken en hoop dat er naast individuele stukken ook hele binnenkanten en buitenkanten van gebouwen, kerken, musea kunnen worden gedigitaliseerd.

Wie denk je dat het meest profiteert of het meest beïnvloed wordt door de digitalisering van de erfgoedobjecten?

In de eerste plaats de beheerders van de erfgoedobjecten en de archivarissen die dicht bij de objecten staan. Maar ik ben ervan overtuigd dat die digitalisering positief kan zijn voor de hele samenleving. Het kan mensen op een andere manier prikkelen voor cultuur en erfgoed en het maakt kunst toegankelijker. Naast het culturele is er zeker ook puur technologische winst waarbij wij ons onderzoek en ontwikkeling kunnen delen met anderen, zelfs buiten de erfgoedsector.

Wat zou je, op basis van je persoonlijke ervaringen en expertise, aanraden aan iemand die in de toekomst aan een soortgelijk project als het GIVE-project wil meewerken?

Het is heel belangrijk om de verschillende contentpartners te betrekken bij het ontwikkelproces. Wij hebben dat gedaan via werkgroepen en de inzichten die we daar verkregen zorgen ervoor dat wij verschillende perspectieven konden zien en onze algoritmes iteratief konden verbeteren.

Meer weten?

Fmrub Br WQAMQ Fc C
Aan het woord

"Dat is onontgonnen terrein, maar uiterst efficiënt."

Agoria 2
Over GIVE

Een dubbele trofee voor het GIVE-project

IMG 5158
Aan het woord

"Foto’s zijn altijd subjectieve visies op de realiteit."