Witold Kepinski - 29 mei 2025

Onderzoek pleit voor wettelijke verankering webharvesting voor behoud digitaal erfgoed

Het Nederlandse culturele erfgoed omvat in toenemende mate digitale objecten zoals websites en webcontent. Echter, de vluchtigheid van online informatie dreigt waardevol materiaal voor toekomstige generaties verloren te doen gaan. Om dit te voorkomen, pleiten Nederlandse erfgoedinstellingen, waaronder de Koninklijke Bibliotheek (KB), het Nationaal Archief (NA), de Koninklijke Vereniging van Archivarissen in Nederland (KVAN) en het Nederlands Instituut voor Beeld en Geluid (Beeld en Geluid), voor een wettelijke facilitering van webharvesting. Een recent rapport van PBLQ, Ecorys en Confider, opgesteld in opdracht van het Ministerie van Onderwijs, Cultuur en Wetenschap (OCW), onderzoekt diverse scenario's om webharvesting mogelijk te maken en de daarbij horende juridische, organisatorische, technische en financiële aspecten.

Onderzoek pleit voor wettelijke verankering webharvesting voor behoud digitaal erfgoed image

Webharvesting, het systematisch verzamelen, ordenen, bewaren en toegankelijk maken van delen van het nationale internetdomein, is cruciaal voor het vormen van webarchieven. Momenteel opereren erfgoedinstellingen in een juridisch grijs gebied, waarbij instemming van rechthebbenden via een 'opt-out' mechanisme nodig is. Dit is in de praktijk tijdrovend en niet efficiënt, wat leidt tot het verlies van veel webarchieven. De Auteurswet vormt een belangrijke belemmering voor grootschalige webharvestingactiviteiten.

De motie Dekker-Abdulaziz, unaniem aangenomen in de Tweede Kamer op 24 oktober 2023, onderstreepte de noodzaak om de wettelijke, technische en financiële obstakels voor archivering van het nationale webdomein in kaart te brengen. Een eerder onderzoek van het Instituut voor Informatierecht (IVIR) uit 2021 benadrukte al dat webharvesting bijdraagt aan de waarborging van de vrijheid van meningsuiting, informatievrijheid en het recht op wetenschap. Het IVIR-rapport concludeerde dat beleidsmakers een juridische oplossing moeten vinden die ruimte biedt voor webharvesting zonder conflicterende rechten, zoals auteursrecht en bescherming van persoonsgegevens, te zeer in het geding te brengen.

Onderzochte scenario's en aanbevelingen 

Het rapport van PBLQ, Ecorys en Confider heeft vier scenario's voor de uitvoering van webharvesting onderzocht, waarbij een onderscheid wordt gemaakt tussen wettelijk faciliteren en niet wettelijk faciliteren.

  • Scenario 1: Centrale uitvoering door één instelling. Eén centraal gekozen instelling voert zowel de nationale domeincrawl als beredeneerde selecties uit, waarbij decentrale instellingen verzoeken kunnen indienen.
  • Scenario 2: Centrale uitvoering van de nationale domeincrawl en decentrale uitvoering van beredeneerde selecties. Eén centrale instelling voert de nationale domeincrawl uit, terwijl decentrale instellingen zelfstandig beredeneerde selecties kunnen uitvoeren.
  • Scenario 3: Afspraken maken over uitvoering van webharvesting (consensus). Expliciete afspraken worden gemaakt met belanghebbenden over webharvesting, aangevuld met een 'notice-and-takedown' systeem, maar zonder wettelijke basis.
  • Scenario 4: Status quo (geen afspraken maken). Dit is de huidige situatie, waarbij geen nationale domeincrawl plaatsvindt en beredeneerde selecties worden uitgevoerd op basis van een opt-out voor auteursrechthebbenden.

De analyse van de scenario's toont aan dat de huidige situatie (scenario 4) de meeste negatieve effecten met zich meebrengt, met name voor het informatie- en erfgoedbelang en de bescherming van persoonsgegevens, door een gebrek aan juridische waarborgen. Het rapport concludeert dat een wettelijke basis de meest houdbare en haalbare optie is voor de toekomst. Met name het vastleggen van een expliciete wettelijke taak of bevoegdheid voor één of meerdere erfgoedinstellingen wordt gezien als de meest toekomstvaste oplossing die rechtszekerheid biedt voor alle betrokken partijen.

Van de onderzochte scenario's die uitgaan van wettelijke facilitering (scenario 1 en 2), wordt scenario 2 het beste beoordeeld qua uitvoerbaarheid en draagvlak. Dit scenario sluit het meest aan bij de huidige uitvoeringspraktijk van erfgoedinstellingen die al zelfstandig harvesten. Wel zijn er bij scenario 2 mogelijk hogere kosten als meer dan elf instellingen structureel aan webharvesting doen, vergeleken met scenario 1 dat schaalvoordelen kan bieden via een centrale loketfunctie.

EGP 06/05/2025 t/m 03/06/2025 BW I-Mor 26/05/2025 t/m 02/06/2025 BN + BW
Gartner BN tm 12-11-2025 - 1