Ga verder naar de inhoud

Sociale media accounts archiveren met ArchiveWeb.page

In het kader van het project Best practices voor de archivering van sociale media in Vlaanderen en Brussel werden verschillende tools getest om socialemediaplatformen te archiveren. Deze handleiding beschrijft de tool ArchiveWeb.page voor het archiveren van sociale media.

Disclaimer: Deze handleiding werd voor het laatst gecontroleerd tijdens de edit-a-thon van het Praktijknetwerk Sociale Media Archiveren in 2025. Merk je dat er iets niet werkt? Mail dan Nastasia

ArchiveWeb.page is een Chrome-extensie waarmee je de browser kan ombouwen tot een webarchiveringssysteem. Het is de opvolger van Webrecorder. Net zoals haar voorganger neemt ze een surfsessie op in het standaardformaat WARC. Terwijl je als gebruiker interageert met een webpagina in de surfsessie, downloadt ArchiveWeb.page alle content die je tegenkomt door het netwerkverkeer en de processen in je browser op te nemen. Daardoor is het gebruik van de tool tijdsintensief. Als je alle content van een sociale media account, zoals comments, wil capteren, zal je immers alle posts manueel moeten openen en de comments aanklikken.

Vereisten

  • Chrome browser;
  • een account op het socialemediaplatform.

Voordelen

  • kan gebruikt worden op Windows, macOS en Linux;
  • archiveert sociale media in het standaardformaat WARC;
  • archivering verloopt rechtstreeks in de browser;
  • kan ook gebruikt worden om de webarchieven af te spelen;
  • uitgebreide documentatie beschikbaar
  • creëert een minimale set van metadata die in het WARC-bestand bewaard worden, zoals gebruikte software, tijdstempel, URL en paginatitel;
  • webarchieven worden gedownload in WARC- en WACZ-formaat

Nadelen

  • tijdsintensief als je alle content van het socialemediaplatform wil capteren;
  • bepaalde elementen van facebook worden geblokkeerd, zoals het openklikken van foto's, waardoor ze niet in het webarchief opgenomen kunnen worden;
  • de autopilotfunctie voor Facebook, Twitter en Instagram werkt niet goed. Dit is vermoedelijk door beperkingen die door de platformen wordt opgelegd .

Worfklow

Stap 1: installeer de software

ArchiveWeb.page is een Chrome-extensie die je installeert via de chrome web store.

  • Open Chrome.
  • Ga via deze link naar de extensie-pagina van ArchiveWeb.page en klik op Toev. aan Chrome.

  • Er verschijnt een venster dat je vraagt om te bevestigen dat je de extensie wil toevoegen. Klik op Extensie toevoegen.

  • Zet vervolgens de extensie vast door linksboven op het puzzelstukje te klikken en op het punaise-icoontje naast Webrecorder Archiveweb.page te klikken.

  • De extensie staat nu in je browser naast de adresbalk.

Stap 2: capteer het sociale media account

Na de installatie van ArchiveWeb.page kan je Chrome gebruiken als een webarchiveringstool.

  • Maak een collectie voor het account dat je wil capteren. Klik hiervoor op het ArchiveWeb-icoon en klik op het dropdown-menu onder Record To. Kies voor Create New Archive…

  • En geef een naam aan de collectie.

  • Ga vervolgens naar het socialemediaplatform van het account dat je wil archiveren en log in.

  • Navigeer naar het sociale media account dat je wil archiveren en start de opname. Klik hiervoor weer op het ArchiveWeb-icoon in de browser. Vink de optie Start With Autopilot aan en druk op Start.

  • Nadat je op start gedrukt hebt, zal ArchiveWeb de pagina opnieuw laden en de content beginnen downloaden. De autopilotfunctie zal geautomatiseerd naar beneden scrollen, posts openen, comments openklikken en video's afspelen.
  • Wanneer deze functionaliteit niet werkt, kan je gebruik maken van een extensie in de browser die automatisch naar beneden scrolt zoals Simple Autoscroll (zie "uitbreiding").

  • Om ervoor te zorgen dat alle content bewaard wordt, moet je iedere post en foto openen en alle video’s afspelen. Bij Facebook worden niet automatisch alle comments getoond, dus ook deze zal je moeten uitklappen als je ze wil bewaren. Controleer ook of je alle comments ziet in plaats van enkel de relevante. Tijdens het uitvoeren van deze acties zal ArchiveWeb steeds meer content opslaan.
  • Als je de sessie wil beëindigen, klik dan terug op het ArchiveWeb.page-icoon en druk op Stop.

Stap 3: exporteer het webarchief als WARC-bestand

Nadat ArchiveWeb.page het sociale media account gearchiveerd heeft, kan je het webarchief exporteren in WARC-formaat

  • Klik hiervoor weer op het ArchiveWeb-icoon en selecteer in het keuzemenu onder Record To de collectie die je in Stap 2 aangemaakt hebt.

  • Druk vervolgens op Browse Archive. Je zal een lijst van pagina’s zien die je gearchiveerd hebt.

  • Kies links voor Download en klik op Download All as WARC Only

  • Sla het bestand op. Let op: ArchiveWeb.page wil het bestand opslaan als een .warc-bestand, maar het gaat om een gecomprimeerd (gzip) WARC-bestand. Voeg daarom .gz toe als extensie. Je kan dit ook achteraf na het downloaden aanpassen.

  • Het webarchief is opgeslagen!

Resultaat

Het webarchief kan nu geopend worden WARC-players zoals ReplayWeb.page. Ga naar https://replayweb.page en open je WARC-bestand.

Uitbreiding

De archiveweb.page extensie auto-pilot functie moet soms wat geholpen worden. Vooral bij het automatisch scrollen. Het is ook mogelijk om met behulp van een javascript bookmarklet alle reacties op een facebook pagina of facebook groep uit te vouwen.

Simple Autoscroll extensie

Gebruik een extensie in Chrome om automatisch te scrollen.

  • Om Simple Auto Scroll te gebruiken, navigeer naar de te archiveren webpagina en klik op het Simple Autoscroll icoontje rechtsboven.

  • Je kan de scrollsnelheid aanpassen. Het is belangrijk om die niet te snel te zetten zodat ArchiveWeb.page kan volgen. Een snelheid van 5 pixels per 25 milliseconden is hiervoor perfect.

Deze pagina is laatst aangepast op 13 oktober 2025

Deze pagina aanvullen of corrigeren?

Foutje gespot? Of heb je aanvullende inzichten? Deel je ervaringen via onderstaande knop.