Sociale media accounts archiveren met ArchiveWeb.page
In het kader van het project Best practices voor de archivering van sociale media in Vlaanderen en Brussel werden verschillende tools getest om socialemediaplatformen te archiveren. Deze handleiding beschrijft de tool ArchiveWeb.page voor het archiveren van sociale media.
----
ArchiveWeb.page is een Chrome-extensie waarmee je de browser kan ombouwen tot een webarchiveringssysteem. Het is de opvolger van Webrecorder. Net zoals haar voorganger neemt ze een surfsessie op in het standaardformaat WARC. Terwijl je als gebruiker interageert met een webpagina in de surfsessie, downloadt ArchiveWeb.page alle content die je tegenkomt door het netwerkverkeer en de processen in je browser op te nemen. Daardoor is het gebruik van de tool tijdsintensief. Als je alle content van een sociale media account, zoals comments, wil capteren, zal je immers alle posts manueel moeten openen en de comments aanklikken. Vereisten- Chrome browser;
- een account op het socialemediaplatform.
- kan gebruikt worden op Windows, macOS en Linux;
- archiveert sociale media in het standaardformaat WARC;
- archivering verloopt rechtstreeks in de browser;
- kan ook gebruikt worden om de webarchieven af te spelen;
- uitgebreide documentatie beschikbaar
- creëert een minimale set van metadata die in het WARC-bestand bewaard worden, zoals gebruikte software, tijdstempel, URL en paginatitel;
- heeft een autopilotfunctie voor Facebook, Twitter en Instagram.
- tijdsintensief als je alle content van het socialemediaplatform wil capteren;
- bepaalde elementen van facebook worden geblokkeerd, zoals het openklikken van foto's, waardoor ze niet in het webarchief opgenomen kunnen worden;
- loopt vaak vast bij het scrollen doorheen Facebook. Dit is vermoedelijk een beperking die door Facebook opgelegd wordt.
Worfklow
Stap 1: installeer de software
ArchiveWeb.page is een Chrome-extensie die je installeert via de chrome web store.
- Open Chrome.
- Ga via deze link naar de extensie-pagina van ArchiveWeb.page en klik op Toev. aan Chrome.
- Er verschijnt een venster dat je vraagt om te bevestigen dat je de extensie wil toevoegen. Klik op Extensie toevoegen.
- Zet vervolgens de extensie vast door linksboven op het puzzelstukje te klikken en op het punaise-icoontje naast Webrecorder Archiveweb.page te klikken.
- De extensie staat nu in je browser naast de adresbalk.
Stap 2: capteer het sociale media account
Na de installatie van ArchiveWeb.page kan je Chrome gebruiken als een webarchiveringstool.
- Maak een collectie voor het account dat je wil capteren.
- Klik hiervoor op het ArchiveWeb-icoon en klik op het dropdown-menu onder Record To’. Kies voor Create New Archive…
:* En geef een naam aan de collectie.
- Ga vervolgens naar het socialemediaplatform van het account dat je wil archiveren en log in.
- Navigeer naar het sociale media account dat je wil archiveren en start de opname. Klik hiervoor weer op het ArchiveWeb-icoon in de browser. Vink de optie Start With Autopilot aan en druk op Start.
- Nadat je op start gedrukt hebt, zal ArchiveWeb de pagina opnieuw laden en de content beginnen downloaden. De autopilotfunctie zal geautomatiseerd naar beneden scrollen, posts openen, comments openklikken en video's afspelen.
- Om ervoor te zorgen dat alle content bewaard wordt, moet je iedere post en foto openen en alle video’s afspelen. Bij Facebook worden niet automatisch alle comments getoond, dus ook deze zal je moeten uitklappen als je ze wil bewaren. Controleer ook of je alle comments ziet in plaats van enkel de relevante. Tijdens het uitvoeren van deze acties zal ArchiveWeb steeds meer content opslaan.
- Als je de sessie wil beëindigen, klik dan terug op het ArchiveWeb.page-icoon en druk op Stop.
Stap 3: exporteer het webarchief als WARC-bestand
Nadat ArchiveWeb.page het sociale media account gearchiveerd heeft, kan je het webarchief exporteren in WARC-formaat
- Klik hiervoor weer op het ArchiveWeb-icoon en selecteer in het keuzemenu onder Record To de collectie die je in Stap 2 aangemaakt hebt.
- Druk vervolgens op Browse Archive. Je zal een lijst van pagina’s zien die je gearchiveerd hebt.
- Kies links voor Download en klik op Download All as WARC Only
- Sla het bestand op. Let op: ArchiveWeb.page wil het bestand opslaan als een .warc-bestand, maar het gaat om een gecomprimeerd (gzip) WARC-bestand. Voeg daarom .gz toe als extensie. Je kan dit ook achteraf na het downloaden aanpassen.
- Het webarchief is opgeslagen!
Resultaat
Het webarchief kan nu geopend worden WARC-players zoals ReplayWeb.page. Ga naar https://replayweb.page en open je WARC-bestand.
Uitbreiding
De archiveweb.page extensie auto-pilot functie moet soms wat geholpen worden.
Vooral bij het automatisch scrollen.
Het is ook mogelijk om met behulp van een javascript bookmarklet alle reacties op een facebook pagina of facebook groep uit te vouwen.
Simple Auto Scroll extensie
Gebruik een extensie in Chrome om automatisch te scrollen.
Ga naar https://chrome.google.com/webstore/detail/simple-auto-scroll/dccjkemhmffnljlnnoffljpkhkfpldff/related en klik "Add to Chrome" om Simple Auto Scroll toe te voegen aan Chrome.
Om Simple Auto Scroll te gebruiken, navigeer naar de te archiveren facebook/web-pagina en klik op het Simple Auto Scroll icoontje rechtsboven.
Simple Auto Scroll heeft 3 scrol snelheden, 1 keer klikken gaat er voor zorgen dat de pagina traag naar beneden scrolt, 2 keer medium snelheid, 3 keer klikken is de snelste stand.
Een vierde keer klikken zal het scrollen stoppen.
Of klik op de pagina om het scrollen te stoppen.
Om de scrol snelheid aan te passen open het context menu van de extensie, doe rechtermuisklik op het extensie icoontje.
En selecteer "Opties".
Hoe hoger het cijfer hoe trager de scrol snelheid, de opties aanvaarden negatieve cijfers.
Uitvouwen van facebook reacties
Om reacties op facebook automatisch uit te vouwen kan de "auto-scroll" bookmarklet gebruikt worden van Jens-Ingo Farley.
Bookmarklets zijn kleine script uitbreidingen in de vorm van een bladwijzer balk knop. Meer informatie over bookmarklets https://support.mozilla.org/en-US/kb/bookmarklets-perform-common-web-page-tasks.
Ga naar http://com.hemiola.com/bookmarklet/ en sleep de "Expand-All" knop naar jouw bookmark balk van je browser.
Als de bladwijzer balk niet geactiveerd is gebruik de volgende sneltoets om die te activeren.
Chrome of Chromium-based browsers: Ctrl+Shift+B
Vervolgens, ga naar de te archiveren facebook pagina of groep en klik op de "Expand All" knop in de bladwijzer balk.
Het process stopt vanzelf wanneer het einde van de pagina is bereikt. Of wanneer de gebruiker op de "esc" knop drukt.
De Expand all bookmarklet en de Simple Auto scroll extensie combinatie zijn een goed alternatief voor de auto-pilot functie van de archive.web extensie.
Het is aan te raden om enkel het tablad met de te archiveren Facebook pagina of groep open te hebben in de browser.
Zet de auto scroll snelheid niet te hoog zodat de archive.web extensie alle links kan archiveren.
Gebruik een computer met genoeg RAM geheugen en een snelle internetverbinding.
Organisatie
Licentie
- CC-BY-SA
Type
Collectie
Expertisedomein
Verwante software
Verwante standaarden
Deze pagina is laatst aangepast op 08 mei 2024
Deze pagina aanvullen of corrigeren?
Heb je aanvullingen of wil je iets rechtzetten? Dan kan je deze pagina makkelijk bewerken via onderstaande knop.