Comment télécharger un site Web à partir du archive.org Machine à remonter la pente ?
Je veux obtenir tous les fichiers pour un site Web donné à archive.org . Les raisons peuvent inclure :
- l'auteur original n'a pas archivé son propre site Web et il est maintenant hors ligne, je veux en faire un cache public
- Je suis l'auteur original d'un site Web et j'ai perdu du contenu. Je veux le récupérer
- ...
Comment faire ça ?
Compte tenu du fait que la archive.org wayback machine est très spécial: liens de pages web ne pointent pas vers l'archive elle-même, mais vers une page Web qui pourrait ne plus être là. JavaScript est utilisé côté client pour mettre à jour les liens, mais une astuce comme un wget récursif ne fonctionnera pas.