「該当のドメインで運用されていた、過去のサイトを復元させたい」。この場合、普通は運用されていたドメインで公開されていたサーバー上の情報が必要です。 しかし、 SEO目的で他社が運用していた中古ドメインを取得した場合や、何らかの事情でサーバー情報を復元できない場合には、過去にサーバーであげられていた情報を参照することはできません。

参考: 中古ドメイン5つの購入方法と損しないための選び方・見分け方について

参考: 賢く面白い、グレーな被リンク獲得方法: 5つのSEOアイデア

このような場合、該当ドメインで過去に公開されていたスクリーンショットをWeb魚拓サービスから確認し、それらの情報からリバースエンジニアリングの形で過去サイトを再現する、という力技を行使せざるを得ません。

しかし、このようなリバースエンジニアリングは工数もコストも膨大なものがかかります。

そこで、Web魚拓の過去データから「自動で」静的なWebサイトの形、あるいはWordPressに対応した形でWebサイトを復元してくれるサービスを見つけました。 概要と触ってみた所感をご共有します。

目次:

Web魚拓の過去データからスクレイピングし、取得したデータで復元してくれるサービス

Wayback Machine DownloaderでWeb魚拓アーカイブをサイト丸ごと復元

Wayback Machine: Internet ArchiveのWeb魚拓過去データからスクレイピングし、取得したデータで復元してくれるサービスというものが存在します。

その名も、”Wayback Machine Downloader”。価格も1ドメインにつき$15〜と、非常にお手頃。

後に紹介するオプションで、WordPressに対応させたデータで復元させることが可能です。

Wayback Machine Downloader - $11/whole domain - Free Trial

Wayback Machine Downloader - $11/whole domain - Free Trial

Wayback Machine Downloaderで魚拓からサイト復元ができる仕組み

Wayback Machine Downloaderの仕組みとしては、Wayback Machineで指定した日付の過去データをスクレイピング。指定したURLおよびXMLサイトマップからサイト全体のページのをスクレイピングしているようです。

スクレイピングされたデータからHTMLファイルが出力されます。

オプションで、WordPress形式のデータへ変換させることが可能。WordPressがインストールされた形で復元させることが可能です。

ただし、WordPress形式の復元の場合、復元されたページはすべて固定ページとして復元されるため注意が必要です。

その後に「投稿」として新しく記事を追加させたい場合、テーマ(Wayback Machine Downloaderというテーマがインストールされます)を調整してアーカイブ部分を出力させる作業が必要になります。

具体的な流れと、復元し取得したファイルの公開のためのサーバーへの設置方法が書かれています。

Restore a Website From The Web Archive - Wayback Machine Downloader

WordPress形式で復元させた場合には、公開サーバーにApacheが導入されていることが要件になります。Nginx等のWebサーバーでないことを確認のうえ実施してください。

私はWordPress形式での復元先サーバーにエックスサーバーを選択しましたが、エックスサーバーの内部で実質的に動いているのはApacheのため、無事に復元させることができまし。

Wayback Machine Downloaderの価格

Wayback Machine Downloaderの価格表はこのとおり。

CleanShot 2022-03-07 at 01.50.41.png

Wayback Machine Downloader Pricing