「該当のドメインで運用されていた、過去のサイトを復元させたい」。この場合、普通は運用されていたドメインで公開されていたサーバー上の情報が必要です。 しかし、 SEO目的で他社が運用していた中古ドメインを取得した場合や、何らかの事情でサーバー情報を復元できない場合には、過去にサーバーであげられていた情報を参照することはできません。
参考: 中古ドメイン5つの購入方法と損しないための選び方・見分け方について
参考: 賢く面白い、グレーな被リンク獲得方法: 5つのSEOアイデア
このような場合、該当ドメインで過去に公開されていたスクリーンショットをWeb魚拓サービスから確認し、それらの情報からリバースエンジニアリングの形で過去サイトを再現する、という力技を行使せざるを得ません。
しかし、このようなリバースエンジニアリングは工数もコストも膨大なものがかかります。
そこで、Web魚拓の過去データから「自動で」静的なWebサイトの形、あるいはWordPressに対応した形でWebサイトを復元してくれるサービスを見つけました。 概要と触ってみた所感をご共有します。
目次:
Wayback Machine: Internet ArchiveのWeb魚拓過去データからスクレイピングし、取得したデータで復元してくれるサービスというものが存在します。
その名も、”Wayback Machine Downloader”。価格も1ドメインにつき$15〜と、非常にお手頃。
後に紹介するオプションで、WordPressに対応させたデータで復元させることが可能です。
Wayback Machine Downloader - $11/whole domain - Free Trial
Wayback Machine Downloader - $11/whole domain - Free Trial
Wayback Machine Downloaderの仕組みとしては、Wayback Machineで指定した日付の過去データをスクレイピング。指定したURLおよびXMLサイトマップからサイト全体のページのをスクレイピングしているようです。
スクレイピングされたデータからHTMLファイルが出力されます。
オプションで、WordPress形式のデータへ変換させることが可能。WordPressがインストールされた形で復元させることが可能です。
ただし、WordPress形式の復元の場合、復元されたページはすべて固定ページとして復元されるため注意が必要です。
その後に「投稿」として新しく記事を追加させたい場合、テーマ(Wayback Machine Downloaderというテーマがインストールされます)を調整してアーカイブ部分を出力させる作業が必要になります。
具体的な流れと、復元し取得したファイルの公開のためのサーバーへの設置方法が書かれています。
Restore a Website From The Web Archive - Wayback Machine Downloader
WordPress形式で復元させた場合には、公開サーバーにApacheが導入されていることが要件になります。Nginx等のWebサーバーでないことを確認のうえ実施してください。
私はWordPress形式での復元先サーバーにエックスサーバーを選択しましたが、エックスサーバーの内部で実質的に動いているのはApacheのため、無事に復元させることができまし。
Wayback Machine Downloaderの価格表はこのとおり。