技術のタマゴ

カスタマイズとPC豆知識、ブログについて考えること。

ファンブログのバックアップを取る

私が以前使っていた、A8.netの運営する『ファンブログ』
という無料ブログサービスには、
ブログのエクスポート機能というものがありません。

なので、手軽にバックアップを取ることができないのです。
(※追記 2014年1月以降
MT形式でエクスポートできるようになりました)

突然のサービス停止などが起こると、とても困ります。

なので、当時私は、記事をアップする前に、本文はメモ帳に保存、
画像は専用フォルダに入れて置く、といった形で
自衛策をとっていました。

まるっと全部、今ある状態の記事を
コメント、トラックバックごとバックアップするには、
もうちょっと賢い、こんな方法があります。

◆Perl を使う方法
◆GetHTMLW 8.3.0 を使う方法
◆ホームページクローン を使う方法

*****

◆Perl を使う方法

ファンブログの記事は、記事の番号が一つ一つ増えていく形で
番号がつくので、こんな単純なプログラムで
順に、一記事のHTMLをはきだすことができます。

for($i=1; $i <= 最終記事番号; $i++) {
$cmd = “wget http://fanblogs.jp/アカウント名/archive/$i/0 -O $i.html”;
print $cmd . “\n”;
system($cmd);
sleep(5);
}

1.html、2.html、・・・という形で一記事ごとにファイルができます。
間の記事がない場合は、番号をとばしてとります。
sleep(5)は、サイトアタックとみなされないように
5秒置きにhtmlを取りに行くようにしています。

このスクリプトは、私ではなく、夫が書いて走らせたものなので
質問は受け付けることはできませんが、
Perlを使える方は、どうぞお使いください。

スタイルシートとともに、ローカルフォルダに入れておけば
いつでもWEBページの形で一記事の閲覧ができるようになります。

ただし、当然、画像のバックアップはとれません。

◆GetHTMLW 8.3.0 を使う方法

おーとえすさんから教えていただいたのですが
WEBページをダウンロードする
GetHTMLW 8.3.0というツールがあります。

GetHTMLW 8.3.0~Windows Mobile つかってる?

このツールの使い方は簡単で、作者さんのページから
zipファイルをダウンロードし、展開します。

インストールの必要はなく、
展開したgethtmlw-8.3.0フォルダの中の
GETHTMLW.EXEをダブルクリック、
小さい窓が開くので、タブの取得>WEBページ取得で、
自分のサイトURL(たとえば、http://fanblogs.jp/アカウント名/)を入れると、
gethtmlw-8.3.0フォルダの中に、階層構造をとったフォルダができる形で
ファイルを取得することができます。

メインページのHTMLは、
fanblogs.jp/アカウント名/index.html。
CSSは、
fanblogs.jp/アカウント名/style.css。

10記事ずつのHTMLは、fanblogs.jp/アカウント名/ページ番号
という形です。
このファイル名をページ番号→ページ番号.htmlという形に
書き替えれば、10記事ごとの閲覧ができます。

一記事のHTMLは、fanblogs.jp/アカウント名/archive/記事番号/0
という形になります。
このファイル名を0→0.htmlという形に書き替えれば、
一記事の形で閲覧ができます。

画像ファイルは、
fanblogs.jp/アカウント名/file/記事番号/画像ファイル
という形でフォルダに入ります。

ただし、ページを取得する前に、いらないリンクをなるべく
外しておかないと、時間がかかります。
(私の場合は800記事弱で1時間半かかりました)

さらに、自分でローカルで見る分にはいいのですが、
もし、サーバに上げて、サイトとして公開する場合には、
閲覧のみにするにしても、内部リンクをテキスト置換したり、
ファイル名を書き替えたり、けっこうな手間がかかります。

◆ホームページクローン作成 を使う方法

私は使ったことはないのですが、友人が使ってみてOKだった
内部リンクも書き替えて、画像ごととれる
ホームページクローン作成というツールがあります。

このソフトはカンパウェア(寄付)になっています。
ご使用の際は、サイトの注意書きをよく読んでお使い下さい。

*****

さて、こういった形でバックアップがとれても
多少の手を加えても、閲覧のみができるサイトとして使えるだけで
記事更新ができるブログ、という形にはなりません。

他のブログサービスに記事を持って移動したい、
こんな場合はどうすればよいのでしょうか。

続きはファンブログをさくらのブログ・Seesaaに移転する方法にて♪

♪ 関連記事 ♪

HTMLファイルに拡張子がないサイトの.htacsess設定... 通常、ブログやサイトのHTMLファイルには、*.htmlというように 拡張子がついていることが多いのですが、 A8.netの運営する無料ブログサービス、ファンブログの記事データファイルは、 http://fanblogs.jp/ア...
カテゴリ別に記事をインポートする方法2(カテゴリ削除)... 複数ブログにカテゴリ別で記事移動する方法 の続き、方法その2です。 今回は、いったんファンブログの全記事を さくらのブログにインポートし、 一時的に、移転用ブログA'、B'、C'を作り、 その後、本ブログA、B、Cに移す、という方法の紹介...
ブログ移転時のアフィリエイトリンクをどうする?... 旧ブログからの記事の移転ができたとして、 頭がかなーり痛いのが、記事内にあるアフィリエイトリンクです。 サイドバーなどにある広告は、新サイトで審査が通ったものから 新たに貼っていくことになりますよね。 ◆楽天アフィリエイト(直接提携)...
ブログ移転時に rel="canonical" を使いたいとき有... 「Google、ドメイン間の rel=”canonical” タグのサポート開始」   ~海外SEO情報ブログ 2009年12月17日 という少し古い記事があります。 ”Googleは、かねてからアナウンスしていたように、ドメインをまた...
WordPressブログを簡単に作る方法 この記事は、 『さくらのブログ・SeesaaからWordPressの記事移行は簡単だった』 の準備記事です。 ***** 通常、サーバのことだけではなく、データベースのこと、PHPなどが分からないと 手出しできないと思われているWord...

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です