今時tar.gzでバックアップか?

http://nl.sios.com/tech/dvd_backup.php

tar.gzによるバックアップの信頼性がやばいことくらい今じゃ常識だと思うが、会社のサイトにこんな文書載せるのはどうかと思う。

↑の文書が示しているように、1バイト書き変わっただけでファイルが全滅する恐れがある。

今ならバックアップはsquashfsがよい。高信頼性、高圧縮率。おまけにSystemRescueCdから読み込み可能。SystemRescueCdは高圧縮な圧縮アルゴリズムを採用したsquashfs-lzmaも読み込める。というかSystemRescueCdsquashfs-lzmaで圧縮している。
バックアップすることも大事だが、リストアしやすい環境を作るのも同じくらい大事だ。その点SystemRescueCdで対応しているので、簡単にリストアできる。身をもってわかった
ファイルシステムなのでmount(-o loopつき)してしまえば1個1個のファイルに普通のコマンドでアクセスできる。

afioもいいけど、コマンドラインが覚えられない…

tar.gzなんて論外だ。

500GBのハードディスク

1週間前に注文した500GBのハードディスクが昨日届いた。今のデータ用ハードディスクが3年半稼動しているので寿命が心配なのでネットで購入。12000円。日立IBM HDT725050VLAT80。500GB UATA133 7200rpm。それにGigazineによるとそろそろIDE HDDが売られなくなるらしいので早目に買っておかないといけない。
なんか見てみるとmade in Chinaって書いてあった…orzorzorz ODMだろうけど、中国製っていいイメージがなくて不安だ。kakaku.comでは3位の人気HDDなのに…でも中国みたいに人件費の安い国で作らないと12000円じゃ無理なのかな?
防湿・防静電気のパックに入っているので、動作確認のために開けるのが不安だったので販売店に問い合わせてみたら、大丈夫とのこと。あとで動作確認をする。

GRUBのマニュアルを熟読している。GRUBファイルシステムやOSを判別して、カーネルのファイル名を指定するだけで起動できる。liloと違っていちいちカーネルの場所を教える必要がない。すげー感動した。

せっかく新しいハードディスクが手に入ったので、現HDDそのままでリストアの予行演習ができる。これはいい機会だ。

ブログのバックアップ

http://www.rubyist.net/~matz/20071008.html#p01

俺ははてなデビューと同時にはてダラEmacsなのでブログ原稿はすべてローカルに存在する。なので、ローカルのバックアップをしっかり取っておけば、はてなでいざ記事が損失しても損失分のファイルをtouchしてはてダラ一発で復元できる。

けど今はケータイでブログ更新している人もいるから、ブログのバックアップ問題は深刻なのかもしれない。

gzが悪いんではなくて

d:id:rubikitch:20071031#1193764291

tar.gzのバックアップの信頼性がやばい原因は、tarでひとまとめにしたものを圧縮しているから。だから、解凍途中でエラーが出てしまえば続行不可能になる。だからおそらくtar.bz2やtar.7zも同様の結果だろう。
afio+gzipの損害が最小限なのは、gzipしてからafioでまとめているから。分裂したひとつの細胞が破壊されても残りが生き残って伸長される。

一般に圧縮ファイルに傷がつくと一大事になる。tar.gzは圧縮ファイルだが、afzそのものは圧縮ファイルではない。圧縮ファイルをまとめているアーカイブファイルに過ぎない。順番大事。

気まぐれにぐぐってみたら同じこと書いてあるサイトを発見。

http://danielwebb.us/software/backup/

afio is an archiver that uses the cpio format, but has the advantage that it can transparently compress files. The difference between afio and tar with compression is critical: tar -j creates an archive then bzip2s it, while afio bzip2s files and adds them to the archive. With tar -j, you're likely lose the whole archive past the first corruption, but with afio you just lose the files that are corrupted. It is best not to use compression, because compression always amplifies corruption loss. If you must use compression, use bzip2 combined with afio. Give bzip2 the -1 option, and you will only lose 100K of your archive surrounding each area of corruption. Bzip2 also has recovery tools in the standard distribution, while gzip does not.

なになに、bzip2は標準で修復ツールがついているが、gzipにはついてないだとよ。標準ではないがgzrtが修復ツールらしい。