質問

ソース コードを数年間確実かつ安全に保管しておくことに興味があります。私の研究/経験から:

  1. 焼き付けられた DVD-R などの光学メディアは、時間の経過とともにデータの一部が失われます。数年経っても、貼ったファイルがすべて取り外せなくなります。読み取りエラーなど

  2. ハードドライブは機械式で故障や陳腐化の可能性があり、高額なデータ回復料金がかかり、データのプライバシーが保たれることはほとんどありません(どこかの会社に送ってしまいます)。

  3. 磁気テープストレージ:#2を参照してください。

  4. オンライン ストレージは、データ ストレージ センターの気まぐれ、そこでのセキュリティの有無、会社が倒産する可能性などの影響を受けます。さらに高価ですし、覗き見されていないという保証はありません。

時間が経つにつれて、これらの問題が原因で、自分が行った古いプロジェクトのソース コードが失われていることがわかりました。他に解決策はありますか?

回答の要約:
1.冗長性を確保するには複数の方法を使用します。
2.ソースコードをテキストまたはバーコードとして印刷します。
3.RAID アレイはローカル ストレージに適しています。
4.プロジェクトをオープンソース化すると、プロジェクトは永久に存続します。
5.暗号化はセキュリティに対する答えです。
6.磁気テープの保存は耐久性があります。
7。分散型・保証型のオンラインストレージは安価で信頼性が高いです。
8.ソース管理を使用して履歴を維持し、リポジトリをバックアップします。

役に立ちましたか?

解決

最良の答えは「複数の場所にある」です。ソース コードをできるだけ長く保持することに懸念がある場合は、次のようにします。

1) 定期的にいくつかの光学メディアにバックアップします。たとえば、月に 1 回 DVD に書き込み、オフサイトにアーカイブします。

2) ローカルマシン上の複数のハードドライブにバックアップします。

3) Amazon の S3 サービスにバックアップします。保証があり、分散システムなので単一障害点がなく、簡単にデータを暗号化できるのでデータを「覗く」ことはできません。

これら 3 つの手順を実行すれば、データが失われる可能性は事実上ゼロになります。非常に重要なデータについては、バックアップが多すぎるということはありません。

他のヒント

あなたの被害妄想のレベルに基づいて、プリンターと金庫をお勧めします。

さらに深刻なことに、RAID アレイはもうそれほど高価ではありません。RAID アレイを使用し監視し続ける限り、適切に設定されたアレイは事実上、データを失わないことが保証されます。

保持したいデータはすべて、複数の形式で複数の場所に保存する必要があります。どれか 1 つが失敗する確率はかなり高いかもしれませんが、すべてが失敗する確率はかなり小さいです。

最近のオンライン ストレージの価格が非常にリーズナブルになっていることに驚かれると思います。Amazon S3 (シンプルなストレージ ソリューション) は月額 1 GB あたり 0.10 ドル、アップロード費用は 1 GB あたり 0.10 ドル、ダウンロード費用は最大 1 GB あたり 0.17 ドルです。

したがって、20 GB を 1 か月間保存し、20 GB をアップロードし、20 GB をダウンロードすると、8.40 ドルの費用がかかります (ヨーロッパのデータセンターではわずかに高価で 9 ドル)。

これは、データを米国と EU の両方のデータ センターと DVD に保存するのに十分な低コストです。控えめに言っても、3 つすべてが失われる可能性は低いです。

JungleDisk などのフロントエンドも利用できます。

http://aws.amazon.com
http://www.jungledisk.com/
http://www.google.co.uk/search?q=amazon%20s3%20クライアント

プロジェクトをバックアップする最良の方法は、プロジェクトをオープンソースにして有名にすることです。そうすれば、常にそのコピーを持っている人がいて、あなたに送ることができます。

その後は、磁気/光メディアを管理し、継続的に更新し、複数のメディア (RAID セットを含む) に複数のコピー (オンラインでも、暗号化できることを覚えておいてください) を作成するだけです。

何かを長期間アーカイブしたい場合は、テープ ドライブを使用するでしょう。それほど多くの容量を保持できるわけではありませんが、信頼性が高く、データ アーカイブに最適なストレージ メディアです。ただし、私は個人的にテープドライブ上のデータ損失を経験したことはありません。

Subversion を使用することを忘れないでください (http://subversion.tigris.org/)。私は生涯を転覆させます(それは素晴らしいことです)。

私がこれまでに見た家庭で使用可能な最良の解決策は、2D バーコードを使用してバックアップを印刷することでした。データ密度はかなり高く、再スキャンもかなり簡単に行うことができ (シートフィード スキャナを想定)、問題は解決されました。デジタル領域を物理領域に戻します。これは、貸金庫のようなものや、Iron Mountain のような企業によってかなり簡単に満たされます。

もう 1 つの答えは「上記のすべて」です。冗長性は常に役に立ちます。

私のプロジェクトでは、1、2、4 を組み合わせて使用​​します。本当に重要なデータの場合は、複数の場所にコピーを複数作成する必要があります。私の重要なデータは毎晩 3 ~ 4 か所に複製されます。

もっとシンプルなソリューションが必要な場合は、信頼性が保証されている有名なプロバイダーからオンライン ストレージ アカウントを取得することをお勧めします。セキュリティが心配な場合は、内部のデータのみをアップロードしてください トゥルークリプト 暗号化されたアーカイブ。コスト的には、割高になりそうですね…。しかし、それが本当に重要であれば、コストはかかりません。

法規制により電子データのアーカイブが義務付けられているため、当社ではデータを RAID 上とバックアップ テープ上の 2 つの別々の場所 (そのうちの 1 つは Iron Mountain) に保管しています。また、テープと RAID も数年ごとに交換します。

「永久に」保存する必要がある場合、おそらく最も安全な方法は、コードを印刷し、それをビニールの封筒に貼り付けて風雨から守ることです。バックアップ手段によってどれだけのコードが失われ、もうアクセスできなくなったのかわかりません。古い COBOL デッキを読み取るための紙のカード リーダーもありませんし、5 1/4 インチ フロッピーや 3 1/2 インチ フロッピー用のドライブもありません。しかし、私の最初の大きなプロジェクトで作成したプリントアウトは、まだ読むことができます...かつて 3 歳の子供がそれが良い塗り絵になると決めた後でも。

「ソース コードをバックアップする」という場合は、バージョン管理システムのバックアップも意味に含めてほしいと思います。

現在のソース コードを (複数の場所に) バックアップすることは間違いなく重要ですが、VCS に保存されている変更履歴をバックアップすることが私の意見では最も重要です。特に私たちが常に「未来を見据えて現在を生きている」場合には、それは些細なことのように思えるかもしれません。しかし、過去を振り返って問題を調査し、一連の変更を確認し、誰が何をしたか、以前のビルド/バージョンにロールバックできるかどうかを確認したいと思うことが何度もありました。頻繁な分岐やマージを行う場合は、さらに重要です。単一のトランクをアーカイブする しません.

バージョン管理システムには、バックアップ戦略に関するドキュメントと提案が付属している場合があります。

1 つの方法は、ストレージ メディアを定期的にリサイクルすることです。劣化したメディアからデータを読み取り、新しいメディアに書き込みます。これを支援するプログラムが存在します。 DVD 災害. 。結局のところ、永遠に続くものはありません。最も煩わしくない解決策を選択してください。

#2については:データを暗号化された形式で保存して、データ回復専門家がデータを理解できないようにすることができます。

書き込みバックアップ メカニズムが導入されている場合は、オプション 2 でも十分に機能すると思います。サードパーティが関与する高価なものである必要もありません (災害復旧を除く)。RAID 5 構成のサーバーが役に立ちます。ハードドライブに障害が発生した場合は、交換してください。すべてのハードドライブが同時に故障する可能性は非常に低いです。場合によっては、ミラーリングされた RAID 1 ドライブでも十分です。

オプション 2 がまだ役に立たない解決策であると思われる場合、他に考えられる唯一の方法は、ソース コードのハードコピーを印刷することですが、これには上記のどの解決策よりも多くの問題があります。

オンライン ストレージは、データ ストレージ センターの気まぐれ、そこでのセキュリティの有無、会社が倒産する可能性などの影響を受けます。しかも高価なので、

必ずしも高価ではありません(を参照) rsync.net 例)、不安もありません。確かに自分のものを暗号化することもできます。

そして、彼らが覗いていないという保証はありません。

確かにそうですが、ソースコードよりももっと興味深いものがあるかもしれません。;-)

もっと真剣に言うと、RAID アレイはもうそれほど高価ではありません

RAID は ない バックアップ。

ちょうどマイクロフィルムの専門家と話していました。これは古いテクノロジーではありますが、長期保存の場合、適切に維持されていれば最も耐久性のあるデータ ストレージ形式の 1 つです。読むのに高度な機器(拡大レンズやライト)は必要ありませんが、保管には多少の手間がかかる場合があります。

繰り返しますが、前述したように、数十年ではなく数年のスパンでのみ話している場合は、紙に印刷して管理された環境で保管するのが最善の方法である可能性があります。本当にクリエイティブになりたい場合は、すべてのシートをラミネート加工することもできます。

ローカルバックアップ用のDrobo

短期間のローカルアーカイブ用の DVD

オフサイトの長期アーカイブ用の Amazon S3

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top