Domanda

Ora stiamo tenuto per legge a digitalizzare tutti i documenti finanziari della nostra azienda, e li trasmette a valutazioni ogni 3 mesi.

Dal momento che si tratta di dati sensibili che abbiamo deciso di prendere nelle nostre mani e costruire una sorta di archiviazione dei dati digitali. Lo strumento funziona perfettamente, ma dopo 7 mesi di utilizzo stiamo cominciando a preoccupare lo spazio su disco utilizzato da queste immagini.

Ecco alcune informazioni sulla quantità di documenti digitalizzati:

  • 15K documenti digitalizzati e archiviati per giorno, con la dimensione PNG finale + - 860KB: 15 000 * 860 kilobit = 1.53779984 gigabyte
  • 30 giorni di lavoro al mese: 1.53779984 gigabyte * 30 = 46,1339,952 mila gigabyte
  • Aspettativa di utilizzo dello spazio su disco dopo 1 anno: 46.1339952 gigabyte * 12 = 553,607,942 mila gigabyte

Finora siamo a 424 gigabyte di spazio su disco utilizzato, senza il backup di conteggio. Stiamo usando PNG come formato di immagine, ma vorrei sapere se qualcuno ha qualche consiglio su un algoritmo di compressione migliore per le immagini o strategie alternative per la compressione modi ancora di più o meglio ancora del PNG per le immagini d'archivio da risparmiare spazio su disco.

Qualsiasi aiuto sarebbe apprezzato, grazie.

È stato utile?

Soluzione

Sarà meglio con DjVu , relativamente nuovo formato che è stato progettato espressamente per i documenti comprimere scansione. Funziona bene per i documenti bianco e nero, in scala di grigi e colore. Esso combina la separazione di primo piano / sfondo, con un sofisticato schema di compressione wavelet. Se si ottiene la versione commerciale credo è anche possibile ottenere i documenti dall'OCR in modo da poterli cercare, ma c'è una versione completamente open-source chiamato DjVuLibre .

Altri suggerimenti

Presumibilmente questi documenti non hanno bisogno di tutto essere sempre collegati. Se questo è il caso, in base alle informazioni che ci hai fornito, non vedo alcuna ragione per cui si avrebbe bisogno di cambiare il vostro flusso di lavoro.

PNG è un formato ampiamente supportato con lossless (zlib) di compressione, che sto cercando di indovinare che si sta utilizzando. Se non avete bisogno di compressione senza perdita, buona ole JPEG vi darà la compressione stretto a scapito di perdita di qualità minore, a patto di ottimizzare i rapporti di compressione in modo appropriato. JPEG2000 può essere un'altra alternativa, a seconda del vostro stack software. LZW-compresso offerte TIFF senza grossi vantaggi rispetto PNG diverso supporto a 16 bit per pixel, che probabilmente non è necessario. Altre opzioni includono i codec di specialità di proprietà (come MrSID) che offrono estremamente buona compressione di file di grandi dimensioni, per un prezzo.

Dato che questi sono documenti, credo che penserei di PDF come formato di "naturale" in cui per codificare loro. PDF offre una varietà di opzioni di compressione a seconda del contenuto dei file. Ma non vorrei andare di tutto per qualcosa di correzione che non è rotto.

Se si pensa a quanto si sta spesa per spazio su disco ora, 1,5 GB al giorno è nulla. spazio su disco è a buon mercato e costantemente sempre più conveniente. Basta acquistare tre nuovi drive USB da 1 TB (/ Backup primario / backup fuori sede) ogni 6 mesi per un costo totale di $ 240 o qualsiasi altra cosa. Anche il backup su nastro non è irragionevole.

500 Gb l'anno non è molto, e hard disk sono sempre meno costosi ogni anno

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top