我们收到多成千上万的平面文件,每星期前,我有一个系统的运行的报告上的这些和出口他们PDF为我们的人民进程和参考。

我现在散装载这些成一个数据库,确保所有领域/格式是否有效,出口,并截断表上的下一个运行。

我想知道为什么每个人都认为是最高效的空间的方式来存储可能6个月,这种批量负荷的纯文本的数据?

无论是在形式的日常SQL备份、或压缩的档案,或什么的,所以我总是有能力重装的旧数据。

任何想法是值得欢迎的,我是开放的任何建议。

有帮助吗?

解决方案

所以,你的散装载平面文件的原始数据,则使用SQL服务器2005年对它们进行处理,并得到一个独立的堆的处理平面文件,然后转储的数据?

好吧,如果这是正确的,SQL备份不会帮助因为你似乎是说,数据不留在数据库。你唯一的选择是有效的压缩的输入和/或产出的文件,加上良好的组织的批次中的目录。

我会推荐一个积极的压缩程序,已计划批处理的功能,但是要小心,不要得到深奥的程序的使用是为了避免被锁定在一个节目的...

其他提示

使用最近产生压缩效用(7z和rar压缩都是伟大)和压缩进束后,组织了一切所以很容易找到。

有SDK for7zip,工作。净使这个容易的。

-亚当

有两种类型的数据后分析:

  • 原始数据(通常非常大的)
  • 得出的数据(通常更小)

你的情况,得出的数据可能有的数据,进入你的报告。为你的原始数据我只是做一个巨大的、压缩后存档文件的一个系统的名称,根据日期和类型的数据。值的是,如果一些新手你的团队以某种方式完全抹杀的代码进口你的原始数据纳入数据库,可以从中恢复。如果所导出的数据是小,你可能会认为关于复制,要么另一个数据库表,或保持在一个单独的平面文件,因为一些你的问题可以解决刚刚到来的数据。

备份数据中,一般是一个棘手的问题,因为它取决于一样东西:

  • 数据的数量吞吐量
  • 可用空间,用于场外备份
  • 值的升级您的备份系统对刚辞职你自己再生的数据,如果问题发生。

你叫什么来?将硬盘驱动器的成长不够快,以保持压缩版本的数据?你有没有想过场外备份吗?

建造一个文件的层次结构中组织的文件适当的,拉链的整体目录和使用 -u 标志上拉链中添加新的文件。后存档,可以删除的文件,但保留目录的结构为下一批加入。

如果文件的名字编码版本以某种方式(日期或无论),或者是无独特的,它不需要是任何爱好者于一个劲儿地目录。如果不是,你需要设置你的目录,让你恢复的版本。

压他们,并将其保存在一个二进制领域的数据库。然后你就可以建立一个"刷新的数据集"的按钮以做到把你的数据集(我假设你跟踪每个数据集进口来取代它,等等。)

这种方式,都存储在数据库,并支持与数据库、编制索引和连接是否正确,以及压缩在同一时间。

你说你想要避免的软件开发工具包和安装软件远程系统。

你的选择很有限。

因为你使用的windows的计算机,为什么不用一个简单的剧本吗?

这个问题提供若干建议,关于如何使用windows VBscript压缩解压缩文件:
可以Windows'内在的拉链压缩编写脚本?

没什么"安装",没有软件开发工具包。只是复制的脚上,把它通过调度程序,和你所有的设置。

-亚当

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top