最近,我发现自己在管理层希望从数据库中删除数据的能力的数据库纠结,但还是希望这样的数据出现在其他地方。例如:他们要删除的产品靠尖端的所有实例,但他们仍然希望whizbang的出现在销售报告。 (如果他们跑一个以前的日期)。

现在我可以添加一个字段,说IS_DELETED,将跟踪该产品是否已被删除,因此仍然保持我的所有引用,但过了一段时间,我有住房的大量死亡数据的潜力。 (数据是永远不会再次访问)。如何处理这不是我的问题。

我很好奇,想找到答案,在你的经验是什么数据的平均寿命?也就是说,平均多久数据活着还是很好的,然后才会慢慢要么替换或删除?据我所知,这是相对于你的住房,但可以肯定的所有数据的数据类型已经某种寿命?

有帮助吗?

解决方案

数据长存...或者经常它应该。一个常见的做法是,结束和/或开始为创纪录的日期。因此,对于你whizbang的,你有一个起始日期(这样就不会在销售报告显示它的正式推出前),和结束日期(以使其脱落的报告,它已经lifed结束后)。使用合适的日期为您的报告,以及应用程序的标准,你不会看到,除了当你应该靠尖端,并且数据仍然存在(它应该,理论上无限)。

由于Koistya纳文提到,在某一点移动数据到数据仓库也是一种选择,但是这在很大程度上取决于你的“老”的数据有多大,你需要多长时间才能保持它随时可供访问。

其他提示

我们的许多客户保持数据在线2年。之后,它的移动到备份磁盘,但如果需要,它可以被放到网上。

考虑添加的列“过期”或“有效日期”。这将允许你标记的产品为已过时,但报告将返回该产品如果时间范围是满意的。

通常最好是这样的数据移动到seporate数据库(数据库仓库),并保持工作数据库干净。在数据仓库的数据可以保存多年而不影响您的应用程序。

参考:数据仓库的维基百科

我一直用的是执政的身体找不见了。例如国税局希望你能保持7年历史或出于安全原因,我们保持3年的日志信息等,所以我想你可以做两件事情,确定您的数据的生命周期是什么,我会那女孩说今后几年将是够了,那么你可以用这种方式,你将能够标记一些数据删除迟早的日期一起加入IS_DELETED标志。

是,所有数据具有寿命。是的,它是相对于你有数据的类型。

某些数据具有以秒为单位(认证令牌,例如)的使用期限,某种其他数据虚拟永恒(比它被存储到,例如像所有权的记录介质和格式更多)。

您将不得不或者更具体的数据类型你设想,或者在您自己的组织做了普查,以东西通常寿命。

我们的特定味道而改变。我们有一些数据(绝大多数),这3个月后变陈旧(硬产品的限制),但可以在任何日后恢复。

我们有其它数据实际上是不会死。

在实践中,大多数我们服务了数据的新鲜和频繁请求的几周,顶多一个月,下降到零星使用前。

有多少是“死了不少数据”?

随着处理能力和数据存储这么便宜,除非有一个很好的理由,我不会清除旧数据。您还需要考虑法律问题。大(甚至小)公司可能为旧数据难以置信地长的保留策略,把自己节省数百万在路上时,他们被法官传唤吧。

我会检查你所拥有的任何法律部门,并找出需要的数据多长时间存储。这是最安全的选择。

此外,问问自己删除旧数据的好处是什么。是唯一受益整洁的数据库?如果是这样,我也不会做。你会看到一个10倍的性能提升?如果是的话,我会做到这一点。这确实是一个复杂的问题,虽然,这是艰难的,我们有所需的所有信息,给你很好的建议。

我有几个项目中,客户希望所有的历史数据(可以追溯到超过19年)。颇有几分真的老数据的格式错误,将是导入到新系统的噩梦。我们说服他们,他们将不需要的记录可以追溯到任何进一步的超过10年,但像你说的这一切都相对于你的住房数据的类型。

在一个侧面说明,数据存储是非常便宜,现在,如果它不影响你的应用程序的性能,我只是把它在哪里。

  

[...]但肯定所有数据都有某种形式的寿命?

没有任何一种寿命,我们可以意味深长地谈起的。大量的数据,只要它的创建或记录是无用的。这样的数据可以立即显示任何效果被丢弃。在另一方面,一些数据有足够的价值,它会活得比承载它的当前系统。如果亚马逊是完全替代其现有的基础设施,他们存储在客户历史记录仍然是极其宝贵的。

正如你所说,这是相对的。每种类型的数据有没有联系其他类型的数据的生命周期中它自己的寿命。毫无意义的“数据的平均寿命”。

  

我有壳体的潜在死很多的数据。 (数据是永远不会再次访问)。

但他们会当它们执行这些报告然后他们正在访问该数据。

在那之前,你需要保留数据以某种形式。移动到另一个表或等你提到有一个开关。

呃...在简单化的风险......这听起来像使用DateDeleted不是位会解决您怎么长到保留的问题。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top