是否有一个分布式版本控制系统(git、集市,善变的,darcs等)。 可以处理的文件比用RAM?

我需要能够犯下巨大的二进制文件(即数据集,源视频/图像档案库),但是我不需要,以便能够比较,就能够提交,然后更新该文件时的变化。

我去看着这个大约一年前,并没有任何显而易见的候选人,允许这一点,因为他们是所有旨在差异存在的速度。这给我留下了一个风险管理的代码和其他东西("资产管理"的软件,或只是可和脚本)对于大型文件,这是很丑陋的时目录结构的两个重叠。

有帮助吗?

解决方案

它已经3年,因为我问这个问题,但是,作为2.0版的善变,包括 largefiles扩展, ,其完成什么我最初找:

该largefiles的扩展使用于跟踪大,不可压缩的二进制文件的善变,而不需要过多的带宽为克隆和拉。文件中添加如largefiles不会跟踪直接通过善变;相反,他们的修改确定由检验和,善变的轨道,这些校验和。这种方式,在克隆一个储存库中或者拉在变更集中,大型文件中的老年修订的储存库是没有必要的,只有那些需要更新目前的版本是下载。这节省了这两个磁盘空间和带宽。

其他提示

没有免费分发的版本控制系统的支持。如果你想要这个功能,你将得到执行。

你可以写关文件他们是感兴趣的原始性能为Linux内核开发的使用情况。这是不可能的他们会接受的性能,贸易在扩展到巨大的二进制文件。我不知道善变的,但他们似乎已经做出类似的选择尽可能的非鉴于联他们的运作模式,以他们存储模型的绩效。

在原则上,市场应当能够支持你的使用情况与一个插件,实现树枝/库格式的磁盘上存储和执行的战略是优化使用情况。在情况的内部结构块你,你释放有用的代码,我期望的核心开发人员将帮助解决内部结构。此外,您可以设置一个功能开发合同规范的。

可能是最务实的方法,不考虑具体DVC将是建立一个混合动力系统:实现一个巨大的文件存储和存储引用blob在这家商店进入DVC的选择。

全面披露:我是一名前雇员的规范和密切合作与市场开发。

是的, 塑料SCM.它的分布和管理巨大的文件在块4m所以它不限于通过具有载他们全上存在的任何时间。找到一个教程DVC在这里:http://codicesoftware.blogspot.com/2010/03/distributed-development-for-windows.html

BUP可能是你要找的。它的建立是作为一个延伸内的功能性做备份,但是这是有效的同样的事情。它打破了文件成块,并使用一个滚动的散列使文件的内容可/做的高效率的储存。

我认为它将是低效率的存储二进制文件的任何形式的版本控制系统。

更好的想法是将存储的元数据文本文件的储存库中引用的二进制的对象。

没有要分发的?据说一个巨大利益的颠复已经为较新,分布Vcs是其优越的能力,以处理二进制文件。

我得出的结论,最好的解决办法在这种情况下,将使用的容量.

是的容量并不是一个DVC但是:

  • 你可以分配空间,用于储存库,通过创造新的FS
  • 你可以跟踪变化,通过创建的快照
  • 你可以送快照(承诺),另一个容量数据集
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top