是否有一个简单的 shell 命令/脚本支持从存档中排除某些文件/文件夹?

我有一个目录需要与一个子目录一起归档,该子目录中有许多我不需要备份的非常大的文件。

不完全解决方案:

tar --exclude=PATTERN 命令匹配给定的模式并排除这些文件,但我需要忽略特定的文件和文件夹(完整文件路径),否则可能会排除有效的文件。

我还可以使用 find 命令创建文件列表并排除我不想存档的文件并将列表传递给 tar,但这仅适用于少量文件。我有几万。

我开始认为唯一的解决方案是创建一个包含要排除的文件/文件夹列表的文件,然后使用 rsync 与 --exclude-from=file 将所有文件复制到 tmp 目录,然后使用 tar 对该目录进行归档。

有人能想到更好/更有效的解决方案吗?

编辑: 马朝旭的解决方案效果很好。最大的问题是 --exclude='./folder' 必须 位于 tar 命令的开头。完整命令(首先 cd,因此备份是相对于该目录的):

cd /folder_to_backup
tar --exclude='./folder' --exclude='./upload/folder2' -zcvf /backup/filename.tgz .
有帮助吗?

解决方案

您可以有多个排除焦油选项,以便

$ tar --exclude='./folder' --exclude='./upload/folder2' -zcvf /backup/filename.tgz .

等将工作。制作的确定把前源和目标项目--exclude

其他提示

您可以用--exclude焦油排除目录。

如果您要存档除了/usr你可以用一切:

tar -zcvf /all.tgz / --exclude=/usr

在你的情况可能是这样

tar -zcvf archive.tgz arc_dir --exclude=dir/ignore_this_dir

可能的选项用tar排除从备份文件/目录:

使用多个图案排除文件

tar -czf backup.tar.gz --exclude=PATTERN1 --exclude=PATTERN2 ... /path/to/backup

排除使用填充有图案的列表的排除文件的文件

tar -czf backup.tar.gz -X /path/to/exclude.txt /path/to/backup

通过将标签文件中应当被跳过任何目录中排除使用标记文件

tar -czf backup.tar.gz --exclude-tag-all=exclude.tag /path/to/backup

有许多答案老问题,但是我发现没有一个是很对我来说很清楚,所以我想补充我的尝试。

如果你具有以下结构

/home/ftp/mysite/

用下面的文件/文件夹

/home/ftp/mysite/file1
/home/ftp/mysite/file2
/home/ftp/mysite/file3
/home/ftp/mysite/folder1
/home/ftp/mysite/folder2
/home/ftp/mysite/folder3

所以,你想包含everyting内的/ home / FTP / mysite的(该网站移动到新的服务器)tar文件,但file3只是垃圾,而且也没有必要在folder3一切,所以我们将跳过这两个

我们使用的格式

tar -czvf <name of tar file> <what to tar> <any excludes>

所在的C =建立,Z =拉链和v =详细(你可以看到这些文件,因为它们进入,有用的,以确保没有你排除被添加的文件)。和f =文件。

所以,我的命令看起来像这样

cd /home/ftp/
tar -czvf mysite.tar.gz mysite --exclude='file3' --exclude='folder3'

请注意文件/排除的文件夹都是比较你的焦油的根目录(我试图在这里相对于完整路径/但我不能使这项工作)。

希望这会帮助别人(和我下一次我google一下)

您可以使用标准的“蚁族符号”,以排除相关目录。点击 这对我的作品,但不包括任何git的或node_module目录。

tar -cvf myFile.tar --exclude=**/.git/* --exclude=**/node_modules/*  -T /data/txt/myInputFile.txt 2> /data/txt/myTarLogFile.txt

myInputFile.txt包含:

/ DEV2 / java的结果 / DEV2 / JavaScript的

我已经经历的是,至少与所述的 Cygwin的焦油的版本我使用(“CYGWIN_NT-5.1 1.7.17(0.262 / 5/3)二○一二年十月一十九日14: 39点i686的Cygwin的”在Windows XP家庭版SP3的机器上),选项的顺序很重要。

虽然这种结构为我工作:

tar cfvz target.tgz --exclude='<dir1>' --exclude='<dir2>' target_dir

这一个的没有工作:

tar cfvz --exclude='<dir1>' --exclude='<dir2>' target.tgz target_dir

此,而tar --help揭示了以下内容:

tar [OPTION...] [FILE]

所以,第二个命令也应该工作,但显然它似乎并没有这样的情况?

最佳RGDS,

此排除模式处理的文件名的后缀等PNG或MP3以及目录名等的.git和node_modules

tar --exclude={*.png,*.mp3,*.wav,.git,node_modules} -Jcf ${target_tarball}  ${source_dirname}

我发现这个其他地方,所以我不会采取信贷,但它比任何上面我的Mac具体问题(即使是关闭的)的解决方案更好地工作:

tar zc --exclude __MACOSX --exclude .DS_Store -f <archive> <source(s)>

对于那些谁拥有它的问题,焦油的一些版本将只正常无“./”在排除值工作。

Tar --version
  

焦油(GNU焦油)1.27.1

命令语法工作:

tar -czvf ../allfiles-butsome.tar.gz * --exclude=acme/foo

这些将不起作用:

$ tar -czvf ../allfiles-butsome.tar.gz * --exclude=./acme/foo
$ tar -czvf ../allfiles-butsome.tar.gz * --exclude='./acme/foo'
$ tar --exclude=./acme/foo -czvf ../allfiles-butsome.tar.gz *
$ tar --exclude='./acme/foo' -czvf ../allfiles-butsome.tar.gz *
$ tar -czvf ../allfiles-butsome.tar.gz * --exclude=/full/path/acme/foo
$ tar -czvf ../allfiles-butsome.tar.gz * --exclude='/full/path/acme/foo'
$ tar --exclude=/full/path/acme/foo -czvf ../allfiles-butsome.tar.gz *
$ tar --exclude='/full/path/acme/foo' -czvf ../allfiles-butsome.tar.gz *

有关的Mac OSX我不得不做

tar -zcv --exclude='folder' -f theOutputTarFile.tar folderToTar

请注意的-f--exclude=

我同意 --exclude 标志是正确的方法。

$ tar --exclude='./folder_or_file' --exclude='file_pattern' --exclude='fileA'

一句话 警告 对于我没有立即发现明显的副作用:本例中排除“fileA”将搜索“fileA” 递归地!

示例:具有单个子目录的目录,其中包含同名文件 (data.txt)

data.txt
config.txt
--+dirA
  |  data.txt
  |  config.docx
  • 如果使用 --exclude='data.txt' 存档将不包含 任何一个 数据.txt 文件。如果归档第三方库(例如 node_modules 目录),这可能会导致意外结果。

  • 为了避免这个问题,请确保提供完整路径,例如 --exclude='./dirA/data.txt'

要处理几万文件时,为了避免由于使用'xargs: Argument list too long'的可能find ... | xargs ...错误,则可以管find的输出直接使用tar find ... -print0 | tar --null ...

# archive a given directory, but exclude various files & directories 
# specified by their full file paths
find "$(pwd -P)" -type d \( -path '/path/to/dir1' -or -path '/path/to/dir2' \) -prune \
   -or -not \( -path '/path/to/file1' -or -path '/path/to/file2' \) -print0 | 
   gnutar --null --no-recursion -czf archive.tar.gz --files-from -
   #bsdtar --null -n -czf archive.tar.gz -T -

阅读此线程后,我做了RHEL 5上的一个小测试,这里是我的tarring了ABC目录结果:

这将排除的目录下的目录和错误日志和所有文件:

tar cvpzf abc.tgz abc/ --exclude='abc/error' --exclude='abc/logs'

排除目录将排除的文件,但保留目录后添加一个通配符:

tar cvpzf abc.tgz abc/ --exclude='abc/error/*' --exclude='abc/logs/*'

与焦油的append(-r)选项一起使用查找命令。这种方式可以在单个步骤中的文件添加到现有的焦油,而不是一个二阶段溶液(创建文件的列表,创建焦油)。

find /dir/dir -prune ... -o etc etc.... -exec tar rvf ~/tarfile.tar {} \;

您还可以根据需要使用“--exclude-tag”选项之一:

  • --排除标签=文件
  • --排除标签全部=文件
  • --exclude-tag-under=文件

将排除托管指定文件的文件夹。

您可以使用的cpio(1)创建tar文件。的cpio需要的文件,标准输入存档,因此,如果你已经想通了要使用选择的文件归档find命令,管道将它导入的cpio创建tar文件:

find ... | cpio -o -H ustar | gzip -c > archive.tar.gz

的GNU tar v 1.26 --exclude需要来存档文件和备份目录参数之后,应该没有开头或结尾的斜线,并且更喜欢不带引号(单人或双人)。所以相对于父目录进行备份,它是:

tar cvfz /path_to/mytar.tgz ./dir_to_backup --exclude=some_path/to_exclude

在阅读了不同版本的所有这些好答案并为自己解决了问题之后,我认为 有一些非常重要的小细节,但对于 GNU/Linux 的一般用途来说是很少见的, ,这还不够强调,值得更多的评论。

因此,我不会尝试回答每种情况的问题,而是尝试注册 去哪里看 当事情不起作用时。

请务必注意:

  1. 选项的顺序很重要: 在要备份的文件选项和目录之前和之后放置 --exclude 是不一样的。这至少对我来说是出乎意料的,因为根据我的经验,在 GNU/Linux 命令中,通常选项的顺序并不重要。
  2. 不同的 tar 版本需要以不同的顺序使用此选项: 例如, @安德鲁的回答 表示在 GNU tar v 1.26 和 1.28 中排除项排在最后,而在我的例子中,对于 GNU tar 1.29,则相反。
  3. 尾部斜杠很重要: :至少在 GNU tar 1.29 中, 不应该是任何.

就我而言,对于 Debian Stretch 上的 GNU tar 1.29,有效的命令是

tar --exclude="/home/user/.config/chromium" --exclude="/home/user/.cache" -cf file.tar  /dir1/ /home/ /dir3/

引号并不重要,有或没有它们都有效。

我希望这对某人有用。

您最好的选择是使用焦油发现,通过xargs的(处理大量的参数)。例如:

find / -print0 | xargs -0 tar cjf tarfile.tar.bz2
tar -cvzf destination_folder source_folder -X /home/folder/excludes.txt

-X表示含在必须从备份中排除的文件名列表的文件。例如,你可以指定*〜在这个文件中不包括在备份与〜结尾的文件名。

可能冗余的答案,但因为我发现它是有用的,在这里它是:

虽然一个FreeBSD根(即,使用CSH)我想我的整个根文件系统复制到/ mnt但没有/ usr和(显然)/ mnt上。这是什么工作(我在/):

tar --exclude ./usr --exclude ./mnt --create --file - . (cd /mnt && tar xvd -)

我的整个点是,这是必要的(通过将在 ./ )以指定的焦油被排除的目录,其中正被复制的更大的目录的一部分。

我€0.02

我没有运气让 tar 排除几层深度的 5 GB 子目录。最后,我只是使用了unix Zip命令。这对我来说容易多了。

因此,对于原始帖子中的这个特定示例
(tar --exclude='./folder' --exclude='./upload/folder2' -zcvf /backup/filename.tgz 。)

等价的是:

zip -r /备份/文件名.zip 。-x 上传/文件夹/**\* 上传/文件夹2/**\*

(笔记:这是我最初使用的对我有帮助的帖子 https://superuser.com/questions/312301/unix-zip-directory-but-excluded-specific-subdirectories-and-everything-within-t)

检查出来

tar cvpzf zip_folder.tgz . --exclude=./public --exclude=./tmp --exclude=./log --exclude=fileName

以下bash脚本应该做的伎俩。它采用了答案给出由Marcus Sundman这里

#!/bin/bash

echo -n "Please enter the name of the tar file you wish to create with out extension "
read nam

echo -n "Please enter the path to the directories to tar "
read pathin

echo tar -czvf $nam.tar.gz
excludes=`find $pathin -iname "*.CC" -exec echo "--exclude \'{}\'" \;|xargs`
echo $pathin

echo tar -czvf $nam.tar.gz $excludes $pathin

这将显示出你所需要的命令,你可以直接复制并粘贴回。有可能是直接提供给它的命令行更优雅的方式。

只要改变* .CC任何其他常见的扩展名,文件名或要排除的正则表达式,这应该仍然工作。

修改

只需增加一个小的解释;发现生成匹配正则表达式选择(在这种情况下* .CC)的文件的列表。这个列表是通过xargs的回声命令传递。这将打印--exclude“从列表中的一个条目”。斜线()是转义字符为'标记。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top