Gitリポジトリのサブディレクトリのみを複製するにはどうすればよいですか?
-
03-07-2019 - |
質問
ルートに2つのサブディレクトリがあるGitリポジトリがあります:
/finisht
/static
これが SVN にあったとき、 / finisht
がチェックアウトされました / static
は他の場所でチェックアウトされましたが、次のようになります。
svn co svn+ssh://admin@domain.com/home/admin/repos/finisht/static static
Gitでこれを行う方法はありますか?
解決
編集:Git 2.19の時点で、これが最終的に可能になりました。これは、この回答でわかるように: https://stackoverflow.com/a/52269934/2988 。
その答えを支持することを検討してください。
注:Git 2.19では、クライアント側のサポートのみが実装され、サーバー側のサポートはまだ欠落しているため、ローカルリポジトリを複製する場合にのみ機能します。また、大規模なGitホスティング業者、たとえばGitHubは、実際にはGitサーバーを使用せず、独自の実装を使用するため、Gitサーバーにサポートが表示されても、Gitホスティングで動作することを自動的に意味するわけではありません。 (OTOH、Gitサーバーを使用しないため、Gitサーバーに表示される前に独自の実装でより速く実装できます。)
いいえ、Gitでは不可能です。
Gitでこのようなものを実装することは相当な努力であり、クライアント側リポジトリの整合性が保証されなくなることを意味します。興味がある場合は、「スパースクローン」に関するディスカッションを検索してください。および「スパースフェッチ」 gitメーリングリストで。
一般に、Gitコミュニティでのコンセンサスは、常に独立してチェックアウトされるディレクトリが複数ある場合、これらは実際には2つの異なるプロジェクトであり、2つの異なるリポジトリに存在するということです。 Gitサブモジュールを使用して、それらを貼り付けることができます。
他のヒント
やろうとしていることはスパースチェックアウトと呼ばれ、その機能はgit 1.7.0(2012年2月)で追加されました。スパースクローンを実行する手順は次のとおりです。
mkdir <repo>
cd <repo>
git init
git remote add -f origin <url>
これにより、リモートで空のリポジトリが作成され、すべてのオブジェクトが取得されますが、チェックアウトはされません。それから:
git config core.sparseCheckout true
ここで、実際にチェックアウトするファイル/フォルダーを定義する必要があります。これは、それらを .git / info / sparse-checkout
にリストすることで行われます。例:
echo "some/dir/" >> .git/info/sparse-checkout
echo "another/sub/tree" >> .git/info/sparse-checkout
最後になりましたが、空のリポジトリをリモートからの状態で更新します:
git pull origin master
「チェックアウト済み」ファイルが作成されます。ファイルシステム上の some / dir
および another / sub / tree
に対して(これらのパスはまだ)、他のパスは存在しません。
拡張チュートリアルをご覧ください。 a>公式のスパースチェックアウトのドキュメントをお読みください。 。
関数として:
function git_sparse_clone() (
rurl="$1" localdir="$2" && shift 2
mkdir -p "$localdir"
cd "$localdir"
git init
git remote add -f origin "$rurl"
git config core.sparseCheckout true
# Loops over remaining args
for i; do
echo "$i" >> .git/info/sparse-checkout
done
git pull origin master
)
使用法:
git_sparse_clone "http://github.com/tj/n" "./local/location" "/bin"
これにより、サーバーからリポジトリ全体がダウンロードされます&#8211;チェックアウトのサイズのみが縮小されます。現時点では、単一のディレクトリのみのクローンを作成することはできません。ただし、リポジトリの履歴が必要ない場合は、少なくとも浅いクローンを作成することで帯域幅を節約できます。浅い udondanの回答をご覧ください。 docs / git-clone "rel =" noreferrer ">クローンおよびスパースチェックアウト。
スパースチェックアウトと shallow clone 機能を組み合わせることができます。 shallow clone は履歴を遮断し、スパースチェックアウトはパターンに一致するファイルのみをプルします。
git init <repo>
cd <repo>
git remote add origin <url>
git config core.sparsecheckout true
echo "finisht/*" >> .git/info/sparse-checkout
git pull --depth=1 origin master
これを機能させるには、最小git 1.9が必要です。 2.2.0および2.2.2でのみ自分でテストしました。
この方法では、引き続きプッシュできますが、これは git archive
では不可能です。
Git 2.19のgit clone --filter
このオプションは、実際にサーバーからの不要なオブジェクトの取得をスキップします。
git clone --depth 1 --no-checkout --filter=blob:none \
"file://$(pwd)/server_repo" local_repo
cd local_repo
git checkout master -- mydir/
サーバーは次で構成する必要があります:
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
v2.19.0でこの機能をサポートするためにGitリモートプロトコルに拡張が行われましたが、その時点ではサーバーサポートはありません。ただし、すでにローカルでテストできます。
TODO:-filter = blob:none
はすべてのBLOBをスキップしますが、すべてのツリーオブジェクトをフェッチします。しかし、通常のレポでは、これはファイル自体と比較して小さいはずなので、これで十分です。質問: https://www.spinics.net/lists/git/msg342006.html 開発者は、それを行うために-filter = tree:0
が開発中であると答えました。 2.20で追加されました。
-depth 1
は既に-single-branch
を意味していることを忘れないでください。 Gitで単一のブランチのクローンを作成するにはどうすればよいですか
git clone
プロトコルの問題を克服するには、 file:// $(path)
が必要です:ローカルgitリポジトリを相対パスで浅くクローンする方法は?
-filter
の形式は、 man git-rev-list
に記載されています。
Gitツリー上のドキュメント:
- https://github.com/ git / git / blob / v2.19.0 / Documentation / technical / partial-clone.txt
- https:// github。 com / git / git / blob / v2.19.0 / Documentation / rev-list-options.txt#L720
- https://github.com/ git / git / blob / v2.19.0 / t / t5616-partial-clone.sh
テストする
#!/usr/bin/env bash
set -eu
list-objects() (
git rev-list --all --objects
echo "master commit SHA: $(git log -1 --format="%H")"
echo "mybranch commit SHA: $(git log -1 --format="%H")"
git ls-tree master
git ls-tree mybranch | grep mybranch
git ls-tree master~ | grep root
)
# Reproducibility.
export GIT_COMMITTER_NAME='a'
export GIT_COMMITTER_EMAIL='a'
export GIT_AUTHOR_NAME='a'
export GIT_AUTHOR_EMAIL='a'
export GIT_COMMITTER_DATE='2000-01-01T00:00:00+0000'
export GIT_AUTHOR_DATE='2000-01-01T00:00:00+0000'
rm -rf server_repo local_repo
mkdir server_repo
cd server_repo
# Create repo.
git init --quiet
git config --local uploadpack.allowfilter 1
git config --local uploadpack.allowanysha1inwant 1
# First commit.
# Directories present in all branches.
mkdir d1 d2
printf 'd1/a' > ./d1/a
printf 'd1/b' > ./d1/b
printf 'd2/a' > ./d2/a
printf 'd2/b' > ./d2/b
# Present only in root.
mkdir 'root'
printf 'root' > ./root/root
git add .
git commit -m 'root' --quiet
# Second commit only on master.
git rm --quiet -r ./root
mkdir 'master'
printf 'master' > ./master/master
git add .
git commit -m 'master commit' --quiet
# Second commit only on mybranch.
git checkout -b mybranch --quiet master~
git rm --quiet -r ./root
mkdir 'mybranch'
printf 'mybranch' > ./mybranch/mybranch
git add .
git commit -m 'mybranch commit' --quiet
echo "# List and identify all objects"
list-objects
echo
# Restore master.
git checkout --quiet master
cd ..
# Clone. Don't checkout for now, only .git/ dir.
git clone --depth 1 --quiet --no-checkout --filter=blob:none "file://$(pwd)/server_repo" local_repo
cd local_repo
# List missing objects from master.
echo "# Missing objects after --no-checkout"
git rev-list --all --quiet --objects --missing=print
echo
echo "# Git checkout fails without internet"
mv ../server_repo ../server_repo.off
! git checkout master
echo
echo "# Git checkout fetches the missing directory from internet"
mv ../server_repo.off ../server_repo
git checkout master -- d1/
echo
echo "# Missing objects after checking out d1"
git rev-list --all --quiet --objects --missing=print
Git v2.19.0での出力:
# List and identify all objects
c6fcdfaf2b1462f809aecdad83a186eeec00f9c1
fc5e97944480982cfc180a6d6634699921ee63ec
7251a83be9a03161acde7b71a8fda9be19f47128
62d67bce3c672fe2b9065f372726a11e57bade7e
b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
308150e8fddde043f3dbbb8573abb6af1df96e63 d1/a
f70a17f51b7b30fec48a32e4f19ac15e261fd1a4 d1/b
84de03c312dc741d0f2a66df7b2f168d823e122a d2
0975df9b39e23c15f63db194df7f45c76528bccb d2/a
41484c13520fcbb6e7243a26fdb1fc9405c08520 d2/b
7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
8b25206ff90e9432f6f1a8600f87a7bd695a24af master/master
ef29f15c9a7c5417944cc09711b6a9ee51b01d89
19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
1b671b190e293aa091239b8b5e8c149411d00523 mybranch/mybranch
c3760bb1a0ece87cdbaf9a563c77a45e30a4e30e
a0234da53ec608b54813b4271fbf00ba5318b99f root
93ca1422a8da0a9effc465eccbcb17e23015542d root/root
master commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
mybranch commit SHA: fc5e97944480982cfc180a6d6634699921ee63ec
040000 tree b64bf435a3e54c5208a1b70b7bcb0fc627463a75 d1
040000 tree 84de03c312dc741d0f2a66df7b2f168d823e122a d2
040000 tree 7d5230379e4652f1b1da7ed1e78e0b8253e03ba3 master
040000 tree 19f7a4ca4a038aff89d803f017f76d2b66063043 mybranch
040000 tree a0234da53ec608b54813b4271fbf00ba5318b99f root
# Missing objects after --no-checkout
?f70a17f51b7b30fec48a32e4f19ac15e261fd1a4
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
?308150e8fddde043f3dbbb8573abb6af1df96e63
# Git checkout fails without internet
fatal: '/home/ciro/bak/git/test-git-web-interface/other-test-repos/partial-clone.tmp/server_repo' does not appear to be a git repository
fatal: Could not read from remote repository.
Please make sure you have the correct access rights
and the repository exists.
# Git checkout fetches the missing directory from internet
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
remote: Enumerating objects: 1, done.
remote: Counting objects: 100% (1/1), done.
remote: Total 1 (delta 0), reused 0 (delta 0)
Receiving objects: 100% (1/1), 45 bytes | 45.00 KiB/s, done.
# Missing objects after checking out d1
?8b25206ff90e9432f6f1a8600f87a7bd695a24af
?41484c13520fcbb6e7243a26fdb1fc9405c08520
?0975df9b39e23c15f63db194df7f45c76528bccb
結論: d1 /
の外部からのすべてのblobが欠落しています。例えば。 d1 / a
をチェックアウトした後、 0975df9b39e23c15f63db194df7f45c76528bccb
は d2 / b
ではありません。
root / root
および mybranch / mybranch
も欠落していることに注意してください。ただし、-depth 1
は欠落しているファイルのリストからそれを隠します。 -depth 1
を削除すると、不足しているファイルのリストに表示されます。
私には夢があります
この機能はGitに革命をもたらす可能性があります。
エンタープライズのすべてのコードベースを想像してください repo
想像してみてください thirdいサードパーティなしでリポジトリに巨大な塊を直接保存する拡張機能。
GitHubが星や権限などのファイル/ディレクトリメタデータごとを許可する場合を想像してください。すべての個人データを1つのリポジトリに保存できます。
GitHubからファイル/フォルダーを ダウンロードしたい 他のユーザーの場合は、次を使用します。 e.g。 (はい、それはここのsvnです。どうやら2016年には、いくつかのgithubファイルを単にダウンロードするためにまだsvnが必要です) 礼儀:単一のフォルダーまたはディレクトリをダウンロードGitHubリポジトリ 重要-github URLを更新し、 bashスクリプトとして: 注
このメソッドは、フォルダーをダウンロードしますが、複製/チェックアウトはしません。変更をリポジトリにプッシュバックすることはできません。一方、これにより、スパースチェックアウトまたはシャローチェックアウトと比較してダウンロードが小さくなります。svn export <repo>/trunk/<folder>
svn export https://github.com/lodash/lodash.com/trunk/docs
/ tree / master /
を「/ trunk /」に置き換えてください。git-download(){
folder=${@/tree\/master/trunk}
folder=${folder/blob\/master/trunk}
svn export $folder
}
クローン元のリポジトリとやり取りする予定がない場合は、完全な git clone を実行し、 git filter-branch --subdirectory-filter を使用してリポジトリを書き換えることができます
強い>。これにより、少なくとも履歴が保存されます。Git 1.7.0には&#8220;スパースチェックアウト&#8221;があります。見る &#8220; core.sparseCheckout&#8221; git config マンページで、 &#8220;スパースチェックアウト&#8221; git read-tree マンページ、および &#8220; Skip-worktree bit&#8221; git update-index マンページ。
インターフェースはSVNほど便利ではありません(たとえば、最初のクローン時にスパースチェックアウトを行う方法はありません)が、よりシンプルなインターフェースを構築できる基本機能が利用可能になりました。
これははるかに単純に見えます:
git archive --remote=<repo_url> <branch> <path> | tar xvf -
Gitでのみサブディレクトリのクローンを作成することはできませんが、以下にいくつかの回避策を示します。
フィルターブランチ
trunk / public_html /
がプロジェクトルートであるかのようにリポジトリを書き換え、他のすべての履歴を破棄できます( filter-branch
)、既にチェックアウトされているブランチを試してください:
git filter-branch --subdirectory-filter trunk/public_html -- --all
注:フィルターブランチオプションをリビジョンオプションから分離する-
と、すべてのブランチとタグを書き換える-all
。元のコミット時間またはマージ情報を含むすべての情報は、保存されます。このコマンドは .git / info / grafts
ファイルと refs / replace /
名前空間のrefを優先するため、グラフトまたは置換 refs
がある場合定義すると、このコマンドを実行すると永続的になります。
警告!書き換えられた履歴は、すべてのオブジェクトに対して異なるオブジェクト名を持ち、元のブランチに収束しません。書き換えたブランチを元のブランチの上に簡単にプッシュして配布することはできません。完全な意味がわからない場合は、このコマンドを使用しないでください。単純な単一のコミットで問題を解決できる場合は、使用を避けてください。
スパースチェックアウト
作業ディレクトリをまばらに埋めるスパースチェックアウトアプローチの簡単な手順を以下に示します。 Gitに、作業ディレクトリ内のどのフォルダーまたはファイルをチェックアウトする価値があるかを伝えます。
-
通常どおりのリポジトリのクローン作成(
-no-checkout
はオプション):git clone --no-checkout git@foo/bar.git cd bar
リポジトリのクローンをすでに作成している場合は、この手順をスキップできます。
ヒント:大規模なリポジトリの場合、浅いクローン(
-depth 1
)最新リビジョンのみ、または/および-single-branch
のみをチェックアウトします。 -
sparseCheckout
オプションを有効にする:git config core.sparseCheckout true
-
スパースチェックアウト用のフォルダーを指定します(末尾にスペースなし):
echo "trunk/public_html/*"> .git/info/sparse-checkout
または
.git / info / sparse-checkout
を編集します。 -
ブランチをチェックアウトします(例:
master
):git checkout master
これで、現在のディレクトリでフォルダーを選択する必要があります。
代わりにディレクトリのレベルが多すぎたり、ブランチをフィルタリングしている場合は、シンボリックリンクを検討できます。
使用法:
python get_git_sub_dir.py path/to/sub/dir <RECURSIVE>
これは、単一のサブディレクトリスパースチェックアウトのユースケース用に記述したシェルスクリプトです
coSubDir.sh
localRepo=$1
remoteRepo=$2
subDir=$3
# Create local repository for subdirectory checkout, make it hidden to avoid having to drill down to the subfolder
mkdir ./.$localRepo
cd ./.$localRepo
git init
git remote add -f origin $remoteRepo
git config core.sparseCheckout true
# Add the subdirectory of interest to the sparse checkout.
echo $subDir >> .git/info/sparse-checkout
git pull origin master
# Create convenience symlink to the subdirectory of interest
cd ..
ln -s ./.$localRepo$subDir $localRepo
これにより、特定のフォルダーが複製され、そのフォルダーに関係のないすべての履歴が削除されます。
git clone --single-branch -b {branch} git@github.com:{user}/{repo}.git
git filter-branch --subdirectory-filter {path/to/folder} HEAD
git remote remove origin
git remote add origin git@github.com:{user}/{new-repo}.git
git push -u origin master