在 C# 中确定两个路径是否引用同一文件的最佳方法
-
03-07-2019 - |
题
在即将到来的Java7中,有一个 新的API 检查两个文件对象是否是相同的文件引用。
.NET框架中是否提供了类似的API?
我在 MSDN 上搜索过,但没有任何启发。
我想要它简单,但我不想按文件名进行比较,这会导致硬/符号链接和不同样式的路径出现问题。(例如。 \\?\C:\
, C:\
).
我要做的只是防止重复的文件被拖放到我的链接列表中。
解决方案
据我所知(1) (2) (3) (4),JDK7的方式,是通过调用 GetFileInformationByHandle 文件并比较dwVolumeSerialNumber,nFileIndexHigh和nFileIndexLow。
每个MSDN:
您可以比较BY_HANDLE_FILE_INFORMATION结构中返回的VolumeSerialNumber和FileIndex成员,以确定两条路径是否映射到同一目标;例如,您可以比较两个文件路径并确定它们是否映射到同一目录。
我不认为这个函数是由.NET包装的,所以你必须使用 p /调用。
它可能适用于网络文件,也可能不适用。根据MSDN:
根据操作系统的基础网络组件和连接到的服务器类型,GetFileInformationByHandle函数可能会失败,返回部分信息或给定文件的完整信息。
快速测试显示它在使用SMB / Samba连接的Linux系统上使用符号链接按预期工作(相同值),但是当使用指向不同的共享访问时,它无法检测到文件是否相同相同的文件(FileIndex是相同的,但VolumeSerialNumber不同)。
其他提示
编辑:注意 @拉斯穆斯·法贝尔 提到了 通过句柄获取文件信息 Win32 api 中的函数,这就是你想要的,检查并投票他 回答 了解更多信息。
我认为你需要一个操作系统功能来为你提供你想要的信息,否则无论你做什么都会有一些误报。
例如,这些是否引用同一个文件?
- \服务器\共享\路径\文件名.txt
- \server\d$ emp\path\文件名.txt
我会检查列表中没有重复文件对您来说有多重要,然后尽最大努力。
话虽如此,Path 类中有一个方法可以完成一些工作: 获取完整路径, ,它至少会根据现有结构将路径扩展为长名称。之后您只需比较字符串即可。但它并不是万无一失的,并且不会处理我的示例中上面的两个链接。
回答:没有万无一失的方法可以与字符串基本路径进行比较以确定它们是否指向同一文件。
主要原因是看似不相关的路径可以指向与文件系统重定向(连接、符号链接等)完全相同的文件。例如
“ d: temp foo.txt”“ c: othertemp foo.txt”
这些路径可能指向同一个文件。这种情况显然消除了任何字符串比较函数作为确定两个路径是否指向同一文件的基础。
下一个级别是比较操作系统文件信息。打开两个路径的文件并比较句柄信息。在 Windows 中,这可以通过 GetFileInformationByHandle 来完成。卢西恩·维希克 (Lucian Wischik) 表现出色 邮政 关于这个主题在这里。
但这种方法仍然存在问题。仅当执行检查的用户帐户能够打开这两个文件进行读取时,它才有效。有许多项目可以阻止用户打开一个或两个文件。包括但不仅限于 ...
- 缺乏足够的文件权限
- 文件路径中的目录缺乏足够的权限
- 在打开第一个文件和第二个文件之间发生的文件系统更改(例如网络断开)。
当您开始研究所有这些问题时,您就会开始理解为什么 Windows 不提供确定两个路径是否相同的方法。这不是一个容易/可能回答的问题。
以下是 IsSameFile
的C#实现,使用 GetFileInformationByHandle
:
NativeMethods.cs
public static class NativeMethods
{
[StructLayout(LayoutKind.Explicit)]
public struct BY_HANDLE_FILE_INFORMATION
{
[FieldOffset(0)]
public uint FileAttributes;
[FieldOffset(4)]
public FILETIME CreationTime;
[FieldOffset(12)]
public FILETIME LastAccessTime;
[FieldOffset(20)]
public FILETIME LastWriteTime;
[FieldOffset(28)]
public uint VolumeSerialNumber;
[FieldOffset(32)]
public uint FileSizeHigh;
[FieldOffset(36)]
public uint FileSizeLow;
[FieldOffset(40)]
public uint NumberOfLinks;
[FieldOffset(44)]
public uint FileIndexHigh;
[FieldOffset(48)]
public uint FileIndexLow;
}
[DllImport("kernel32.dll", SetLastError = true)]
public static extern bool GetFileInformationByHandle(SafeFileHandle hFile, out BY_HANDLE_FILE_INFORMATION lpFileInformation);
[DllImport("kernel32.dll", CharSet = CharSet.Auto, SetLastError = true)]
public static extern SafeFileHandle CreateFile([MarshalAs(UnmanagedType.LPTStr)] string filename,
[MarshalAs(UnmanagedType.U4)] FileAccess access,
[MarshalAs(UnmanagedType.U4)] FileShare share,
IntPtr securityAttributes,
[MarshalAs(UnmanagedType.U4)] FileMode creationDisposition,
[MarshalAs(UnmanagedType.U4)] FileAttributes flagsAndAttributes,
IntPtr templateFile);
}
PathUtility.cs
public static bool IsSameFile(string path1, string path2)
{
using (SafeFileHandle sfh1 = NativeMethods.CreateFile(path1, FileAccess.Read, FileShare.ReadWrite,
IntPtr.Zero, FileMode.Open, 0, IntPtr.Zero))
{
if (sfh1.IsInvalid)
Marshal.ThrowExceptionForHR(Marshal.GetHRForLastWin32Error());
using (SafeFileHandle sfh2 = NativeMethods.CreateFile(path2, FileAccess.Read, FileShare.ReadWrite,
IntPtr.Zero, FileMode.Open, 0, IntPtr.Zero))
{
if (sfh2.IsInvalid)
Marshal.ThrowExceptionForHR(Marshal.GetHRForLastWin32Error());
NativeMethods.BY_HANDLE_FILE_INFORMATION fileInfo1;
bool result1 = NativeMethods.GetFileInformationByHandle(sfh1, out fileInfo1);
if (!result1)
throw new IOException(string.Format("GetFileInformationByHandle has failed on {0}", path1));
NativeMethods.BY_HANDLE_FILE_INFORMATION fileInfo2;
bool result2 = NativeMethods.GetFileInformationByHandle(sfh2, out fileInfo2);
if (!result2)
throw new IOException(string.Format("GetFileInformationByHandle has failed on {0}", path2));
return fileInfo1.VolumeSerialNumber == fileInfo2.VolumeSerialNumber
&& fileInfo1.FileIndexHigh == fileInfo2.FileIndexHigh
&& fileInfo1.FileIndexLow == fileInfo2.FileIndexLow;
}
}
}
首先我认为这很容易,但不工作:
string fileName1 = @"c:\vobp.log";
string fileName2 = @"c:\vobp.log".ToUpper();
FileInfo fileInfo1 = new FileInfo(fileName1);
FileInfo fileInfo2 = new FileInfo(fileName2);
if (!fileInfo1.Exists || !fileInfo2.Exists)
{
throw new Exception("one of the files does not exist");
}
if (fileInfo1.FullName == fileInfo2.FullName)
{
MessageBox.Show("equal");
}
也许这个库可以帮助 http://www.codeplex.com/FileDirectoryPath 。我自己没有用过它。
编辑:在该网站上查看此示例:
//
// Path comparison
//
filePathAbsolute1 = new FilePathAbsolute(@"C:/Dir1\\File.txt");
filePathAbsolute2 = new FilePathAbsolute(@"C:\DIR1\FILE.TXT");
Debug.Assert(filePathAbsolute1.Equals(filePathAbsolute2));
Debug.Assert(filePathAbsolute1 == filePathAbsolute2);
如果您需要反复比较相同的文件名,我建议您考虑对这些名称进行元素化。
在Unix系统下,有 realpath()功能,可以使您的路径成为可能。我认为如果你有一个复杂的路径,这通常是最好的选择。但是,通过网络连接挂载的卷可能会失败。
但是,基于realpath()方法,如果要支持包括网络卷在内的多个卷,可以编写自己的函数来检查路径中的每个目录名称,如果它引用了卷,则确定是否为卷引用两条路径都是一样的。这就是说,挂载点可能不同(即目标卷上的路径可能不是该卷的根),因此沿途解决所有问题并不容易,但它确实是可能的(否则如何它会起作用吗?!)
一旦文件名正确地进行了内省化,简单的字符串比较就会给出正确答案。
如果您不需要一遍又一遍地比较相同的文件名,那么Rasmus答案可能是最快的方法。
您始终可以对两者执行MD5编码并比较结果。效率不高,但比手动比较文件更容易。
以下是关于如何在C#中MD5字符串的帖子。