Сравнение двух файлов .txt с использованием difflib в Python
Вопрос
Я пытаюсь сравнить два текстовых файла и вывести первую строку в файле сравнения, которая не совпадает, но у меня возникают трудности, так как я новичок в Python.Кто-нибудь может дать мне пример использования этого модуля.
Когда я пробую что-то вроде:
result = difflib.SequenceMatcher(None, testFile, comparisonFile)
Я получаю сообщение об ошибке, сообщающее, что объект типа «файл» не имеет длины.
Решение
Для начала вам нужно передать в difflib.SequenceMatcher строки, а не файлы:
# Like so
difflib.SequenceMatcher(None, str1, str2)
# Or just read the files in
difflib.SequenceMatcher(None, file1.read(), file2.read())
Это в любом случае исправит вашу ошибку.Чтобы получить первую несовпадающую строку, я направлю вас в чудесный мир документация difflib.
Другие советы
Вот краткий пример сравнения содержимого двух файлов с использованием Python difflib...
import difflib
file1 = "myFile1.txt"
file2 = "myFile2.txt"
diff = difflib.ndiff(open(file1).readlines(),open(file2).readlines())
print ''.join(diff),
Вы уверены, что оба файла существуют?
Только что протестировал и получил отличный результат.
Чтобы получить результаты, я использую что-то вроде:
import difflib
diff=difflib.ndiff(open(testFile).readlines(), open(comparisonFile).readlines())
try:
while 1:
print diff.next(),
except:
pass
первый символ каждой строки указывает, отличаются ли они:например.:«+» означает, что была добавлена следующая строка и т. д.
Похоже, вам вообще не нужна difflib.Если вы сравниваете построчно, попробуйте что-то вроде этого:
test_lines = open("test.txt").readlines()
correct_lines = open("correct.txt").readlines()
for test, correct in zip(test_lines, correct_lines):
if test != correct:
print "Oh no! Expected %r; got %r." % (correct, test)
break
else:
len_diff = len(test_lines) - len(correct_lines)
if len_diff > 0:
print "Test file had too much data."
elif len_diff < 0:
print "Test file had too little data."
else:
print "Everything was correct!"
Еще один более простой способ проверить, совпадают ли два текстовых файла построчно.Попробуйте это.
fname1 = 'text1.txt'
fname2 = 'text2.txt'
f1 = open(fname1)
f2 = open(fname2)
lines1 = f1.readlines()
lines2 = f2.readlines()
i = 0
f1.seek(0)
f2.seek(0)
for line1 in f1:
if lines1[i] != lines2[i]:
print(lines1[i])
exit(0)
i = i+1
print("both are equal")
f1.close()
f2.close()
в противном случае в python есть предопределенный файл filecmp, который вы можете использовать.
import filecmp
fname1 = 'text1.txt'
fname2 = 'text2.txt'
print(filecmp.cmp(fname1, fname2))
:)