문제

겠 함께하는 스크립트를 찾을 중복 제거에서 큰 라이브러리 이점 유의하여 주시기 바랍니다.순간에 나는 두 가지의 하이 패스 필터를 먼저 찾는 파일의 크기가 동일한 다음 하 sha256 에 10240 바이트는 조각의 파일을 얻을 수의 지문 같은 파일 크기(코드 ).

그것은 잘 작동,하지만 난 거기에 아마 체크섬에 내장된 jpeg 형식으로 사용할 수 있는 일을 대신 sha256.

사람이 알고 있는 경우 체크 또는 다른 요소를 사용할 수 있는 행동으로 체크/지?그렇다면,제가 효율적이스에 액세스하는 방법은?

도움이 되었습니까?

해결책

나는 생각하지 않 JPEG 사양을 포함한 모든 종류의 체크섬에 있는 방법을 설명하고 있습니다.

JPEG 포함할 수 있는 축소판의 일부로 EXIF 메타데이터,하지만.그것은 완벽한 표시기 때문에,그것이 가능한 두 개의 서로 다른 이미지는 동일합니다.가 적어도 하나의 문서로의 경우 미리체하지 않은 이미지를 겪고 했다 실질적인 수정했을 드러내는 썸네일보다 훨씬 더 많은 게시자의 의도 했다.

다른 팁

IJG 라이브러리에 파고 들어서 시간이 지남에 따라 일부 유형의 지문을 확인하는 데 사용할 수있는 쉬운 클래스 멤버 또는 기능 호출이 있다고 생각하지 않습니다. 이미지의 인코딩을 제어 할 수 있다면 내장 exif 태그를 사용할 수 있습니다 ...

나는 매우 비슷한 대본을 만들었습니다. 체크섬 메타 데이터를 원하지 않습니다. 태그가 수정 된 경우에도 실제 이미지가 복제되어 있는지 확인하고 싶습니다. 그것에 가장 적합한 것은 크기별로 정렬하는 것이 아니라 체크섬 istelf로 정렬하는 것입니다. Jhead를 사용하여 메타 데이터를 제거한 다음 전체 파일을 확인합니다 (그러나 그 일부를 수행하는 것에 대해 생각했지만 실제로는 많은 시간을 절약한다고 생각하지 않습니다). Jhead는 공유 메모리 (파이프)를 사용하지 않고 덮어 쓰기를 사용하므로 파일을 먼저 공유 메모리에 복사합니다. 나중에 더 빠른 검색을 위해 체크섬을 이미지 스크립 션 필드에 배치합니다. 분명히 이것은 또한 나중에 이미지 무결성을 확인할 수 있으며 모든 것을 확인하는 이유의 일부입니다. 팁 : EXIV2는 한 번에 하나씩 결정 기반 조작에 대해 exiftool보다 메타 데이터를 읽고 쓰는 데 훨씬 빠릅니다.

JPEG 표준 (ITU-T.81)에서는 전체 압축 된 JPEG 이미지 파일에 대한 체크섬 또는 그와 같은 필드/구문 요소가 없다고 생각합니다. 맞춤형 응용 프로그램이 해당 제출 된 신청 세그먼트에 제출하거나 표준에 제공되는 세그먼트가 제공되는 메타 데이터를 제출하지 않는 한. 따라서 당신의 목적을 위해 봉사하는 것은 하나의 솔른입니다. 다른 사람은 어떤 종류의 이진 파일을 호출하는 응용 프로그램 래퍼가 될 수 있습니다 (비교 이상의 비교 또는 Windows 명령도 비교할 수 있습니다. FC /B) 그리고 그 비교 유틸리티의 결과를 확인하고 원하는 결정을 내십시오.

-기원 후

수행 할 수있는 한 가지 방법은 모든 이미지를 고정 크기로 줄이고이를 썸네일로 저장하는 것입니다. 그런 다음 이미지 비교는 유사한 크기의 이미지를 비교하고 중복 될 가능성이 있습니다. 자르지 않은 경우 (크게 자르지 않는 한) 이미지 크기가 크기가 큰 이미지를 찾고 '복제'를 찾고자하는 경우 유용합니다.

XMP 사양에는 이미지의 버전을 고유하게 식별 해야하는 문서 ID 및 버전 ID가 있습니다.

이들 (및 다른 메타 데이터 기반 식별 방법)의 문제는 그에 따라 메타 데이터를 업데이트하는 JPEG의 내용을 변경할 수있는 일부 응용 프로그램에 의해 존중되지 않을 수 있다는 것입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top