문제

당사 웹 사이트는 htmltidy를 통해 사용자의 입력을 실행하여 청소합니다. 분명히이 작업을 수행하면서 Umlaut를 변환하여 국제 가입자에게 고통을 유발합니다. htmltidy가 이것을하지 않도록 지정할 수있는 옵션이 있습니까?

가능한 모든 옵션으로 캐릭터 코딩을 시도했지만 아무것도 작동하지 않는 것 같습니다.

도움이 되었습니까?

해결책

구성 파일에서 출력 인코딩 (입력 인코딩은 선택 사항)을 제공하기 만하면됩니다.

input-encoding: win1252
output-encoding: latin1

사용 가능한 인코딩에 대한 개요를 보려면 출력 인코딩 문서.

편집하다: 그래서 당신은 그것을 사용하고 있습니다 .NET 바인딩. 그것은 매우 같은 설정입니다.

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

올바른 인코딩이 설정되면 ü 그리고 같은.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top