문제

우리는 메인 프레임에 COBOL에 소스 코드가있는 일본 고객이 있습니다. 그는 메인 프레임의 코드가 Shift-Jis2에 표시되어 있다고 주장합니다 (우리는 그것을 잘 이해한다고 생각합니다). 해당 코드가 PC로 전송되면 가장 일반적인 인코딩은 무엇입니까? 우리는 그에게 COBOL 코드를 처리하기위한 프로그램을 보냈으며 질식하는 것 같습니다. 고객은 코드를 직접 제공하지 않으므로 실험은 어렵습니다. 그의 실험은 UTF-8을 나타내는 것으로 보인다. Shift-JIS2에서 인코딩 가능한 일본어 문자가 이에 따라 유니 코드 등가로 변환된다고 가정합니다. 여기에 경험이 있습니까?

편집 : 우리는 미스터리를 해결했다고 생각합니다. 클라이언트는 (DUH!) PC에서 CP-932 ( "ShiftJis")를 사용하고 있지만 그의 COBOL 프로그램에는 식별자에 일본 문자가 있으므로 도구가 질식하는 이유입니다.

편집 : 후속 조치 : 조금 더 놀랍습니다. Shift-Jis는 종종 우리가 ASCII 텍스트로 생각하는 것을 소위 "fullwidth"문자로 인코딩하며 동아시아의 사원 사진과 동일한 화면 공간을 취합니다. 기존의 ASCII 캐릭터는 반 세기로 작용합니다. 따라서 "A", "B", ... "Z"와 Fullwidth "-"가 있습니다. 분명히, 일본어 코볼을 처리하기 위해, 우리의 COBOL 파서는 서부 ASCII뿐만 아니라 전액 등가물 인 esp를 받아 들여야합니다. COBOL 식별자의 "글자"를 분리하는 데 사용되는 전액 문자와 놀랍게도 풀폭 하이픈.

편집 : IBM Enterprise COBOL은 식별자에서 DBCS 문자를 허용합니다. 이키스!

도움이 되었습니까?

해결책

일본에서 여전히 많이 사용되고있는 세 가지 인코딩이 있습니다 : EUC-JP, ISO-2022-JP 및 Shift-Jis.

ISO-2022-JP는 일반적으로 이메일에 사용됩니다. UNIX 머신에서 EUC-JP를 볼 수 있습니다. 나는 개인적으로 Shift-Jis 이외의 다른 것을 다루지 않았습니다. (메인 프레임)

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top