URL의 인코딩 된 문자를 어떤 문자 세트에 넣어야합니까?

StackOverflow https://stackoverflow.com/questions/140549

  •  02-07-2019
  •  | 
  •  

문제

RFC 1738 URL의 구문을 지정하고 다음을 언급합니다.

URL은
US-ASCII 코딩 문자 세트. 80-ff 16 진수는 그렇지 않습니다
us-ascii 및 옥제 00-1f 및 7f 16 진수에서 사용
제어 문자; 이들은 인코딩되어야합니다.

그러나 어떤 코드 가이 옥팅을 설정 한 다음 표현하는지 말하지는 않습니다.

RFC 2396 상황을 시도하고 개선하는 것 같습니다.

그러나 ASCII가 아닌 문자를 포함하는 원래 문자 시퀀스의 경우 상황이 더 어렵습니다. 문자 시퀀스를 나타내려고 의도 된 옥트 시퀀스를 전송하는 인터넷 프로토콜은 하나 이상의 존재가있을 수 있다면 사용 된 숯을 식별하는 방법을 제공 할 것으로 예상된다 [RFC2277]. 그러나 현재이 식별을 달성하기위한 일반 URI 구문 내에는 현재 조항이 없습니다. 개별 URI 체계에는 단일 숯이 필요하거나 기본 숯불을 정의하거나 사용 된 숯을 표시하는 방법을 제공 할 수 있습니다.

URI 내에서 캐릭터 인코딩의 체계적인 처리 가이 사양의 향후 수정으로 개발 될 것으로 예상됩니다.

클라이언트가 인코딩 된 Octets를 해석하기 위해 어떤 문자를 설정하는지 결정할 수있는 방법이 있습니까?

대부분의 서버가 UTF-8에 대한 기본값처럼 보이지만 이것은 지정된 것보다 사실상 선택한 것 같습니다.

도움이 되었습니까?

해결책

견적에 따라 URL은 ASCII입니다. 그게 다야.

Uris otoh, 더 큰 숯을 허용합니다. 당신이 말한대로 보통 UTF-8.

기억해야 할 점은 URL이 URI의 하위 집합이라는 점입니다. 따라서 실제 질문은 브라우저에서 작성한 것이 무엇입니까?

URI를 쓸 수 있다고 생각합니다. 브라우저는 URL (HTTP/1.1 지원, AFAICR)으로 변환하기 위해 최선을 다해야합니다. 비 ASCII 문자의 경우, 이는 육각형을 의미하며, 일반적으로 UTF-8을 코딩합니다.

다른 팁

나는 당신이 찾고있는 사양이 IS라고 생각합니다 RFC 3987, IRIS- 국제화 된 자원 식별자를 설명합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top