Кодирование URL-адреса в Erlang
Вопрос
Я использую erlang http:request для отправки некоторых данных в удаленную службу.У меня сообщение работает, но данные в body () сообщения передаются как есть, без какой-либо кодировки URL, что приводит к сбою сообщения при анализе удаленной службой.
Есть ли в Erlang функция, похожая на CGI.escape в Ruby для этой цели?
Решение
Вы можете найти здесь Подпрограммы url_encode и url_decode YAWS и url_decode
Они довольно просты, хотя комментарии указывают на то, что кодировка не выполнена на 100% для всех знаков препинания.
Другие советы
Я также столкнулся с отсутствием этой функции в HTTP-модулях.
Оказывается, что эта функциональность действительно доступна в дистрибутиве erlang, вам просто нужно присмотреться повнимательнее.
> edoc_lib:escape_uri("luca+more@here.com").
"luca%2bmore%40here.com"
Это ведет себя как CGI.escape в Ruby, есть также URI.escape, который ведет себя немного по-другому:
> CGI.escape("luca+more@here.com")
=> "luca%2Bmore%40here.com"
> URI.escape("luca+more@here.com")
=> "luca+more@here.com"
По крайней мере, в R15 есть http_uri:кодировать/1 который выполняет свою работу.Я бы также не рекомендовал использовать edoc_lib:escape_uri для перевода '=' в %3d вместо %3D, что вызвало у меня некоторые проблемы.
Вот простая функция, которая выполняет эту работу.Он предназначен для работы непосредственно с inets httpc.
%% @doc A function to URL encode form data.
%% @spec url_encode(formdata()).
-spec(url_encode(formdata()) -> string()).
url_encode(Data) ->
url_encode(Data,"").
url_encode([],Acc) ->
Acc;
url_encode([{Key,Value}|R],"") ->
url_encode(R, edoc_lib:escape_uri(Key) ++ "=" ++ edoc_lib:escape_uri(Value));
url_encode([{Key,Value}|R],Acc) ->
url_encode(R, Acc ++ "&" ++ edoc_lib:escape_uri(Key) ++ "=" ++ edoc_lib:escape_uri(Value)).
Пример использования:
httpc:request(post, {"http://localhost:3000/foo", [],
"application/x-www-form-urlencoded",
url_encode([{"username", "bob"}, {"password", "123456"}])}
,[],[]).
Чтобы ответить на мой собственный вопрос...Я нашел эту библиотеку в ibrowse!
http://www.erlware.org/lib/5.6.3/ibrowse-1.4/ibrowse_lib.html#url_encode-1
url_encode/1
url_encode(Str) -> UrlEncodedStr
Str = string()
UrlEncodedStr = string()
URL-кодирует строку на основе RFC 1738.Возвращает плоский список.
Я думаю, я могу использовать это для кодирования и по-прежнему использовать http:
Если кому-то нужно закодировать uri, который работает с utf-8 в erlang:
https://gist.github.com/3796470
Бывший.
Eshell V5.9.1 (abort with ^G)
1> c(encode_uri_rfc3986).
{ok,encode_uri_rfc3986}
2> encode_uri_rfc3986:encode("テスト").
"%e3%83%86%e3%82%b9%e3%83%88"
3> edoc_lib:escape_uri("テスト").
"%c3%86%c2%b9%c3%88" # output wrong: ƹÈ
Вот "форк" функции edoc_lib: escape_uri, которая улучшает поддержку UTF-8, а также поддерживает двоичные файлы.
escape_uri(S) when is_list(S) ->
escape_uri(unicode:characters_to_binary(S));
escape_uri(<<C:8, Cs/binary>>) when C >= $a, C =< $z ->
[C] ++ escape_uri(Cs);
escape_uri(<<C:8, Cs/binary>>) when C >= $A, C =< $Z ->
[C] ++ escape_uri(Cs);
escape_uri(<<C:8, Cs/binary>>) when C >= $0, C =< $9 ->
[C] ++ escape_uri(Cs);
escape_uri(<<C:8, Cs/binary>>) when C == $. ->
[C] ++ escape_uri(Cs);
escape_uri(<<C:8, Cs/binary>>) when C == $- ->
[C] ++ escape_uri(Cs);
escape_uri(<<C:8, Cs/binary>>) when C == $_ ->
[C] ++ escape_uri(Cs);
escape_uri(<<C:8, Cs/binary>>) ->
escape_byte(C) ++ escape_uri(Cs);
escape_uri(<<>>) ->
"".
escape_byte(C) ->
"%" ++ hex_octet(C).
hex_octet(N) when N =< 9 ->
[$0 + N];
hex_octet(N) when N > 15 ->
hex_octet(N bsr 4) ++ hex_octet(N band 15);
hex_octet(N) ->
[N - 10 + $a].
Обратите внимание, что из-за использования unicode:characters_to_binary это будет работать только в R13 или новее.
AFAIK, в стандартных библиотеках нет кодировщика URL-адресов.Думаю, я "позаимствовал" следующий код у YAWS или, возможно, у одного из других веб-серверов Erlang:
% Utility function to convert a 'form' of name-value pairs into a URL encoded
% content string.
urlencode(Form) ->
RevPairs = lists:foldl(fun({K,V},Acc) -> [[quote_plus(K),$=,quote_plus(V)] | Acc] end, [],Form),
lists:flatten(revjoin(RevPairs,$&,[])).
quote_plus(Atom) when is_atom(Atom) ->
quote_plus(atom_to_list(Atom));
quote_plus(Int) when is_integer(Int) ->
quote_plus(integer_to_list(Int));
quote_plus(String) ->
quote_plus(String, []).
quote_plus([], Acc) ->
lists:reverse(Acc);
quote_plus([C | Rest], Acc) when ?QS_SAFE(C) ->
quote_plus(Rest, [C | Acc]);
quote_plus([$\s | Rest], Acc) ->
quote_plus(Rest, [$+ | Acc]);
quote_plus([C | Rest], Acc) ->
<<Hi:4, Lo:4>> = <<C>>,
quote_plus(Rest, [hexdigit(Lo), hexdigit(Hi), ?PERCENT | Acc]).
revjoin([], _Separator, Acc) ->
Acc;
revjoin([S | Rest],Separator,[]) ->
revjoin(Rest,Separator,[S]);
revjoin([S | Rest],Separator,Acc) ->
revjoin(Rest,Separator,[S,Separator | Acc]).
hexdigit(C) when C < 10 -> $0 + C;
hexdigit(C) when C < 16 -> $A + (C - 10).