HTTPからアンエスケープPythonの文字列

https://stackoverflow.com/questions/780334

13-09-2019
|

質問

私は、HTTPヘッダーから文字列を持っているが、私がそれをアンエスケープするために使用することができますどのような機能..エスケープされています？

myemail%40gmail.com -> myemail@gmail.com

行くための方法であること）（urllib.unquoteでしょうか？

解決

私はurllibはの unquote のが一般的な方法であることをかなり確信していますこれをやってます。

>>> import urllib
>>> urllib.unquote("myemail%40gmail.com")
'myemail@gmail.com'

もあります unquote_plusするます：

にunquote（）と同様ですが、またunquoting HTMLフォーム値のために必要に応じて、スペースで置き換えプラス記号ます。

他のヒント

はい、そのタスクを達成 urllib.unquote() のことが表示されます。（I はcodepad の上のあなたの例に対してそれをテストした。）

のPython 3では、これらの機能である urllib.parse.unquote と urllib.parse.unquote_plus に。

後者は空白文字（）は、伝統的にプラス記号（+）として符号化されたHTTPのURLでクエリ文字列の例で使用され、そして+はパーセントエンコード%2Bする。ある

は、これらに加えて unquote_to_bytes <あり/>符号化が知られているか、または符号化データはバイナリデータでないときに使用することができるbytesに与えられたエンコードされた文字列を変換します。しかしそこにはunquote_plus_to_bytesはありません、あなたがそれを必要とする場合、あなたが行うことができます：

def unquote_plus_to_bytes(s):
    if isinstance(s, bytes):
        s = s.replace(b'+', b' ')
    else:
        s = s.replace('+', ' ')
    return unquote_to_bytes(s)

<時間>

unquote又はunquote_plusを使用するかの詳細については、コード URLで入手可能です空白文字：。+または％20 の

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow