質問

それでは、私たちはこのようなものです文字列を持っているとしましょう。

‰û]M§Äq¸ºþe Ø·¦ŸßÛµÖ˜eÆÈym™ÎB+KºªXv©+Å+óS—¶ê'å‚4ŒBFJF󒉚Ү}Fó†ŽxöÒ&‹¢ T†^¤( OêIº ò|<)ð

どのように私はそれが私が正しくロードされた半分のウェブページcuzのだと思うのテキストであるWebサーバからHTMLの奇妙な出力だったようcuzの文字の人間が読める文字列にそれを回すん。私のようなCやPythonか何かでそれを読んでする必要があります。これは、文字列の唯一の抜粋です。

役に立ちましたか?

解決

それは事実である場合、のはずの判読できる文字列であることを、あなたはどのような<のhref = "http://en.wikipedia.org/wiki/Character_encoding把握する必要があります"REL =" nofollowをnoreferrer ">それが使用して翻訳しの文字エンコーディング。これは、文字列は、圧縮、暗号化、またはバイナリデータを表していることも可能です。それはあなたがあなたから文字列を得た場所を知るために役立つだろう。

他のヒント

私は、Webサーバーが正しいMIMEタイプを送信していない推測しています。私は、Firefoxのライブヘッダープラグインを使用して、HTTPヘッダーを見てみお勧めしたいです。 WebサーバがあなたにPDFファイルを送信することを決定、しかし、MIMEタイプを設定しない場合、あなたは自分の画面にゴミが表示されます。また、ファイルにページを保存し、CygwinのまたはUNIXシェルからこれらのコマンドを実行します:

file mypage.htm
strings mypage.htm
ヘッダバイトは、任意の認識可能なパターンに従っている場合、

最初はあなたを教えてくれます。第二は、取り除くと、すべての人間が読める形式のテキストを表示します。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top