使用Python imaplib导出Gmail-文本因换行问题而混乱
题
我正在使用以下代码将所有电子邮件导出到特定的gmail文件夹中。
它运作良好,因为它提取了我期望的所有电子邮件,但它(或我)似乎破坏了CR /换行符的编码。
代码: 通用标签
我的问题是,当我到达该对象时,它的位置乱码“= 0A”,我认为它们被错误地解释为换行符或回车标志。
我可以用[d3 03 03 0a]十六进制形式找到它,但是因为这不是'字符',所以找不到str.replace()取出零件的方法。我实际上不需要换行标志。
我可以将整个字符串转换为十六进制,并执行替换sorts / regex的事情,但是这看起来像是kill-当问题出在源数据的编码/读取中时
我所看到的: 通用标签
我想要什么: 通用标签
其他提示
仅剩2件其他商品一天就使人感到痛苦。 1在有效负载级别执行此操作,以便您可以处理email_message以从邮件中获取电子邮件地址等。
2您还需要解码字符集,我遇到了麻烦,有人将网页中的html复制和粘贴到word文档等的内容中,然后粘贴到我要处理的电子邮件中。 通用标签
希望这对某人有帮助!
戴夫
不隶属于 StackOverflow