我正在使用以下代码将所有电子邮件导出到特定的gmail文件夹中。

它运作良好,因为它提取了我期望的所有电子邮件,但它(或我)似乎破坏了CR /换行符的编码。

代码: 通用标签

我的问题是,当我到达该对象时,它的位置乱码“= 0A”,我认为它们被错误地解释为换行符或回车标志。

我可以用[d3 03 03 0a]十六进制形式找到它,但是因为这不是'字符',所以找不到str.replace()取出零件的方法。我实际上不需要换行标志。

我可以将整个字符串转换为十六进制,并执行替换sorts / regex的事情,但是这看起来像是kill-当问题出在源数据的编码/读取中时

我所看到的: 通用标签

我想要什么: 通用标签

有帮助吗?

解决方案

您正在查看的是引用可打印的编码。

尝试更改: 通用标签

收件人: 通用标签

有关更多信息,请参见Python编解码器模块中的标准编码

其他提示

仅剩2件其他商品一天就使人感到痛苦。 1在有效负载级别执行此操作,以便您可以处理email_message以从邮件中获取电子邮件地址等。

2您还需要解码字符集,我遇到了麻烦,有人将网页中的html复制和粘贴到word文档等的内容中,然后粘贴到我要处理的电子邮件中。 通用标签

希望这对某人有帮助!

戴夫

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top