파이썬에서 imaplib을 사용하여 이메일 본문을 가져 오는 방법은 무엇입니까?
문제
IMAP4 서버에서 전체 메시지를 가져오고 싶습니다. Python Docs에서 작동하는이 코드를 발견하면 다음과 같습니다.
>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]
데이터 [0] [1]이 메시지의 본문을 반환 할 수 있는지 항상 믿을 수 있는지 궁금합니다. 'rfc822.size'를 실행하면 튜플 대신 문자열이 있습니다.
RFC1730을 훑어 보았지만 'RFC822'에 대한 적절한 응답 구조를 파악할 수 없었습니다. 또한 Imaplib 문서에서 Fetch 결과 구조를 알려주는 것은 어렵습니다.
여기에 내가 가져올 때 얻는 것은 다음과 같습니다 RFC822
:
('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])
하지만 내가 가져올 때 RFC822.SIZE
나는 얻는다 :
('OK', ['1 (RFC822.SIZE 847403)'])
데이터 [0] 목록을 어떻게 올바르게 처리해야합니까? 튜플 목록 일 때 튜플에는 정확히 3 개의 부분이 있고 두 번째 부분은 페이로드라는 것을 믿을 수 있습니까?
IMAP4를위한 더 나은 라이브러리를 알고 있습니까?
해결책
아니... imaplib
꽤 좋은 도서관입니다. 너무 이해할 수없는 IMAP입니다.
당신은 그것을 확인하고 싶을 수도 있습니다 t == 'OK'
, 하지만 data[0][1]
내가 사용한만큼 예상대로 작동합니다.
다음은 폭탄 방지가 아닌 이메일로받은 서명 된 인증서를 추출하는 데 사용하는 간단한 예입니다.
import getpass, os, imaplib, email
from OpenSSL.crypto import load_certificate, FILETYPE_PEM
def getMsgs(servername="myimapserverfqdn"):
usernm = getpass.getuser()
passwd = getpass.getpass()
subject = 'Your SSL Certificate'
conn = imaplib.IMAP4_SSL(servername)
conn.login(usernm,passwd)
conn.select('Inbox')
typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
for num in data[0].split():
typ, data = conn.fetch(num,'(RFC822)')
msg = email.message_from_string(data[0][1])
typ, data = conn.store(num,'-FLAGS','\\Seen')
yield msg
def getAttachment(msg,check):
for part in msg.walk():
if part.get_content_type() == 'application/octet-stream':
if check(part.get_filename()):
return part.get_payload(decode=1)
if __name__ == '__main__':
for msg in getMsgs():
payload = getAttachment(msg,lambda x: x.endswith('.pem'))
if not payload:
continue
try:
cert = load_certificate(FILETYPE_PEM,payload)
except:
cert = None
if cert:
cn = cert.get_subject().commonName
filename = "%s.pem" % cn
if not os.path.exists(filename):
open(filename,'w').write(payload)
print "Writing to %s" % filename
else:
print "%s already exists" % filename
다른 팁
그만큼 imapclient 패키지는 작업하기가 훨씬 쉽습니다. 설명에서 :
사용하기 쉬운, 피시닉 및 완전한 IMAP 클라이언트 라이브러리.
이것은 유용한 정보를 추출하기위한 나의 해결책이었습니다. 지금까지 신뢰할 수 있습니다.
import datetime
import email
import imaplib
import mailbox
EMAIL_ACCOUNT = "your@gmail.com"
PASSWORD = "your password"
mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(EMAIL_ACCOUNT, PASSWORD)
mail.list()
mail.select('inbox')
result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
i = len(data[0].split())
for x in range(i):
latest_email_uid = data[0].split()[x]
result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
# result, email_data = conn.store(num,'-FLAGS','\\Seen')
# this might work to set flag to seen, if it doesn't already
raw_email = email_data[0][1]
raw_email_string = raw_email.decode('utf-8')
email_message = email.message_from_string(raw_email_string)
# Header Details
date_tuple = email.utils.parsedate_tz(email_message['Date'])
if date_tuple:
local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))
# Body details
for part in email_message.walk():
if part.get_content_type() == "text/plain":
body = part.get_payload(decode=True)
file_name = "email_" + str(x) + ".txt"
output_file = open(file_name, 'w')
output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
output_file.close()
else:
continue
imap-toolsIMAP 프로토콜을 사용하여 이메일 메시지를 효과적으로 작업하기위한 라이브러리.
- 문자 속성으로 투명한 작업 (UID 포함)
- 디렉토리의 문자로 작업 (복사, 삭제, 플래그, 움직임, 보인)
- 디렉토리 작업 (목록, 설정, GET, 작성, 생성, 존재, 이름 바꾸기, 삭제, 상태)
- 외부 의존성이 없습니다