这篇文章将为大家详细讲解有关Python中怎么自动化读取邮件,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
poplib 模块提供了 poplib.POP3 和 poplib.POP3_SSL 两个类,分别用于连接普通的 POP 服务器和基于 SSL 的 POP 服务器。连接到服务器后,按照 POP3 协议与服务器交互。
注意:虽然 POP3 得到了广泛支持,但已过时。POP3 服务器的实现质量差异很大,而且太多的服务器都很差。后面会介绍基于 IMAP 服务器的 imbox 库
下面以 QQ 邮箱为例示范如何完整 poplib 库的使用
1、创建连接
使用poplib.POP3_SSL创建连接
import poplib import email.parser, email.policy conn = poplib.POP3_SSL('pop.qq.com', 995)
2、登录服务器
注意输入的是邮箱授权码而不是真实 QQ 密码
conn.user('xxxx@qq.com') conn.pass_('xxxx') # 注意输入的是邮箱授权码而不是真实 QQ 密码
3、获取邮件列表
response, maillist, r = conn.list() print('响应:', response) print('邮件列表:', maillist)
4、遍历邮件
multipart 代表邮件内容的容器,无需处理
msg = email.parser.BytesParser(policy=email.policy.default).parsebytes(data) for part in msg.walk(): # multipart 代表邮件内容的容器,无需处理 if part.get_content_type().split("/", 1)[0] == 'multipart': continue elif part.get_content_type().split("/", 1)[0] == 'text': print(part.get_content()) else: filename = part.get_filename() print(filename) with open(filename, 'wb') as f: f.write(part.get_payload(decode=True))
多级判断的目的主要是跳过容器、输出正文、下载附件的本地
5、退出服务器
conn.quit()
常用的代码中有部分稍微繁琐,但整体还是比较好理解的
在正式介绍 imbox 库之前,再分享一个技巧。从上面 poplib 的代码中也可以看到,当输入密码(授权码)的时候是在代码中明文显示,这就带来了风险:
假如你不小心把这个代码没有处理就发给别人,或者上传的 github,那么所有拿到这段代码的人都可以对你的邮箱大肆操作,这是很可怕的事情
这里读取邮件用的模块 imbox 也和 poplib 一样需要密码这个参数,但不希望在代码中明文呈现密码,怎么办?
”解决办法是利用 keyring 库,通过系统密钥环将密码(授权码),预先在本地存储好,后面在代码中调用 keyring 库的方法,通过账号把密码取出来作为变量就可以。
这样即使别人拿到了全部代码,但他的本地中没有预先配置好密码,就不会有泄露信息的风险了。具体使用方法为,首先打开命令行输入:
import keyring keyring.set_password("qqmail", "username", "password")
这样 password 在本地存储好了,后面只需要 keyring.get_password 获取作为变量即可:
import keyring password = keyring.get_password('qqmail', 'username')
用 imbox 读取邮件的代码如下:
import keyring from imbox import Imbox password = keyring.get_password('qqmail', 'username') with Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True) as imbox: # 获取全部邮件 all_inbox_messages = imbox.messages() for uid, message in all_inbox_messages: print(message.subject) # 邮件主题 print(message.body['plain']) # 邮件文本格式正文
Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True) 这行代码中需要填写服务器、用户名邮箱、密码、SSL加密循环体中 uid 参数是每封邮件的编号,邮件编号十分重要,可以用于邮件的标记和删除。除了邮件主题及文本格式正文外,我们主要常用获取以下内容:
除了获取全部邮件用 all_inbox_messages = imbox.messages() 外,我们常常会有选择性获取已读、未读和红旗标记邮件:
unread_inbox_messages = imbox.messages(unread=True) # 未读邮件 read_inbox_messages = imbox.messages(unread=False) # 已读邮件 flagged_inbox_messages = imbox.messages(flagged=True) # 红旗标记邮件
也可以通过邮件的收件时间获取邮件:
inbox_message_before = imbox.messages(date__lt=datetime.date(2021, 1, 18)) inbox_message_after = imbox.messages(date__gt=datetime.date(2021, 1, 18)) inbox_message_on_date = imbox.messages(date__on=datetime.date(2021, 1, 18))
那么如何筛选指定发件人发送的邮件呢?答案就在于对 message.sent_from 的理解了。message.sent_from 是一个字典元组,在遍历的过程中只需要简单通过 message.sent_from[0]['email'] 就能够将发件人邮箱提取出来,接着做判断就能够达到目的:
with Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True) as imbox: all_inbox_messages = imbox.messages() for uid, message in all_inbox_messages: print(message.subject) print(message.sent_from) print(message.body['plain']) # 把邮箱提取出来 email = message.sent_from[0]['email'] if email == 某个特定的邮箱: pass
上文还提到了邮件编号 uid 的重要性。基于编号的两个重要方法:
标记已读 imbox.mark_seen(uid)
删除邮件 imbox.delete(uid)
”使用以删除邮件为例:
for uid, message in all_inbox_messages: if 满足某种条件的邮件: imbox.delete(uid)
关于Python中怎么自动化读取邮件就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。