解放双手!Python 自动化下载邮件附件,可自定义时间段
yuyutoo 2025-05-08 07:45 21 浏览 0 评论
在日常工作中,我们经常需要从邮箱里下载特定日期范围内的邮件附件。想象一下,你需要收集过去几个月内客户发送的报价单、合同等附件,如果手动一个个去查找和下载,那得花费多少时间和精力呀!今天就给大家分享一个用 Python 实现的自动化下载邮件附件的代码,让你轻松搞定这个繁琐的任务。
代码背景与需求理解
在处理大量邮件时,我们常常面临着在指定日期范围内查找并下载附件的需求。例如,财务人员需要每月收集特定时间段内的发票附件,运营人员需要获取某个活动期间的反馈文件等。手动操作不仅效率低下,还容易出错。而使用 Python 编写一个自动化脚本,就可以让计算机帮我们快速准确地完成这些任务。
代码功能概述
这份代码的主要功能是下载指定日期范围内的邮件附件,并按照邮件的日期将附件分类保存到本地目录。它支持自定义开始日期和结束日期,还能处理邮件头信息的解码,确保中文主题和附件名能正确显示。
代码详细解读
1. 导入必要的库
import imaplib
import email
import os
import argparse
from datetime import datetime, timedelta
from email.header import decode_header
import pandas as pd
这里导入了多个 Python 库,imaplib 用于连接邮箱服务器,email 用于解析邮件内容,os 用于文件和目录操作,argparse 用于解析命令行参数,datetime 和 timedelta 用于日期处理,decode_header 用于解码邮件头信息,pandas 用于读取 Excel 文件。
2. 配置参数解析
def parse_args():
parser = argparse.ArgumentParser(description='下载指定日期范围内的邮件附件')
parser.add_argument('--start', required=True, help='开始日期 (格式: YYYY-MM-DD)')
parser.add_argument('--end', required=True, help='结束日期 (格式: YYYY-MM-DD)')
parser.add_argument('--user', required=True, help='邮箱账号')
parser.add_argument('--password', required=True, help='邮箱密码/授权码')
return parser.parse_args()
这个函数使用 argparse 库来解析命令行参数,用户需要提供开始日期、结束日期、邮箱账号和密码 / 授权码。
3. 解码邮件头信息
def decode_mime_header(header):
try:
decoded = decode_header(header)
return ''.join(
part.decode(encoding or 'gbk') if isinstance(part, bytes) else part
for part, encoding in decoded
)
except:
return header
由于邮件头信息可能包含中文等非 ASCII 字符,需要进行解码处理。这个函数会尝试对邮件头进行解码,如果解码失败则返回原始信息。
4. 主下载函数
def download_attachments(start_date, end_date, email_user, email_pass, win):
ATTACHMENT_BASE_DIR = './attachments'
IMAP_SERVER = 'imap.163.com'
try:
# 连接邮箱
mail = imaplib.IMAP4_SSL(IMAP_SERVER)
mail.login(email_user, email_pass)
mail.select('inbox')
# 日期格式转换
imap_start = datetime.strptime(start_date, '%Y-%m-%d').strftime('%d-%b-%Y')
imap_end = (datetime.strptime(end_date, '%Y-%m-%d') + timedelta(days=1)).strftime('%d-%b-%Y')
search_criteria = f'(SINCE "{imap_start}" BEFORE "{imap_end}")'
print(f"搜索范围: {start_date} 至 {end_date} | IMAP条件: {search_criteria}")
win.refresh()
# 搜索邮件
_, data = mail.search(None, search_criteria)
email_ids = data[0].split()
print(f"找到 {len(email_ids)} 封邮件")
win.refresh()
# 处理邮件
for email_id in email_ids:
_, data = mail.fetch(email_id, '(RFC822)')
msg = email.message_from_bytes(data[0][1])
# 解析邮件信息
date = datetime.strptime(msg['Date'][:24], '%a, %d %b %Y %H:%M:%S')
subject = decode_mime_header(msg['Subject'])
print(f"\n[{date}] 主题: {subject}")
win.refresh()
# 检查附件
attachments = [
(decode_mime_header(part.get_filename()), part)
for part in msg.walk()
if part.get_filename() and part.get('Content-Disposition')
]
if not attachments:
print("无附件,跳过")
win.refresh()
continue
# 创建日期目录
date_dir = os.path.join(ATTACHMENT_BASE_DIR, date.strftime('%Y-%m-%d'))
os.makedirs(date_dir, exist_ok=True)
print(f"保存到: {date_dir}")
win.refresh()
# 保存附件
for filename, part in attachments:
safe_name = ''.join(c for c in filename if c.isalnum() or c in ' .-_,')
path = os.path.join(date_dir, safe_name)
with open(path, 'wb') as f:
f.write(part.get_payload(decode=True))
print(f" {safe_name}")
win.refresh()
except Exception as e:
print(f"错误: {str(e)}")
win.refresh()
finally:
mail.close()
mail.logout()
这个函数是整个代码的核心,它完成了以下几个主要步骤:
- 连接到邮箱服务器并登录。
- 根据用户提供的开始日期和结束日期,生成 IMAP 搜索条件。
- 搜索符合条件的邮件,并获取邮件 ID。
- 遍历每封邮件,解析邮件信息,检查是否有附件。
- 如果有附件,创建以邮件日期命名的目录,并将附件保存到该目录下。
5. 主函数
def main(date1, date2, win):
df = pd.read_excel(r'./邮箱信息.xlsx', sheet_name=0, dtype=str)
df_dict = df.set_index("名称")["值"].to_dict()
# 邮箱配置信息
email_user = df_dict.get('用户名')
email_pass = df_dict.get('密码')
# imap_server = df_dict.get('IMAP_SEVER')
start_date = date1
end_date = date2
download_attachments(start_date, end_date, email_user, email_pass, win)
主函数从 Excel 文件中读取邮箱账号和密码,然后调用 download_attachments 函数进行附件下载。
6. 脚本入口
if __name__ == '__main__':
# args = parse_args()
os.makedirs('./attachments', exist_ok=True)
# print(f"开始处理 {args.user} 的邮件...")
# download_attachments(args.start, args.end, args.user, args.password)
download_attachments('2024-12-01', '2025-04-13', 'demo@163.com', 'password')
print("\n处理完成!附件保存在 ./attachments 目录")
在脚本的入口处,创建了保存附件的基础目录,并调用 download_attachments 函数进行附件下载。
使用方法与注意事项
使用方法
- 将代码保存为一个 Python 文件,例如 download_emails.py。
- 准备一个 邮箱信息.xlsx 文件,包含 名称 和 值 两列,分别填写 用户名 和 密码。
- 修改脚本中的开始日期和结束日期,或者通过命令行参数传入。
- 运行脚本,等待附件下载完成。
注意事项
- 确保你的邮箱开启了 IMAP 服务,并获取了正确的授权码。
- 默认邮箱能查询下载30日的邮件,也可查询所有时间段的,需要在邮箱中设置
- 代码中使用的是 163 邮箱的 IMAP 服务器,如果你使用的是其他邮箱,需要修改 IMAP_SERVER 的值。
- 附件保存的目录为 ./attachments,你可以根据需要修改 ATTACHMENT_BASE_DIR 的值。
- 本代码只适合163邮箱,QQ邮箱可以实现私信留言。
- 'password'不是邮箱的密码,在设置开启IMAP的时候邮箱系统自动生成的密码。
总结
通过使用这个 Python 脚本,我们可以轻松地实现邮件附件的自动化下载,大大提高工作效率。代码的逻辑清晰,易于理解和修改,你可以根据自己的需求进行扩展,例如添加更多的筛选条件、处理不同类型的邮件等。希望这个代码能帮助你解决邮件附件处理的烦恼,让你的工作更加轻松愉快!
以上就是关于这个自动化下载邮件附件代码的详细介绍,如果你有任何问题或建议,欢迎在评论区留言交流。
相关推荐
- Java开发中如何优雅地避免OOM(OutOfMemoryError)
-
Java开发中如何优雅地避免OOM(OutOfMemoryError)在这个信息化高速发展的时代,内存就像程序员手中的笔,缺了它就什么都写不出来。而OOM(OutOfMemoryError)就像是横在...
- 常见的JVM调优方法和步骤
-
1、内存调优堆内存设置:通过-Xms和-Xmx参数调整初始和最大堆内存大小-Xms:初始堆大小(如-Xms512M)-Xmx:最大堆大小(如-Xmx2048M)调整新生代和老年代的比例...
- Java中9种常见的CMS GC问题分析与解决(一)
-
目前,互联网上Java的...
- JDK21新特性:Prepare to Disallow the Dynamic Loading of Agents
-
PreparetoDisallowtheDynamicLoadingofAgentsJEP451:准备禁止动态加载代理摘要...
- Java程序GC垃圾回收机制优化指南
-
Java程序GC垃圾回收机制优化指南作为一个Java开发者,我们经常会在任务管理器里看到Java进程占用内存不断增长,然后突然下降的现象。这其实就是在Java虚拟机中运行的垃圾回收(GC)机制在起作用...
- Java Java命令学习系列(一)——Jps
-
jps位于jdk的bin目录下,其作用是显示当前系统的java进程情况,及其id号。jps相当于Solaris进程工具ps。不象”pgrepjava”或”ps-efgrepjava”,jps...
- 面试题专题:头条一面参考答案(003)
-
前两篇文章也都是介绍头条一面的内容及参考答案...
- Java JVM原理与性能调优:从基础到高级应用
-
一、JVM基础架构与内存模型1.1JVM整体架构概览Java虚拟机(JVM)是Java程序运行的基石,它由以下几个核心子系统组成:...
- 死锁攻防战:阿里架构师教你用3种核武器杜绝程序僵死
-
从线程转储分析到银行家算法,彻底掌握大厂必考的死锁解决方案以下是为Java死锁问题设计的结构化技术解析方案,包含代码级解决方案与高频追问应对策略:...
- Java 1.8 虚拟机内存分布详解
-
Java1.8虚拟机内存分布详解Java1.8的JVM内存布局相比早期版本有显著变化(如永久代被元空间取代)。以下是其核心内存区域的划分、作用及配置参数:一、JVM内存整体结构...
- Java 多线程开发难题?这篇文章给你答案!
-
作为互联网大厂的后端开发人员,在Java多线程开发过程中,必然会面临诸多复杂且具有挑战性的问题。在高并发场景下,各类潜在问题对系统的稳定性与性能产生严重影响,本文将深入探讨这些问题,并提供全面且有...
- 软件性能调优全攻略:从瓶颈定位到工具应用
-
性能调优是软件测试中的重要环节,旨在提高系统的响应时间、吞吐量、并发能力、资源利用率,并降低系统崩溃或卡顿的风险。通常,性能调优涉及发现性能瓶颈、分析问题根因、优化代码和系统配置等步骤,调优之前需要先...
- JVM性能优化实战技巧
-
JVM性能优化实战技巧在现代企业级应用开发中,JavaVirtualMachine(JVM)作为承载Java应用程序的核心引擎,其性能直接决定了系统的响应速度、吞吐量以及资源利用率。因此,掌握一些...
- JVM 深度解析:运行时数据区域、分代回收与垃圾回收机制全攻略
-
共同学习,有错欢迎指出。JVM运行时数据区域1.程序计数器程序计数器是一块较小的内存空间,可看作当前线程所执行的字节码的行号指示器。在虚拟机概念模型里,字节码解释器通过改变这个计数器的值选取下一条...
- JVM内存管理详解与调优实战
-
JVM内存管理详解与调优实战Java虚拟机(JVM)作为Java程序运行的核心组件,其内存管理机制直接影响着应用程序的性能表现。今天,咱们就来一场既严肃又有趣的JVM内存管理之旅,看看这个“幕后英雄”...
你 发表评论:
欢迎- 一周热门
-
-
前端面试:iframe 的优缺点? iframe有那些缺点
-
带斜线的表头制作好了,如何填充内容?这几种方法你更喜欢哪个?
-
漫学笔记之PHP.ini常用的配置信息
-
其实模版网站在开发工作中很重要,推荐几个参考站给大家
-
推荐7个模板代码和其他游戏源码下载的网址
-
[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗
-
正在学习使用python搭建自动化测试框架?这个系统包你可能会用到
-
织梦(Dedecms)建站教程 织梦建站详细步骤
-
【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)
-
2024PHP在线客服系统源码+完全开源 带详细搭建教程
-
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)