百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

解放双手!Python 自动化下载邮件附件,可自定义时间段

yuyutoo 2025-05-08 07:45 21 浏览 0 评论

在日常工作中,我们经常需要从邮箱里下载特定日期范围内的邮件附件。想象一下,你需要收集过去几个月内客户发送的报价单、合同等附件,如果手动一个个去查找和下载,那得花费多少时间和精力呀!今天就给大家分享一个用 Python 实现的自动化下载邮件附件的代码,让你轻松搞定这个繁琐的任务。

代码背景与需求理解

在处理大量邮件时,我们常常面临着在指定日期范围内查找并下载附件的需求。例如,财务人员需要每月收集特定时间段内的发票附件,运营人员需要获取某个活动期间的反馈文件等。手动操作不仅效率低下,还容易出错。而使用 Python 编写一个自动化脚本,就可以让计算机帮我们快速准确地完成这些任务。

代码功能概述

这份代码的主要功能是下载指定日期范围内的邮件附件,并按照邮件的日期将附件分类保存到本地目录。它支持自定义开始日期和结束日期,还能处理邮件头信息的解码,确保中文主题和附件名能正确显示。

代码详细解读

1. 导入必要的库

import imaplib
import email
import os
import argparse
from datetime import datetime, timedelta
from email.header import decode_header
import pandas as pd

这里导入了多个 Python 库,imaplib 用于连接邮箱服务器,email 用于解析邮件内容,os 用于文件和目录操作,argparse 用于解析命令行参数,datetime 和 timedelta 用于日期处理,decode_header 用于解码邮件头信息,pandas 用于读取 Excel 文件。

2. 配置参数解析

def parse_args():
    parser = argparse.ArgumentParser(description='下载指定日期范围内的邮件附件')
    parser.add_argument('--start', required=True, help='开始日期 (格式: YYYY-MM-DD)')
    parser.add_argument('--end', required=True, help='结束日期 (格式: YYYY-MM-DD)')
    parser.add_argument('--user', required=True, help='邮箱账号')
    parser.add_argument('--password', required=True, help='邮箱密码/授权码')
    return parser.parse_args()

这个函数使用 argparse 库来解析命令行参数,用户需要提供开始日期、结束日期、邮箱账号和密码 / 授权码。

3. 解码邮件头信息

def decode_mime_header(header):
    try:
        decoded = decode_header(header)
        return ''.join(
            part.decode(encoding or 'gbk') if isinstance(part, bytes) else part
            for part, encoding in decoded
        )
    except:
        return header

由于邮件头信息可能包含中文等非 ASCII 字符,需要进行解码处理。这个函数会尝试对邮件头进行解码,如果解码失败则返回原始信息。

4. 主下载函数

def download_attachments(start_date, end_date, email_user, email_pass, win):
    ATTACHMENT_BASE_DIR = './attachments'
    IMAP_SERVER = 'imap.163.com'

    try:
        # 连接邮箱
        mail = imaplib.IMAP4_SSL(IMAP_SERVER)
        mail.login(email_user, email_pass)
        mail.select('inbox')

        # 日期格式转换
        imap_start = datetime.strptime(start_date, '%Y-%m-%d').strftime('%d-%b-%Y')
        imap_end = (datetime.strptime(end_date, '%Y-%m-%d') + timedelta(days=1)).strftime('%d-%b-%Y')

        search_criteria = f'(SINCE "{imap_start}" BEFORE "{imap_end}")'
        print(f"搜索范围: {start_date} 至 {end_date} | IMAP条件: {search_criteria}")
        win.refresh()
        # 搜索邮件
        _, data = mail.search(None, search_criteria)
        email_ids = data[0].split()
        print(f"找到 {len(email_ids)} 封邮件")
        win.refresh()
        # 处理邮件
        for email_id in email_ids:
            _, data = mail.fetch(email_id, '(RFC822)')
            msg = email.message_from_bytes(data[0][1])

            # 解析邮件信息
            date = datetime.strptime(msg['Date'][:24], '%a, %d %b %Y %H:%M:%S')
            subject = decode_mime_header(msg['Subject'])
            print(f"\n[{date}] 主题: {subject}")
            win.refresh()
            # 检查附件
            attachments = [
                (decode_mime_header(part.get_filename()), part)
                for part in msg.walk()
                if part.get_filename() and part.get('Content-Disposition')
            ]

            if not attachments:
                print("无附件,跳过")
                win.refresh()
                continue

            # 创建日期目录
            date_dir = os.path.join(ATTACHMENT_BASE_DIR, date.strftime('%Y-%m-%d'))
            os.makedirs(date_dir, exist_ok=True)
            print(f"保存到: {date_dir}")
            win.refresh()
            # 保存附件
            for filename, part in attachments:
                safe_name = ''.join(c for c in filename if c.isalnum() or c in ' .-_,')
                path = os.path.join(date_dir, safe_name)
                with open(path, 'wb') as f:
                    f.write(part.get_payload(decode=True))
                print(f" {safe_name}")
                win.refresh()
    except Exception as e:
        print(f"错误: {str(e)}")
        win.refresh()
    finally:
        mail.close()
        mail.logout()

这个函数是整个代码的核心,它完成了以下几个主要步骤:

  • 连接到邮箱服务器并登录。
  • 根据用户提供的开始日期和结束日期,生成 IMAP 搜索条件。
  • 搜索符合条件的邮件,并获取邮件 ID。
  • 遍历每封邮件,解析邮件信息,检查是否有附件。
  • 如果有附件,创建以邮件日期命名的目录,并将附件保存到该目录下。

5. 主函数

def main(date1, date2, win):
    df = pd.read_excel(r'./邮箱信息.xlsx', sheet_name=0, dtype=str)
    df_dict = df.set_index("名称")["值"].to_dict()
    # 邮箱配置信息
    email_user = df_dict.get('用户名')
    email_pass = df_dict.get('密码')
    # imap_server = df_dict.get('IMAP_SEVER')
    start_date = date1
    end_date = date2
    download_attachments(start_date, end_date, email_user, email_pass, win)

主函数从 Excel 文件中读取邮箱账号和密码,然后调用 download_attachments 函数进行附件下载。

6. 脚本入口

if __name__ == '__main__':
    # args = parse_args()
    os.makedirs('./attachments', exist_ok=True)

    # print(f"开始处理 {args.user} 的邮件...")
    # download_attachments(args.start, args.end, args.user, args.password)
    download_attachments('2024-12-01', '2025-04-13', 'demo@163.com', 'password')
    print("\n处理完成!附件保存在 ./attachments 目录")

在脚本的入口处,创建了保存附件的基础目录,并调用 download_attachments 函数进行附件下载。

使用方法与注意事项

使用方法

  1. 将代码保存为一个 Python 文件,例如 download_emails.py。
  2. 准备一个 邮箱信息.xlsx 文件,包含 名称 和 值 两列,分别填写 用户名 和 密码。
  3. 修改脚本中的开始日期和结束日期,或者通过命令行参数传入。
  4. 运行脚本,等待附件下载完成。

注意事项

  • 确保你的邮箱开启了 IMAP 服务,并获取了正确的授权码。
  • 默认邮箱能查询下载30日的邮件,也可查询所有时间段的,需要在邮箱中设置
  • 代码中使用的是 163 邮箱的 IMAP 服务器,如果你使用的是其他邮箱,需要修改 IMAP_SERVER 的值。
  • 附件保存的目录为 ./attachments,你可以根据需要修改 ATTACHMENT_BASE_DIR 的值。
  • 本代码只适合163邮箱,QQ邮箱可以实现私信留言。
  • 'password'不是邮箱的密码,在设置开启IMAP的时候邮箱系统自动生成的密码。

总结

通过使用这个 Python 脚本,我们可以轻松地实现邮件附件的自动化下载,大大提高工作效率。代码的逻辑清晰,易于理解和修改,你可以根据自己的需求进行扩展,例如添加更多的筛选条件、处理不同类型的邮件等。希望这个代码能帮助你解决邮件附件处理的烦恼,让你的工作更加轻松愉快!

以上就是关于这个自动化下载邮件附件代码的详细介绍,如果你有任何问题或建议,欢迎在评论区留言交流。

相关推荐

Java开发中如何优雅地避免OOM(OutOfMemoryError)

Java开发中如何优雅地避免OOM(OutOfMemoryError)在这个信息化高速发展的时代,内存就像程序员手中的笔,缺了它就什么都写不出来。而OOM(OutOfMemoryError)就像是横在...

常见的JVM调优方法和步骤

1、内存调优堆内存设置:通过-Xms和-Xmx参数调整初始和最大堆内存大小-Xms:初始堆大小(如-Xms512M)-Xmx:最大堆大小(如-Xmx2048M)调整新生代和老年代的比例...

Java中9种常见的CMS GC问题分析与解决(一)

目前,互联网上Java的...

JDK21新特性:Prepare to Disallow the Dynamic Loading of Agents

PreparetoDisallowtheDynamicLoadingofAgentsJEP451:准备禁止动态加载代理摘要...

Java程序GC垃圾回收机制优化指南

Java程序GC垃圾回收机制优化指南作为一个Java开发者,我们经常会在任务管理器里看到Java进程占用内存不断增长,然后突然下降的现象。这其实就是在Java虚拟机中运行的垃圾回收(GC)机制在起作用...

Java Java命令学习系列(一)——Jps

jps位于jdk的bin目录下,其作用是显示当前系统的java进程情况,及其id号。jps相当于Solaris进程工具ps。不象”pgrepjava”或”ps-efgrepjava”,jps...

面试题专题:头条一面参考答案(003)

前两篇文章也都是介绍头条一面的内容及参考答案...

Java JVM原理与性能调优:从基础到高级应用

一、JVM基础架构与内存模型1.1JVM整体架构概览Java虚拟机(JVM)是Java程序运行的基石,它由以下几个核心子系统组成:...

死锁攻防战:阿里架构师教你用3种核武器杜绝程序僵死

从线程转储分析到银行家算法,彻底掌握大厂必考的死锁解决方案以下是为Java死锁问题设计的结构化技术解析方案,包含代码级解决方案与高频追问应对策略:...

Java 1.8 虚拟机内存分布详解

Java1.8虚拟机内存分布详解Java1.8的JVM内存布局相比早期版本有显著变化(如永久代被元空间取代)。以下是其核心内存区域的划分、作用及配置参数:一、JVM内存整体结构...

Java 多线程开发难题?这篇文章给你答案!

作为互联网大厂的后端开发人员,在Java多线程开发过程中,必然会面临诸多复杂且具有挑战性的问题。在高并发场景下,各类潜在问题对系统的稳定性与性能产生严重影响,本文将深入探讨这些问题,并提供全面且有...

软件性能调优全攻略:从瓶颈定位到工具应用

性能调优是软件测试中的重要环节,旨在提高系统的响应时间、吞吐量、并发能力、资源利用率,并降低系统崩溃或卡顿的风险。通常,性能调优涉及发现性能瓶颈、分析问题根因、优化代码和系统配置等步骤,调优之前需要先...

JVM性能优化实战技巧

JVM性能优化实战技巧在现代企业级应用开发中,JavaVirtualMachine(JVM)作为承载Java应用程序的核心引擎,其性能直接决定了系统的响应速度、吞吐量以及资源利用率。因此,掌握一些...

JVM 深度解析:运行时数据区域、分代回收与垃圾回收机制全攻略

共同学习,有错欢迎指出。JVM运行时数据区域1.程序计数器程序计数器是一块较小的内存空间,可看作当前线程所执行的字节码的行号指示器。在虚拟机概念模型里,字节码解释器通过改变这个计数器的值选取下一条...

JVM内存管理详解与调优实战

JVM内存管理详解与调优实战Java虚拟机(JVM)作为Java程序运行的核心组件,其内存管理机制直接影响着应用程序的性能表现。今天,咱们就来一场既严肃又有趣的JVM内存管理之旅,看看这个“幕后英雄”...

取消回复欢迎 发表评论: