gershwin.pages.dev

Como extrair data de cabeçalho de e-mail via CLI?

Extrair datas de cabeçalhos de e-mails manualmente é uma tarefa repetitiva e propensa a erros. Com uma abordagem via linha de comando, você automatiza o processo, garantindo precisão e economizando tempo valioso.

Pré-requisitos

Passo 1: Identificar a linha de data no cabeçalho

Abra o arquivo de cabeçalho do e-mail e localize a linha que começa com "Date:". Esta linha contém a data e hora do envio do e-mail no formato padrão RFC 2822.

Date: Wed, 15 May 2024 10:30:00 +0000

Passo 2: Extrair a data usando comando grep

Use o comando grep para filtrar a linha "Date:" do arquivo. O comando abaixo exibe apenas a linha desejada.

grep "^Date:" arquivo_cabecalho.txt

Passo 3: Processar a data com Python

Crie um script Python para extrair e formatar a data. O script abaixo lê o arquivo, encontra a linha "Date:" e converte a data para o formato "dd/mm/yyyy".

import re
from datetime import datetime

with open('arquivo_cabecalho.txt', 'r') as file:
    for line in file:
        if line.startswith('Date:'):
            date_str = line[6:].strip()
            date_obj = datetime.strptime(date_str, '%a, %d %b %Y %H:%M:%S %z')
            formatted_date = date_obj.strftime('%d/%m/%Y')
            print(formatted_date)
            break

Passo 4: Executar o script

Salve o código Python em um arquivo, por exemplo, `extrair_data.py`, e execute-o no terminal.

python extrair_data.py

Exemplo Prático

Entrada (arquivo_cabecalho.txt) Saída Esperada
Date: Wed, 15 May 2024 10:30:00 +0000 15/05/2024
Date: Fri, 01 Jan 2021 15:45:00 +0000 01/01/2021

Conclusão

Com este método, você automatiza a extração de datas de cabeçalhos de e-mails em segundos, evitando erros manuais e garantindo consistência nos dados processados.