Extrair datas de cabeçalhos de e-mails manualmente é uma tarefa repetitiva e propensa a erros. Com uma abordagem via linha de comando, você automatiza o processo, garantindo precisão e economizando tempo valioso.
Abra o arquivo de cabeçalho do e-mail e localize a linha que começa com "Date:". Esta linha contém a data e hora do envio do e-mail no formato padrão RFC 2822.
Date: Wed, 15 May 2024 10:30:00 +0000
Use o comando grep para filtrar a linha "Date:" do arquivo. O comando abaixo exibe apenas a linha desejada.
grep "^Date:" arquivo_cabecalho.txt
Crie um script Python para extrair e formatar a data. O script abaixo lê o arquivo, encontra a linha "Date:" e converte a data para o formato "dd/mm/yyyy".
import re
from datetime import datetime
with open('arquivo_cabecalho.txt', 'r') as file:
for line in file:
if line.startswith('Date:'):
date_str = line[6:].strip()
date_obj = datetime.strptime(date_str, '%a, %d %b %Y %H:%M:%S %z')
formatted_date = date_obj.strftime('%d/%m/%Y')
print(formatted_date)
break
Salve o código Python em um arquivo, por exemplo, `extrair_data.py`, e execute-o no terminal.
python extrair_data.py
| Entrada (arquivo_cabecalho.txt) | Saída Esperada |
|---|---|
| Date: Wed, 15 May 2024 10:30:00 +0000 | 15/05/2024 |
| Date: Fri, 01 Jan 2021 15:45:00 +0000 | 01/01/2021 |
Com este método, você automatiza a extração de datas de cabeçalhos de e-mails em segundos, evitando erros manuais e garantindo consistência nos dados processados.