gershwin.pages.dev

Como criar um script para comparar dois arquivos de CPF e encontrar duplicatas?

Encontrar duplicatas entre dois arquivos de CPF pode ser uma tarefa tediosa e propensa a erros se feita manualmente. Felizmente, com um simples script em Python, você pode automatizar completamente esse processo, garantindo precisão e rapidez. Este método é eficaz porque compara todos os CPFs de forma sistemática, identificando instantaneamente os registros que aparecem em ambos os arquivos.

Pré-requisitos

Passo 1: Preparar o ambiente e os arquivos

Certifique-se de que seus arquivos de CPF estão em um formato simples, com um CPF por linha. Renomeie-os para facilitar a referência, por exemplo, cpfs_arquivo1.txt e cpfs_arquivo2.txt. Coloque-os na mesma pasta onde você criará o script.

Passo 2: Criar o script Python

Crie um arquivo chamado compara_cpfs.py e insira o código abaixo. Este script lê os dois arquivos, compara os CPFs e imprime as duplicatas encontradas.

def ler_cpfs_do_arquivo(nome_arquivo):
    with open(nome_arquivo, 'r') as arquivo:
        cpfs = [linha.strip() for linha in arquivo if linha.strip()]
    return cpfs

def encontrar_duplicatas(cpfs_arquivo1, cpfs_arquivo2):
    conjunto1 = set(cpfs_arquivo1)
    conjunto2 = set(cpfs_arquivo2)
    duplicatas = conjunto1.intersection(conjunto2)
    return sorted(duplicatas)

def main():
    arquivo1 = 'cpfs_arquivo1.txt'
    arquivo2 = 'cpfs_arquivo2.txt'

    cpfs_arquivo1 = ler_cpfs_do_arquivo(arquivo1)
    cpfs_arquivo2 = ler_cpfs_do_arquivo(arquivo2)

    duplicatas = encontrar_duplicatas(cpfs_arquivo1, cpfs_arquivo2)

    if duplicatas:
        print("CPFs duplicados encontrados:")
        for cpf in duplicatas:
            print(cpf)
    else:
        print("Nenhum CPF duplicado encontrado.")

if __name__ == "__main__":
    main()

Passo 3: Executar o script

Abra o terminal ou prompt de comando, navegue até a pasta onde o script e os arquivos de CPF estão localizados, e execute:

python compara_cpfs.py

O script exibirá na tela todos os CPFs que estão presentes nos dois arquivos, ou informará se não foram encontradas duplicatas.

Exemplo Prático

Considere os seguintes arquivos de exemplo:

Arquivo 1 (cpfs_arquivo1.txt) Arquivo 2 (cpfs_arquivo2.txt) Saída do Script
12345678901 11122233344 12345678901
98765432100 12345678901
11122233344 55566677788

Com este método, você automatiza a tarefa de encontrar duplicatas em segundos, evitando erros manuais e garantindo a integridade dos seus dados.