Encontrar duplicatas entre dois arquivos de CPF pode ser uma tarefa tediosa e propensa a erros se feita manualmente. Felizmente, com um simples script em Python, você pode automatizar completamente esse processo, garantindo precisão e rapidez. Este método é eficaz porque compara todos os CPFs de forma sistemática, identificando instantaneamente os registros que aparecem em ambos os arquivos.
Certifique-se de que seus arquivos de CPF estão em um formato simples, com um CPF por linha. Renomeie-os para facilitar a referência, por exemplo, cpfs_arquivo1.txt e cpfs_arquivo2.txt. Coloque-os na mesma pasta onde você criará o script.
Crie um arquivo chamado compara_cpfs.py e insira o código abaixo. Este script lê os dois arquivos, compara os CPFs e imprime as duplicatas encontradas.
def ler_cpfs_do_arquivo(nome_arquivo):
with open(nome_arquivo, 'r') as arquivo:
cpfs = [linha.strip() for linha in arquivo if linha.strip()]
return cpfs
def encontrar_duplicatas(cpfs_arquivo1, cpfs_arquivo2):
conjunto1 = set(cpfs_arquivo1)
conjunto2 = set(cpfs_arquivo2)
duplicatas = conjunto1.intersection(conjunto2)
return sorted(duplicatas)
def main():
arquivo1 = 'cpfs_arquivo1.txt'
arquivo2 = 'cpfs_arquivo2.txt'
cpfs_arquivo1 = ler_cpfs_do_arquivo(arquivo1)
cpfs_arquivo2 = ler_cpfs_do_arquivo(arquivo2)
duplicatas = encontrar_duplicatas(cpfs_arquivo1, cpfs_arquivo2)
if duplicatas:
print("CPFs duplicados encontrados:")
for cpf in duplicatas:
print(cpf)
else:
print("Nenhum CPF duplicado encontrado.")
if __name__ == "__main__":
main()
Abra o terminal ou prompt de comando, navegue até a pasta onde o script e os arquivos de CPF estão localizados, e execute:
python compara_cpfs.py
O script exibirá na tela todos os CPFs que estão presentes nos dois arquivos, ou informará se não foram encontradas duplicatas.
Considere os seguintes arquivos de exemplo:
| Arquivo 1 (cpfs_arquivo1.txt) | Arquivo 2 (cpfs_arquivo2.txt) | Saída do Script |
|---|---|---|
| 12345678901 | 11122233344 | 12345678901 |
| 98765432100 | 12345678901 | |
| 11122233344 | 55566677788 | |
Com este método, você automatiza a tarefa de encontrar duplicatas em segundos, evitando erros manuais e garantindo a integridade dos seus dados.