Modelo de correção de caracteres reconhecidos através de visão computacional (2024)
- Authors:
- Autor USP: SANTOS, ANDRÉ MARIO DOS REIS DOS - ICMC
- Unidade: ICMC
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; VISÃO COMPUTACIONAL
- Keywords: OCR; Correção de erros de OCR; Correção Pós-OCR
- Language: Português
- Abstract: A informatização de dados é um processo essencial para armazenar registros mantidos em papel e permite que o conteúdo destes documentos possa ser manipulado para extrair informações através da computação. Para extrair textos de imagens, existem diversas alternativas para reconhecer os caracteres que compõem a escrita, porém, por mais avançados que estejam estes programas de reconhecimento ótico de caracteres (OCR), falhas podem ocorrer na obtenção das imagens antes do reconhecimento causando a troca ou exclusão de caracteres. Uma proposta para corrigir erros de reconhecimento é apresentada neste trabalho como etapa pós-OCR capaz de detectar e corrigir palavras com erros através de métodos de análise linguística, de tradução estatística (SMT) e tradução com aprendizado de máquina (NMT). A base de dados ICDAR 2019 foi utilizada como amostras de treinamento e avaliação dos modelos. Como resultado da pesquisa este trabalho compila diversas medidas de desempenho para os modelos com destaque para a precisão F1 geral para detecção de erros obtendo a marca de 60,7% e proporção de palavras corrigidas obtendo a margem de 15,71% para o conjunto de avaliação.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
-
ABNT
SANTOS, André Mario dos Reis dos. Modelo de correção de caracteres reconhecidos através de visão computacional. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf. Acesso em: 28 abr. 2025. -
APA
Santos, A. M. dos R. dos. (2024). Modelo de correção de caracteres reconhecidos através de visão computacional (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf -
NLM
Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2025 abr. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf -
Vancouver
Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2025 abr. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
André_Mario_dos_Reis_dos... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas