Modelo de correção de caracteres reconhecidos através de visão computacional (2024)
- Authors:
- Autor USP: SANTOS, ANDRÉ MARIO DOS REIS DOS - ICMC
- Unidade: ICMC
- DOI: 10.11606/003226658
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; VISÃO COMPUTACIONAL
- Keywords: OCR; Correção de erros de OCR; Correção Pós-OCR
- Language: Português
- Abstract: A informatização de dados é um processo essencial para armazenar registros mantidos em papel e permite que o conteúdo destes documentos possa ser manipulado para extrair informações através da computação. Para extrair textos de imagens, existem diversas alternativas para reconhecer os caracteres que compõem a escrita, porém, por mais avançados que estejam estes programas de reconhecimento ótico de caracteres (OCR), falhas podem ocorrer na obtenção das imagens antes do reconhecimento causando a troca ou exclusão de caracteres. Uma proposta para corrigir erros de reconhecimento é apresentada neste trabalho como etapa pós-OCR capaz de detectar e corrigir palavras com erros através de métodos de análise linguística, de tradução estatística (SMT) e tradução com aprendizado de máquina (NMT). A base de dados ICDAR 2019 foi utilizada como amostras de treinamento e avaliação dos modelos. Como resultado da pesquisa este trabalho compila diversas medidas de desempenho para os modelos com destaque para a precisão F1 geral para detecção de erros obtendo a marca de 60,7% e proporção de palavras corrigidas obtendo a margem de 15,71% para o conjunto de avaliação.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
SANTOS, André Mario dos Reis dos. Modelo de correção de caracteres reconhecidos através de visão computacional. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://doi.org/10.11606/003226658. Acesso em: 18 fev. 2026. -
APA
Santos, A. M. dos R. dos. (2024). Modelo de correção de caracteres reconhecidos através de visão computacional (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003226658 -
NLM
Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2026 fev. 18 ] Available from: https://doi.org/10.11606/003226658 -
Vancouver
Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2026 fev. 18 ] Available from: https://doi.org/10.11606/003226658
Informações sobre o DOI: 10.11606/003226658 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| André_Mario_dos_Reis_dos... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
