Exportar registro bibliográfico


Metrics:

Modelo de correção de caracteres reconhecidos através de visão computacional (2024)

  • Authors:
  • Autor USP: SANTOS, ANDRÉ MARIO DOS REIS DOS - ICMC
  • Unidade: ICMC
  • DOI: 10.11606/003226658
  • Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; VISÃO COMPUTACIONAL
  • Keywords: OCR; Correção de erros de OCR; Correção Pós-OCR
  • Language: Português
  • Abstract: A informatização de dados é um processo essencial para armazenar registros mantidos em papel e permite que o conteúdo destes documentos possa ser manipulado para extrair informações através da computação. Para extrair textos de imagens, existem diversas alternativas para reconhecer os caracteres que compõem a escrita, porém, por mais avançados que estejam estes programas de reconhecimento ótico de caracteres (OCR), falhas podem ocorrer na obtenção das imagens antes do reconhecimento causando a troca ou exclusão de caracteres. Uma proposta para corrigir erros de reconhecimento é apresentada neste trabalho como etapa pós-OCR capaz de detectar e corrigir palavras com erros através de métodos de análise linguística, de tradução estatística (SMT) e tradução com aprendizado de máquina (NMT). A base de dados ICDAR 2019 foi utilizada como amostras de treinamento e avaliação dos modelos. Como resultado da pesquisa este trabalho compila diversas medidas de desempenho para os modelos com destaque para a precisão F1 geral para detecção de erros obtendo a marca de 60,7% e proporção de palavras corrigidas obtendo a margem de 15,71% para o conjunto de avaliação.
  • Imprenta:
  • Versão PublicadaAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/003226658 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo NÃO é de acesso aberto

    Download do texto completo

    Tipo Nome Link
    Versão Publicada André_Mario_dos_Reis_dos... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SANTOS, André Mario dos Reis dos. Modelo de correção de caracteres reconhecidos através de visão computacional. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://doi.org/10.11606/003226658. Acesso em: 18 fev. 2026.
    • APA

      Santos, A. M. dos R. dos. (2024). Modelo de correção de caracteres reconhecidos através de visão computacional (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003226658
    • NLM

      Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2026 fev. 18 ] Available from: https://doi.org/10.11606/003226658
    • Vancouver

      Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2026 fev. 18 ] Available from: https://doi.org/10.11606/003226658

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2026