Exportar registro bibliográfico

Modelo de correção de caracteres reconhecidos através de visão computacional (2024)

  • Authors:
  • Autor USP: SANTOS, ANDRÉ MARIO DOS REIS DOS - ICMC
  • Unidade: ICMC
  • Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; VISÃO COMPUTACIONAL
  • Keywords: OCR; Correção de erros de OCR; Correção Pós-OCR
  • Language: Português
  • Abstract: A informatização de dados é um processo essencial para armazenar registros mantidos em papel e permite que o conteúdo destes documentos possa ser manipulado para extrair informações através da computação. Para extrair textos de imagens, existem diversas alternativas para reconhecer os caracteres que compõem a escrita, porém, por mais avançados que estejam estes programas de reconhecimento ótico de caracteres (OCR), falhas podem ocorrer na obtenção das imagens antes do reconhecimento causando a troca ou exclusão de caracteres. Uma proposta para corrigir erros de reconhecimento é apresentada neste trabalho como etapa pós-OCR capaz de detectar e corrigir palavras com erros através de métodos de análise linguística, de tradução estatística (SMT) e tradução com aprendizado de máquina (NMT). A base de dados ICDAR 2019 foi utilizada como amostras de treinamento e avaliação dos modelos. Como resultado da pesquisa este trabalho compila diversas medidas de desempenho para os modelos com destaque para a precisão F1 geral para detecção de erros obtendo a marca de 60,7% e proporção de palavras corrigidas obtendo a margem de 15,71% para o conjunto de avaliação.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada André_Mario_dos_Reis_dos... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SANTOS, André Mario dos Reis dos. Modelo de correção de caracteres reconhecidos através de visão computacional. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf. Acesso em: 28 abr. 2025.
    • APA

      Santos, A. M. dos R. dos. (2024). Modelo de correção de caracteres reconhecidos através de visão computacional (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf
    • NLM

      Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2025 abr. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf
    • Vancouver

      Santos AM dos R dos. Modelo de correção de caracteres reconhecidos através de visão computacional [Internet]. 2024 ;[citado 2025 abr. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/0a3f4ae2-864e-43a7-b4e8-e638cae166dc/Andr%C3%A9_Mario_dos_Reis_dos_Santos.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2025