Reconhecimento de Textos com OCR e Python
What you’ll learn
Utilizar as ferramentas Tesseract, EAST e EasyOCR para reconhecimento de caracteres
Entender as diferenças entre o OCR em ambientes controlados e ambientes naturais
Aplicar técnicas de pré-processamento de imagens para melhorar a qualidade das imagens, tais como: limiarização, inversão, redimensionamento, operações morfológicas e redução de ruído
Utilizar a estrutura EAST aplicado em reconhecimento em cenários naturais
Treinar um OCR do zero utilizando Deep Learning e Redes Neurais Convolucionais
Reconhecer textos em imagens e vídeos
Buscar termos específicos em imagens de um diretório
Preparar imagens escaneadas para o reconhecimento de textos
Tratar imagens de carros para a identificação de placas
Requirements
Lógica de programação, principalmente estruturas condicionais e de repetição
Programação básica em Python
Description
Dentro da área da Visão Computacional existe a sub-área de Reconhecimento Ótico de Caracteres (ou OCR – Optical Character Recognition) que basicamente visa transformar imagens em textos. Em outras palavras, o OCR pode ser descrito como a conversão de imagens contendo texto digitado, escrito a mão ou impresso, em caracteres que uma máquina é capaz de entender. A imagem em questão pode ser um documento escaneado ou fotografado, na qual o texto é o principal objeto de interesse. Outro exemplo são imagens menos direcionadas, como uma fotografia de um cenário onde aparecem placas e fachadas.Por meio do OCR, é possível converter documentos escaneados ou fotografados em textos que podem ser editados em qualquer ferramenta, como o Microsoft Word por exemplo. Outro exemplo de aplicação são os leitores automáticos de formulários, nos quais você pode enviar uma foto da sua CNH (carteira nacional de habilitação), RG (registro geral) ou cartão de crédito e o sistema consegue fazer a leitura de todos os seus dados. Um carro autônomo pode utilizar OCR para ler as placas de trânsito e um condomínio pode ler a placa do carro, verificar se consta na base de dados para então liberar o acesso ao pátio! Existe uma infinidade de aplicações que podem ser desenvolvidas!E para levar você até essa área, neste curso você aprenderá na prática como utilizar várias bibliotecas de OCR para reconhecer textos em imagens e vídeos, tudo passo a passo e utilizando a linguagem Python! Vamos utilizar o Google Colab, ou seja, você não precisa se preocupar com instalações e configurações de bibliotecas em sua máquina, pois tudo será desenvolvido on-line utilizando as GPUs do Google! Além de utilizar ferramentas prontas, você também aprenderá como construir o seu próprio OCR do zero utilizando Deep Learning e Redes Neurais Convolucionais! Confira abaixo os principais tópicos que você aprenderá:Reconhecimento de textos em imagens e vídeos com Tesseract, EasyOCR e EASTBusca em imagens utilizando expressões regularesTécnicas para melhoria da qualidade das imagens, bem como: limiarização, inversão, escala de cinza, redimensionamento, remoção de ruídos e operações morfológicasUso da arquitetura EAST e da biblioteca EasyOCR para melhor desempenho em cenários naturaisTreinamento de um OCR do zero utilizando TensorFlow e modernas técnicas de Deep Learning com Redes Neurais ConvolucionaisBusca por ocorrências de textos em imagensAplicação de técnicas de processamento de linguagem natural nos textos extraídos pelo OCR (nuvem de palavras e extração de entidades nomeadas)Como preparar imagens vindas de fotos e scannersPré-processamento de imagens para extração e reconhecimento de placas de carrosEsses são somente alguns dos tópicos principais, e ao final do curso, você saberá tudo o que precisa para criar seus próprios projetos de reconhecimento de textos utilizando OCR!
Overview
Section 1: Introdução
Lecture 1 Boas-vindas e conteúdo do curso
Lecture 2 Mais sobre Visão Computacional
Lecture 3 Introdução à OCR
Lecture 4 Recursos para download
Section 2: OCR com Tesseract
Lecture 5 Introdução ao Tesseract
Lecture 6 Preparação do ambiente
Lecture 7 Primeiro reconhecimento de texto
Lecture 8 Suporte para outros idiomas
Lecture 9 Resolvendo problema relacionado ao pacote de idiomas
Lecture 10 Modo de segmentação de página (PSM)
Lecture 11 Detecção de orientação da página
Lecture 12 Seleção dos textos 1
Lecture 13 Seleção dos textos 2
Lecture 14 Seleção dos textos 3
Lecture 15 Busca com expressões regulares
Lecture 16 Detecção em cenários naturais
Section 3: Técnicas para pré-processamento de imagens
Lecture 17 Escala de cinza
Lecture 18 Limiarização – teoria
Lecture 19 Limiarização simples
Lecture 20 Limiarização com Método de Otsu
Lecture 21 Limiarização adaptativa
Lecture 22 Limiarização adaptativa gaussiana
Lecture 23 Inversão de cores
Lecture 24 Redimensionamento – teoria
Lecture 25 Redimensionamento – implementação
Lecture 26 Operações morfológicas – teoria
Lecture 27 Operações morfológicas – implementação
Lecture 28 Remoção de ruído – teoria
Lecture 29 Remoção de ruído – implementação
Lecture 30 Reconhecimento de textos
Lecture 31 EXERCÍCIO
Lecture 32 Solução o exercício
Section 4: OCR com EAST para cenários naturais
Lecture 33 EAST – introdução
Lecture 34 Processamento da imagem
Lecture 35 Carregamento da rede neural
Lecture 36 Decodificação dos resultados 1
Lecture 37 Decodificação dos resultados 2
Lecture 38 Detecção e reconhecimento dos textos
Section 5: Treinamento de OCR personalizado
Lecture 39 Importação das bibliotecas
Lecture 40 Base de dados MNIST 0-9
Lecture 41 Base de dados Kaggle A-Z
Lecture 42 Junção das bases de dados
Lecture 43 Pré-processamento dos dados
Lecture 44 Construção da rede neural
Lecture 45 Treinamento da rede neural
Lecture 46 Avaliação da rede neural
Lecture 47 Salvar a rede neural
Lecture 48 Testes com imagens
Lecture 49 Preparação do ambiente
Lecture 50 Pré-processamento da imagem
Lecture 51 Detecção de contornos
Lecture 52 Processamento das detecções 1
Lecture 53 Processamento das detecções 2
Lecture 54 Reconhecimento dos caracteres
Lecture 55 Problema do 0 e O, 1 e l, 5 e S
Lecture 56 Problema do texto não detectado
Section 6: Cenários naturais com EasyOCR
Lecture 57 Aviso sobre atualização da biblioteca
Lecture 58 Configuração do ambiente
Lecture 59 Reconhecimento de textos
Lecture 60 Escrita dos resultados na imagem
Lecture 61 Outros idiomas – francês e chinês
Lecture 62 Reconhecimento em texto com fundo
Section 7: OCR em vídeos
Lecture 63 Preparação do ambiente
Lecture 64 Configuração do vídeo
Lecture 65 Processamento do vídeo
Lecture 66 OCR com EAST e Tesseract
Lecture 67 OCR com EasyOCR
Section 8: Projeto 1: Busca por termos específicos
Lecture 68 Preparação do ambiente
Lecture 69 Reconhecimento dos textos
Lecture 70 Busca por ocorrências
Lecture 71 Nuvem de palavras
Lecture 72 Extração de entidades nomeadas
Lecture 73 Busca por ocorrências na imagem
Lecture 74 Caracteres maiúsculos e minúsculos
Lecture 75 Salvando os resultados
Section 9: Projeto 2: Scanner de documento + OCR
Lecture 76 Preparação do ambiente
Lecture 77 Detecção de contornos
Lecture 78 Transformação de perspectiva
Lecture 79 OCR com Tesseract
Lecture 80 Melhoria na qualidade da imagem
Lecture 81 Unindo as funções
Section 10: Projeto 3: Leitura de placas de carros
Lecture 82 Preparação do ambiente
Lecture 83 Tratamento da imagem
Lecture 84 Reconhecimento do texto
Lecture 85 Melhoria na qualidade da imagem
Section 11: ANEXO 1: Redes neurais artificiais
Lecture 86 Perceptron de uma camada
Lecture 87 Redes multicamada – função soma e função de ativação
Lecture 88 Redes multicamada – cálculo do erro
Lecture 89 Descida do gradiente
Lecture 90 Cálculo do parâmetro delta
Lecture 91 Ajuste dos pesos com backpropagation
Lecture 92 Bias, erro, descida do gradiente estocástica e mais parâmetros
Section 12: ANEXO 2: Redes neurais convolucionais
Lecture 93 Introdução a redes neurais convolucionais 1
Lecture 94 Introdução a redes neurais convolucionais 2
Lecture 95 Etapa 1 – operador de convolução (introdução)
Lecture 96 Etapa 1 – operador de convolução (cálculo)
Lecture 97 Etapa 2 – pooling
Lecture 98 Etapa 3 – flattening
Lecture 99 Etapa 4 – rede neural densa
Section 13: Considerações finais
Lecture 100 Considerações finais
Lecture 101 AULA BÔNUS
Pessoas interessadas em OCR (Optical Character Recognition – Reconhecimento Ótico de Caracteres),Alunos de graduação e pós-graduação que cursam disciplinas de Computação Gráfica, Processamento Digital de Imagens ou Inteligência Artificial,Cientistas de Dados que queiram aumentar seus conhecimentos em Visão Computacional,Profissionais interessados em desenvolver soluções profissionais de reconhecimento ótico de caracteres,Pessoas interessadas em criar o seu próprio OCR personalizado
Course Information:
Udemy | Português | 13h 41m | 4.75 GB
Created by: Jones Granatyr
You Can See More Courses in the Developer >> Greetings from CourseDown.com