Reconhecimento de Textos com OCR e Python

OpenCV, Tesseract, EasyOCR e EAST aplicado em imagens e vídeos! Crie seu próprio OCR do zero com Deep Learning!
Reconhecimento de Textos com OCR e Python
File Size :
4.75 GB
Total length :
13h 41m

Category

Instructor

Jones Granatyr

Language

Last update

Última atualização em 3/2022

Ratings

4.6/5

Reconhecimento de Textos com OCR e Python

What you’ll learn

Utilizar as ferramentas Tesseract, EAST e EasyOCR para reconhecimento de caracteres
Entender as diferenças entre o OCR em ambientes controlados e ambientes naturais
Aplicar técnicas de pré-processamento de imagens para melhorar a qualidade das imagens, tais como: limiarização, inversão, redimensionamento, operações morfológicas e redução de ruído
Utilizar a estrutura EAST aplicado em reconhecimento em cenários naturais
Treinar um OCR do zero utilizando Deep Learning e Redes Neurais Convolucionais
Reconhecer textos em imagens e vídeos
Buscar termos específicos em imagens de um diretório
Preparar imagens escaneadas para o reconhecimento de textos
Tratar imagens de carros para a identificação de placas

Reconhecimento de Textos com OCR e Python

Requirements

Lógica de programação, principalmente estruturas condicionais e de repetição
Programação básica em Python

Description

Dentro da área da Visão Computacional existe a sub-área de Reconhecimento Ótico de Caracteres (ou OCR – Optical Character Recognition) que basicamente visa transformar imagens em textos. Em outras palavras, o OCR pode ser descrito como a conversão de imagens contendo texto digitado, escrito a mão ou impresso, em caracteres que uma máquina é capaz de entender. A imagem em questão pode ser um documento escaneado ou fotografado, na qual o texto é o principal objeto de interesse. Outro exemplo são imagens menos direcionadas, como uma fotografia de um cenário onde aparecem placas e fachadas.Por meio do OCR, é possível converter documentos escaneados ou fotografados em textos que podem ser editados em qualquer ferramenta, como o Microsoft Word por exemplo. Outro exemplo de aplicação são os leitores automáticos de formulários, nos quais você pode enviar uma foto da sua CNH (carteira nacional de habilitação), RG (registro geral) ou cartão de crédito e o sistema consegue fazer a leitura de todos os seus dados. Um carro autônomo pode utilizar OCR para ler as placas de trânsito e um condomínio pode ler a placa do carro, verificar se consta na base de dados para então liberar o acesso ao pátio! Existe uma infinidade de aplicações que podem ser desenvolvidas!E para levar você até essa área, neste curso você aprenderá na prática como utilizar várias bibliotecas de OCR para reconhecer textos em imagens e vídeos, tudo passo a passo e utilizando a linguagem Python! Vamos utilizar o Google Colab, ou seja, você não precisa se preocupar com instalações e configurações de bibliotecas em sua máquina, pois tudo será desenvolvido on-line utilizando as GPUs do Google! Além de utilizar ferramentas prontas, você também aprenderá como construir o seu próprio OCR do zero utilizando Deep Learning e Redes Neurais Convolucionais! Confira abaixo os principais tópicos que você aprenderá:Reconhecimento de textos em imagens e vídeos com Tesseract, EasyOCR e EASTBusca em imagens utilizando expressões regularesTécnicas para melhoria da qualidade das imagens, bem como: limiarização, inversão, escala de cinza, redimensionamento, remoção de ruídos e operações morfológicasUso da arquitetura EAST e da biblioteca EasyOCR para melhor desempenho em cenários naturaisTreinamento de um OCR do zero utilizando TensorFlow e modernas técnicas de Deep Learning com Redes Neurais ConvolucionaisBusca por ocorrências de textos em imagensAplicação de técnicas de processamento de linguagem natural nos textos extraídos pelo OCR (nuvem de palavras e extração de entidades nomeadas)Como preparar imagens vindas de fotos e scannersPré-processamento de imagens para extração e reconhecimento de placas de carrosEsses são somente alguns dos tópicos principais, e ao final do curso, você saberá tudo o que precisa para criar seus próprios projetos de reconhecimento de textos utilizando OCR!

Overview

Section 1: Introdução

Lecture 1 Boas-vindas e conteúdo do curso

Lecture 2 Mais sobre Visão Computacional

Lecture 3 Introdução à OCR

Lecture 4 Recursos para download

Section 2: OCR com Tesseract

Lecture 5 Introdução ao Tesseract

Lecture 6 Preparação do ambiente

Lecture 7 Primeiro reconhecimento de texto

Lecture 8 Suporte para outros idiomas

Lecture 9 Resolvendo problema relacionado ao pacote de idiomas

Lecture 10 Modo de segmentação de página (PSM)

Lecture 11 Detecção de orientação da página

Lecture 12 Seleção dos textos 1

Lecture 13 Seleção dos textos 2

Lecture 14 Seleção dos textos 3

Lecture 15 Busca com expressões regulares

Lecture 16 Detecção em cenários naturais

Section 3: Técnicas para pré-processamento de imagens

Lecture 17 Escala de cinza

Lecture 18 Limiarização – teoria

Lecture 19 Limiarização simples

Lecture 20 Limiarização com Método de Otsu

Lecture 21 Limiarização adaptativa

Lecture 22 Limiarização adaptativa gaussiana

Lecture 23 Inversão de cores

Lecture 24 Redimensionamento – teoria

Lecture 25 Redimensionamento – implementação

Lecture 26 Operações morfológicas – teoria

Lecture 27 Operações morfológicas – implementação

Lecture 28 Remoção de ruído – teoria

Lecture 29 Remoção de ruído – implementação

Lecture 30 Reconhecimento de textos

Lecture 31 EXERCÍCIO

Lecture 32 Solução o exercício

Section 4: OCR com EAST para cenários naturais

Lecture 33 EAST – introdução

Lecture 34 Processamento da imagem

Lecture 35 Carregamento da rede neural

Lecture 36 Decodificação dos resultados 1

Lecture 37 Decodificação dos resultados 2

Lecture 38 Detecção e reconhecimento dos textos

Section 5: Treinamento de OCR personalizado

Lecture 39 Importação das bibliotecas

Lecture 40 Base de dados MNIST 0-9

Lecture 41 Base de dados Kaggle A-Z

Lecture 42 Junção das bases de dados

Lecture 43 Pré-processamento dos dados

Lecture 44 Construção da rede neural

Lecture 45 Treinamento da rede neural

Lecture 46 Avaliação da rede neural

Lecture 47 Salvar a rede neural

Lecture 48 Testes com imagens

Lecture 49 Preparação do ambiente

Lecture 50 Pré-processamento da imagem

Lecture 51 Detecção de contornos

Lecture 52 Processamento das detecções 1

Lecture 53 Processamento das detecções 2

Lecture 54 Reconhecimento dos caracteres

Lecture 55 Problema do 0 e O, 1 e l, 5 e S

Lecture 56 Problema do texto não detectado

Section 6: Cenários naturais com EasyOCR

Lecture 57 Aviso sobre atualização da biblioteca

Lecture 58 Configuração do ambiente

Lecture 59 Reconhecimento de textos

Lecture 60 Escrita dos resultados na imagem

Lecture 61 Outros idiomas – francês e chinês

Lecture 62 Reconhecimento em texto com fundo

Section 7: OCR em vídeos

Lecture 63 Preparação do ambiente

Lecture 64 Configuração do vídeo

Lecture 65 Processamento do vídeo

Lecture 66 OCR com EAST e Tesseract

Lecture 67 OCR com EasyOCR

Section 8: Projeto 1: Busca por termos específicos

Lecture 68 Preparação do ambiente

Lecture 69 Reconhecimento dos textos

Lecture 70 Busca por ocorrências

Lecture 71 Nuvem de palavras

Lecture 72 Extração de entidades nomeadas

Lecture 73 Busca por ocorrências na imagem

Lecture 74 Caracteres maiúsculos e minúsculos

Lecture 75 Salvando os resultados

Section 9: Projeto 2: Scanner de documento + OCR

Lecture 76 Preparação do ambiente

Lecture 77 Detecção de contornos

Lecture 78 Transformação de perspectiva

Lecture 79 OCR com Tesseract

Lecture 80 Melhoria na qualidade da imagem

Lecture 81 Unindo as funções

Section 10: Projeto 3: Leitura de placas de carros

Lecture 82 Preparação do ambiente

Lecture 83 Tratamento da imagem

Lecture 84 Reconhecimento do texto

Lecture 85 Melhoria na qualidade da imagem

Section 11: ANEXO 1: Redes neurais artificiais

Lecture 86 Perceptron de uma camada

Lecture 87 Redes multicamada – função soma e função de ativação

Lecture 88 Redes multicamada – cálculo do erro

Lecture 89 Descida do gradiente

Lecture 90 Cálculo do parâmetro delta

Lecture 91 Ajuste dos pesos com backpropagation

Lecture 92 Bias, erro, descida do gradiente estocástica e mais parâmetros

Section 12: ANEXO 2: Redes neurais convolucionais

Lecture 93 Introdução a redes neurais convolucionais 1

Lecture 94 Introdução a redes neurais convolucionais 2

Lecture 95 Etapa 1 – operador de convolução (introdução)

Lecture 96 Etapa 1 – operador de convolução (cálculo)

Lecture 97 Etapa 2 – pooling

Lecture 98 Etapa 3 – flattening

Lecture 99 Etapa 4 – rede neural densa

Section 13: Considerações finais

Lecture 100 Considerações finais

Lecture 101 AULA BÔNUS

Pessoas interessadas em OCR (Optical Character Recognition – Reconhecimento Ótico de Caracteres),Alunos de graduação e pós-graduação que cursam disciplinas de Computação Gráfica, Processamento Digital de Imagens ou Inteligência Artificial,Cientistas de Dados que queiram aumentar seus conhecimentos em Visão Computacional,Profissionais interessados em desenvolver soluções profissionais de reconhecimento ótico de caracteres,Pessoas interessadas em criar o seu próprio OCR personalizado

Course Information:

Udemy | Português | 13h 41m | 4.75 GB
Created by: Jones Granatyr

You Can See More Courses in the Developer >> Greetings from CourseDown.com

New Courses

Scroll to Top