Machine Learning com Spark e Pyspark o Curso Completo 2022

Domine a Criação e Tunning de Modelos de Machine Learning Utilizando Spark e Python!
Machine Learning com Spark e Pyspark o Curso Completo 2022
File Size :
3.29 GB
Total length :
9h 51m

Category

Instructor

Fernando Amaral

Language

Last update

Última atualização em 5/2022

Ratings

4.7/5

Machine Learning com Spark e Pyspark o Curso Completo 2022

What you’ll learn

Aprenda Otimização de Hiper Parâmetros de Modelos
Saiba Criar Pipelines de Machine Learning
Domine Técnicas de Pré-Processamento de dados
Veja na Prática a Criação de Modelos de Regressão, Classificação e Clusters
Produza Assobiadores Robustos
Avalie a Performance de Modelos
Importe Dados
Persista Modelos
Utilize Técnicas como MultiLayer Perceptron, Random Forest e Regressão Logística

Machine Learning com Spark e Pyspark o Curso Completo 2022

Requirements

Conhecimentos Básicos de Python

Description

Faça uma super imersão em Machine Learning com Spark utilizando bibliotecas nativas! Na era “Big Data” o Spark se tornou a principal ferramenta de processamento de dados no mundo devido a sua capacidade de processar volumes massivos de dados com alta performance, se tornando uma ferramenta essencial para Cientistas e Engenheiros de Dados. Sua arquitetura distribuída permite processar dados utilizando paralelismo e memória, persistindo dados quando necessário. Além disso o Spark é capaz de importar dados de praticamente qualquer fonte, bem como também exportar dados processados para os principais formatos e bancos de dados utilizados.Do ponto de vista profissional, conhecer Spark é uma das habilidades mais importantes ao lado de Machine Learning e Python. E o melhor disso é o que Spark já traz tudo isso. Você pode utilizar Spark com Python, através do Pyspark, e você pode criar modelos de Machine Learning utilizando as próprias bibliotecas do Spark.Neste curso prático, você vai dominar o uso do Spark para Machine Learning:Aprenda os conceitos gerais de Machine LearningConheça o Processo de Importação de DadosDomine técnicas de pré-processamento, como substituição de valores faltantesAprenda técnicas de engenharia de atributos, como normalização de dados e codificação de categoriasCrie modelos de Regressão e Classificação, utilizando Redes Neurais, Random Forest e outrasAvalie a performance de seus modelosCrie Clusters e avalia a performanceProduza regras de associação com itens frequentesFaça o tunning de Hiper Parâmetros de ModelosCria fluxos de processamento de Machine Learning utilizando Pipelinese muito mais!Você ainda vai encontrar material do curso para baixar: scripts, slides e dados de exemplo.

Overview

Section 1: Introdução

Lecture 1 Apresentação

Lecture 2 Introdução

Lecture 3 Por que Machine Learning com Spark?

Section 2: Conceitos Gerais de Machine Learning

Lecture 4 Introdução

Lecture 5 Introdução Parte II

Lecture 6 Classificação

Lecture 7 Regressão

Lecture 8 Agrupamentos

Lecture 9 Sistemas de Recomendação

Lecture 10 Regressão Linear

Lecture 11 Regressão Logística

Lecture 12 Categorical Encoding

Lecture 13 Feature Scalling

Section 3: Preparação de Ambiente

Lecture 14 Atenção: sobre o ambiente para executar o curso!

Lecture 15 Escolhendo o Ambiente

Lecture 16 LINUX: Introdução sobre Instalação com VM Linux

Lecture 17 Downloads Necessários

Lecture 18 Instalando VM Ubuntu

Lecture 19 Instalando Spark

Lecture 20 Bibliotecas Adicionais

Lecture 21 Rodando Exemplos na Linha de Comando

Lecture 22 Instalando e Configurando Jupyter Notebooks

Lecture 23 WINDOWS: Orientações de Instalação e Configuração

Lecture 24 NUVEM: Databricks Community Edition

Section 4: Importação de Dados

Lecture 25 Dados Utilizados Durante o Curso

Lecture 26 Material para Download

Lecture 27 Introdução a Importação de Dados no Spark

Lecture 28 Formato LIBSVM

Lecture 29 Exemplos de Importações Diversas

Lecture 30 Importando LIBSVM

Section 5: Engenharia de Atributos e Pré-Processamento

Lecture 31 Vetorização de Atributos com VectorAssembler

Lecture 32 Geração de Características com PCA (Principal component analysis)

Lecture 33 Binarização de Atributos

Lecture 34 Indexação de Texto com StringIndexer

Lecture 35 Índice para Texto com IndexToString

Lecture 36 Categorical Encoding com One Hot Encoding

Lecture 37 Tratando Valores Ausentes com Imputer

Lecture 38 Expansão de Atributos com PolynomialExpansion

Lecture 39 Normalização de Dados com Normalizer

Lecture 40 Padronização de Dados com StandarScaler

Lecture 41 Padronização de Dados com RobustScaler

Lecture 42 Padronização de Dados com MinMaxScaler

Lecture 43 Padronização de Dados com MaxAbsScaler

Lecture 44 Discretização de Dados

Lecture 45 Transformação com RFormula

Lecture 46 Divisor de Vetores com VectorSlicer

Lecture 47 Seleção de Atributos com ChiSqSelector (qui-quadrado)

Lecture 48 Seleção de Atributos com UnivariateFeatureSelector

Section 6: Regressão com Spark

Lecture 49 Regressão Linear Múltipla com Spark

Lecture 50 Métodos Diversos de Regressão

Lecture 51 Regressão com RandomForest (Florestas Aleatórias)

Section 7: Classificação Binária e Multi Classe com Spark

Lecture 52 Classificação Logística

Lecture 53 Classificação com NaiveBayes

Lecture 54 Classificação com Rede Neural Artificial (Multi Layer Perceptron)

Section 8: Agrupamentos com Spark

Lecture 55 Agrupamentos com Kmeans

Lecture 56 Agrupamento Hierárquico com HierarchicalBisecting

Section 9: Associadores com Spark

Lecture 57 Associadores com FP-Growth

Section 10: Construindo Pipelines de Machine Learning

Lecture 58 Construindo Pipelines com Spark

Section 11: Ajuste de Hiper Parâmetros (Tunning)

Lecture 59 Ajuste com Cross-Validation

Lecture 60 Ajuste com Train-Validation Split

Section 12: Aula Bônus

Lecture 61 Para Saber Mais e Carreira na Área de Dados

Cientistas de Dados,Engenheiros de Dados,Engenheiros de Machine Learning,Analistas de Dados

Course Information:

Udemy | Português | 9h 51m | 3.29 GB
Created by: Fernando Amaral

You Can See More Courses in the Developer >> Greetings from CourseDown.com

New Courses

Scroll to Top