Estatistica para Ciencia de Dados e Machine Learning

Aprenda na teoria e na prática tudo o que você precisa saber sobre estatística em Data Science utilizando o Python!
Estatistica para Ciencia de Dados e Machine Learning
File Size :
7.49 GB
Total length :
20h 42m

Category

Instructor

Jones Granatyr

Language

Last update

Última atualização em 3/2021

Ratings

4.7/5

Estatistica para Ciencia de Dados e Machine Learning

What you’ll learn

Os principais conceitos e cálculos estatísticos utilizados em Ciência de Dados e Machine Learning
Os cálculos de estatística e probabilidade implementados passo a passo na linguagem Python
Como a Estatística está relacionada com a Ciência de Dados e Machine Learning
Implementar técnicas de amostragem, como por exemplo: amostragem simples, sistemática, estratificada, grupos e reservatório
Aprender a teoria e a prática sobre os principais algoritmos de Machine Learning, bem como sua ligação com a Estatística
Utilizar técnicas de amostragem para lidar com dados desbalanceados em Machine Learning
Calcular percentuais, índices, coeficientes e taxas
Aprender passo a passo como calcular distribuições de frequência e gerar histogramas para visualização
Calcular medidas de posição, como por exemplo: média, moda, mediana, quartis e percentis
Calcular medidas de dispersão de dados, como por exemplo: amplitude, variância, desvio padrão e coeficiente de variação
Como utilizar as medidas de posição e dispersão para avaliar algoritmos de Machine Learning
Como utilizar medidas de posição para tratar valores faltantes em bases de dados
Calcular a variância para escolher os melhores atributos em uma base de dados
Entender a principais distribuições estatísticas e de probabilidade, como por exemplo: distribuição normal, gama, exponencial, uniforme, Bernoulli, binomial e de Poisson
Como utilizar a estatística inferencial para cálculos de probabilidade
Calcular intervalos de confiança
Realizar testes de hipóteses, implementando os cálculos passo a passo
Realizar testes de hipóteses com ANOVA, Qui Quadrado, Wilcoxon, Friedman e Nemenyi
Calcular correlação entre variáveis
Criar modelos de regressão linear para previsão de números
Criar gráficos e mapas para facilitar a interpretação dos dados

Estatistica para Ciencia de Dados e Machine Learning

Requirements

É desejável que você conheça o básico sobre a linguagem Python, porém, é possível acompanhar o curso tranquilamente sem conhecer essa linguagem com profundidade
É mais fácil para acompanhar o curso caso você já tenha um conhecimento inicial sobre Machine Learning. Contudo, existem aulas básicas sobre os algoritmos de Machine Learning antes de cada conteúdo específico

Description

A Estatística proporciona os meios e as ferramentas para encontrar estrutura em dados com o objetivo de fornecer insights sobre as informações mais profundas ali escondidas. Medidas estatísticas como média, mediana, moda, desvio padrão e distribuição servem para descrever o comportamento das variáveis de uma base de dados, assim como identificar anomalias. Em outras palavras, é preciso conhecer a “matéria-prima” com que se está trabalhando por meio de características que nos servem de resumo sobre sua natureza. Esse é o objetivo da Estatística! Se os algoritmos de machine learning são as ferramentas que os cientistas de dados operam, a Estatística é o conhecimento sobre como e porquê essas ferramentas funcionam, permitindo escolher as ferramentas mais adequadas para tirar o melhor proveito delas.Existe um ditado atribuído a Josh Wills, ex-funcionário do Google e do Cloudera e atualmente presidente de Engenharia de Dados do Slack: um cientista de dados é um programador melhor do que qualquer estatístico e um estatístico melhor do que qualquer programador. Sem um bom conhecimento estatístico, o cientista de dados é como um soldado cego com um arsenal poderoso. O domínio estatístico torna seu trabalho mais direcionado, eficiente e robusto, e permite uma utilização mais ativa dos modelos de machine learning já estabelecidos, uma vez que ele tem o conhecimento necessário para investigar as bases teóricas que fundamentam esses modelos.Baseado nisso, neste curso você terá uma visão teórica e principalmente prática passo a passo sobre os principais conceitos de Estatística, bem como sua ligação com a Ciência de Dados e a Aprendizagem de Máquina (Machine Learning). Você aprenderá a teoria, os cálculos passo a passo, implementará os cálculos utilizando a linguagem de programação Python e também utilizará bibliotecas prontas! O diferencial deste curso é que além de aprender estatística, você aprenderá como utilizá-la em aprendizagem de máquina. O conteúdo está dividido em nove partes: (i) população e amostra, (ii) dados relativos e absolutos, (iii) distribuição de frequência, (iv) medidas de posição e dispersão, (v) distribuições estatísticas, (vi) probabilidade, (vii) intervalos de confiança e testes de hipóteses, (viii) correlação e regressão e (ix) visualização. Confira abaixo alguns dos tópicos que você aprenderá, integrando os conceitos estatísticos com aprendizagem de máquina e ciência de dados:Uso de amostragem para trabalhar com dados desbalanceados em classificação ou regressão (undersampling e oversampling)Cálculos de distribuição de frequência para aplicação de regras de associaçãoAvaliação de algoritmos de classificação utilizando medidas de posição e dispersãoSeleção de atributos utilizando cálculos de variânciaPreenchimento de valores faltantes em bases de dados utilizando medidas de posiçãoCálculo de padronização (z-score) aplicado em machine learningTratamento de dados enviesados em machine learningUso de distribuições estatísticas para inicialização de pesos em redes neurais artificiaisAlgoritmo Naïve Bayes utilizando as distribuições de Bernoulli e MultinomialPrevisões com probabilidade em machine learningUso das técnicas ANOVA e Qui Quadrado para seleção de atributos em bases de dadosTestes de hipóteses paramétricos e não paramétricos, aplicados na avaliação de algoritmosPrevisão do preço de casas utilizando regressão linearCriação de gráficos e mapas para ajudar na interpretação de dadosEste é o curso ideal caso você queira aumentar significativamente seus conhecimentos em Estatística, Ciência de Dados e Machine Learning, mais de 160 aulas com exercícios resolvidos! O curso é para todos os níveis de conhecimento, ou seja, se você é iniciante ou de nível avançado conseguirá aproveitar o conteúdo.

Overview

Section 1: Introdução

Lecture 1 Boas-vindas e conteúdo do curso

Lecture 2 Mais sobre Ciência de Dados e Machine Learning

Lecture 3 Recursos para download

Section 2: População e amostra

Lecture 4 Introdução

Lecture 5 População e amostra

Lecture 6 Tabela de números aleatórios

Lecture 7 Amostragem aleatória simples

Lecture 8 Amostragem sistemática – teoria

Lecture 9 Amostragem sistemática – implementação

Lecture 10 Amostragem por grupos – teoria

Lecture 11 Amostragem por grupos – implementação

Lecture 12 Amostragem estratificada – teoria

Lecture 13 Amostragem estratificada – implementação

Lecture 14 Amostragem de reservatório – teoria

Lecture 15 Amostragem de reservatório – implementação

Lecture 16 Amostragem de reservatório – debug passo a passo

Lecture 17 Comparativo das amostragens

Lecture 18 EXERCÍCIO

Lecture 19 Solução o exercício

Lecture 20 Introdução a classificação

Lecture 21 Introdução ao algoritmo Naïve Bayes

Lecture 22 Classificação com Naïve Bayes 1

Lecture 23 Classificação com Naïve Bayes 2

Lecture 24 Classificação com Naïve Bayes 3

Lecture 25 Subamostragem e sobreamostragem – teoria

Lecture 26 Subamostragem com Tomek links – implementação

Lecture 27 Sobreamostragem com SMOTE – implementação

Lecture 28 EXERCÍCIO

Lecture 29 Solução para o exercício

Section 3: Dados absolutos e relativos

Lecture 30 Introdução

Lecture 31 Percentuais 1

Lecture 32 Percentuais 2

Lecture 33 EXERCÍCIO

Lecture 34 Solução para o exercício

Lecture 35 Índices, coeficientes e taxas

Lecture 36 EXERCÍCIO

Lecture 37 Solução para o exercício

Section 4: Distribuição de frequência

Lecture 38 Introdução

Lecture 39 Distribuição de frequência – teoria

Lecture 40 Distribuição de frequência – implementação 1

Lecture 41 Distribuição de frequência – implementação 2

Lecture 42 Histograma com numpy e matplotlib

Lecture 43 Histograma com pandas e seaborn

Lecture 44 EXERCÍCIO

Lecture 45 Solução para o exercício

Lecture 46 Introdução a regras de associação

Lecture 47 Algoritmo Apriori

Lecture 48 Regras de associação com Apriori

Section 5: Medidas de posição e dispersão

Lecture 49 Introdução

Lecture 50 Média aritmética, moda e mediana – dados não agrupados

Lecture 51 Média aritmética, moda e mediana – implementação

Lecture 52 Média aritmética ponderada

Lecture 53 Média aritmética, moda e mediana – dados agrupados

Lecture 54 Média aritmética, moda e mediana – implementação

Lecture 55 Média geométrica, harmônica e quadrática

Lecture 56 Quartis – dados não agrupados

Lecture 57 Quartis – implementação 1

Lecture 58 Quartis – dados agrupados

Lecture 59 Quartis – implementação 2

Lecture 60 Percentis

Lecture 61 EXERCÍCIO

Lecture 62 Solução para o exercício

Lecture 63 Amplitude amostral e diferença interquartil

Lecture 64 Variância – dados não agrupados

Lecture 65 Variância – implementação

Lecture 66 Desvio padrão – teoria e implementação

Lecture 67 Coeficiente de variação – teoria e implementação

Lecture 68 Desvio padrão com dados agrupados

Lecture 69 Desvio padrão com dados agrupados – implementação

Lecture 70 Árvores de decisão

Lecture 71 Regressão logística

Lecture 72 Avaliação de algoritmos de machine learning 1

Lecture 73 Avaliação de algoritmos de machine learning 2

Lecture 74 EXERCÍCIO

Lecture 75 Validação cruzada

Lecture 76 Solução para o exercício

Lecture 77 Seleção de atributos com variância

Lecture 78 EXERCÍCIO

Lecture 79 Solução para o exercício

Lecture 80 Valores faltantes com média e moda

Section 6: Distribuições estatísticas

Lecture 81 Introdução

Lecture 82 Tipos de variáveis

Lecture 83 Distribuição normal – teoria e prática

Lecture 84 Distribuição normal – altura das pessoas

Lecture 85 Enviesamento

Lecture 86 Distribuição normal – padronização

Lecture 87 Teoria central do limite

Lecture 88 Distribuição gama

Lecture 89 Distribuição exponencial

Lecture 90 Distribuição uniforme

Lecture 91 Distribuição de Bernoulli

Lecture 92 Distribuição binomial

Lecture 93 Distribuição de Poisson

Lecture 94 EXERCÍCIO

Lecture 95 Solução para o exercício

Lecture 96 Bernoulli Naïve Bayes

Lecture 97 Multinomial Naïve Bayes

Lecture 98 Algoritmo k-NN

Lecture 99 Padronização (z-score) e k-NN

Lecture 100 Introdução a regressão linear

Lecture 101 Dados enviesados em machine learning

Lecture 102 Introdução a redes neurais artificiais

Lecture 103 Inicialização de pesos em redes neurais artificiais

Lecture 104 Testes de normalidade

Section 7: Probabilidade

Lecture 105 Introdução

Lecture 106 Básico sobre probabilidade

Lecture 107 Permutação

Lecture 108 Combinação

Lecture 109 Interseção, união e complemento

Lecture 110 Eventos independentes e dependentes

Lecture 111 Probabilidade condicional

Lecture 112 Teorema de Bayes e redes bayesianas

Lecture 113 Redes bayesianas com o Netica

Lecture 114 EXERCÍCIOS E SOLUÇÕES

Lecture 115 Classificador Ótimo de Bayes e Naïve Bayes

Lecture 116 Probabilidade e distribuição normal 1

Lecture 117 Probabilidade e distribuição normal 2

Lecture 118 EXERCÍCIOS E SOLUÇÕES

Lecture 119 Probabilidade e distribuição binomial

Lecture 120 EXERCÍCIOS E SOLUÇÕES

Lecture 121 Probabilidade e distribuição de Poisson

Lecture 122 EXERCÍCIOS E SOLUÇÕES

Lecture 123 Previsões com probabilidade em machine learning

Section 8: Intervalos de confiança e testes de hipóteses

Lecture 124 Introdução

Lecture 125 Intervalos de confiança – introdução

Lecture 126 Intervalos de confiança – cálculos

Lecture 127 Intervalos de confiança – implementação

Lecture 128 EXERCÍCIO E SOLUÇÃO

Lecture 129 Distribuição T Student – teoria

Lecture 130 Distribuição T Student – implementação

Lecture 131 Intervalos de confiança em machine learning

Lecture 132 Teste de hipótese – introdução

Lecture 133 Teste de hipótese Z – cálculo

Lecture 134 Teste de hipótese Z – implementação

Lecture 135 EXERCÍCIO

Lecture 136 Solução para o exercício – teste T Student

Lecture 137 Qui Quadrado – cálculo

Lecture 138 Qui Quadrado – implementação

Lecture 139 Qui Quadrado – seleção de atributos

Lecture 140 ANOVA – análise de variância – teoria

Lecture 141 ANOVA – análise de variância – implementação

Lecture 142 ANOVA – seleção de atributos

Lecture 143 Mais testes de hipótese de normalidade

Lecture 144 Teste de Wilcoxon e Friedman

Lecture 145 EXERCÍCIO

Lecture 146 Solução para o exercício

Lecture 147 Teste de Nemenyi

Lecture 148 Dados não normais

Section 9: Correlação e regressão

Lecture 149 Introdução

Lecture 150 Covariância, coeficiente de correlação e determinação

Lecture 151 Implementação dos coeficientes

Lecture 152 EXERCÍCIO

Lecture 153 Solução para o exercício

Lecture 154 Correlação entre variáveis com Yellowbrick

Lecture 155 Aviso: aula regressão linear

Lecture 156 Introdução a regressão linear

Lecture 157 Regressão linear simples – implementação

Lecture 158 Métricas de erro – teoria e implementação

Lecture 159 Regressão linear múltipla

Lecture 160 EXERCÍCIO

Lecture 161 Solução para o exercício

Lecture 162 Seleção de atributos

Section 10: Visualização

Lecture 163 Introdução

Lecture 164 Gráfico de dispersão

Lecture 165 Gráfico de barra e setor

Lecture 166 Gráfico de linha

Lecture 167 Boxplot

Lecture 168 Gráfico com atributos categóricos

Lecture 169 Subgráficos

Lecture 170 Mapa com latitude e longitude

Lecture 171 EXERCÍCIO

Lecture 172 Solução para o exercício

Section 11: Considerações finais

Lecture 173 Considerações finais

Lecture 174 AULA BÔNUS

Pessoas que queiram entender a relação entre a Estatística, Ciência de Dados e Machine Learning,Pessoas que querem estudar Estatística para Ciência de Dados e Machine Learning, porém, não sabem por onde começar,Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial,Qualquer pessoa interessada em Estatística, Ciência de Dados e Machine Learning,Cientistas de Dados que queiram aumentar seus conhecimentos em Estatística

Course Information:

Udemy | Português | 20h 42m | 7.49 GB
Created by: Jones Granatyr

You Can See More Courses in the Developer >> Greetings from CourseDown.com

New Courses

Scroll to Top