Estatistica para Ciencia de Dados e Machine Learning
What you’ll learn
Os principais conceitos e cálculos estatísticos utilizados em Ciência de Dados e Machine Learning
Os cálculos de estatística e probabilidade implementados passo a passo na linguagem Python
Como a Estatística está relacionada com a Ciência de Dados e Machine Learning
Implementar técnicas de amostragem, como por exemplo: amostragem simples, sistemática, estratificada, grupos e reservatório
Aprender a teoria e a prática sobre os principais algoritmos de Machine Learning, bem como sua ligação com a Estatística
Utilizar técnicas de amostragem para lidar com dados desbalanceados em Machine Learning
Calcular percentuais, índices, coeficientes e taxas
Aprender passo a passo como calcular distribuições de frequência e gerar histogramas para visualização
Calcular medidas de posição, como por exemplo: média, moda, mediana, quartis e percentis
Calcular medidas de dispersão de dados, como por exemplo: amplitude, variância, desvio padrão e coeficiente de variação
Como utilizar as medidas de posição e dispersão para avaliar algoritmos de Machine Learning
Como utilizar medidas de posição para tratar valores faltantes em bases de dados
Calcular a variância para escolher os melhores atributos em uma base de dados
Entender a principais distribuições estatísticas e de probabilidade, como por exemplo: distribuição normal, gama, exponencial, uniforme, Bernoulli, binomial e de Poisson
Como utilizar a estatística inferencial para cálculos de probabilidade
Calcular intervalos de confiança
Realizar testes de hipóteses, implementando os cálculos passo a passo
Realizar testes de hipóteses com ANOVA, Qui Quadrado, Wilcoxon, Friedman e Nemenyi
Calcular correlação entre variáveis
Criar modelos de regressão linear para previsão de números
Criar gráficos e mapas para facilitar a interpretação dos dados
Requirements
É desejável que você conheça o básico sobre a linguagem Python, porém, é possível acompanhar o curso tranquilamente sem conhecer essa linguagem com profundidade
É mais fácil para acompanhar o curso caso você já tenha um conhecimento inicial sobre Machine Learning. Contudo, existem aulas básicas sobre os algoritmos de Machine Learning antes de cada conteúdo específico
Description
A Estatística proporciona os meios e as ferramentas para encontrar estrutura em dados com o objetivo de fornecer insights sobre as informações mais profundas ali escondidas. Medidas estatísticas como média, mediana, moda, desvio padrão e distribuição servem para descrever o comportamento das variáveis de uma base de dados, assim como identificar anomalias. Em outras palavras, é preciso conhecer a “matéria-prima” com que se está trabalhando por meio de características que nos servem de resumo sobre sua natureza. Esse é o objetivo da Estatística! Se os algoritmos de machine learning são as ferramentas que os cientistas de dados operam, a Estatística é o conhecimento sobre como e porquê essas ferramentas funcionam, permitindo escolher as ferramentas mais adequadas para tirar o melhor proveito delas.Existe um ditado atribuído a Josh Wills, ex-funcionário do Google e do Cloudera e atualmente presidente de Engenharia de Dados do Slack: um cientista de dados é um programador melhor do que qualquer estatístico e um estatístico melhor do que qualquer programador. Sem um bom conhecimento estatístico, o cientista de dados é como um soldado cego com um arsenal poderoso. O domínio estatístico torna seu trabalho mais direcionado, eficiente e robusto, e permite uma utilização mais ativa dos modelos de machine learning já estabelecidos, uma vez que ele tem o conhecimento necessário para investigar as bases teóricas que fundamentam esses modelos.Baseado nisso, neste curso você terá uma visão teórica e principalmente prática passo a passo sobre os principais conceitos de Estatística, bem como sua ligação com a Ciência de Dados e a Aprendizagem de Máquina (Machine Learning). Você aprenderá a teoria, os cálculos passo a passo, implementará os cálculos utilizando a linguagem de programação Python e também utilizará bibliotecas prontas! O diferencial deste curso é que além de aprender estatística, você aprenderá como utilizá-la em aprendizagem de máquina. O conteúdo está dividido em nove partes: (i) população e amostra, (ii) dados relativos e absolutos, (iii) distribuição de frequência, (iv) medidas de posição e dispersão, (v) distribuições estatísticas, (vi) probabilidade, (vii) intervalos de confiança e testes de hipóteses, (viii) correlação e regressão e (ix) visualização. Confira abaixo alguns dos tópicos que você aprenderá, integrando os conceitos estatísticos com aprendizagem de máquina e ciência de dados:Uso de amostragem para trabalhar com dados desbalanceados em classificação ou regressão (undersampling e oversampling)Cálculos de distribuição de frequência para aplicação de regras de associaçãoAvaliação de algoritmos de classificação utilizando medidas de posição e dispersãoSeleção de atributos utilizando cálculos de variânciaPreenchimento de valores faltantes em bases de dados utilizando medidas de posiçãoCálculo de padronização (z-score) aplicado em machine learningTratamento de dados enviesados em machine learningUso de distribuições estatísticas para inicialização de pesos em redes neurais artificiaisAlgoritmo Naïve Bayes utilizando as distribuições de Bernoulli e MultinomialPrevisões com probabilidade em machine learningUso das técnicas ANOVA e Qui Quadrado para seleção de atributos em bases de dadosTestes de hipóteses paramétricos e não paramétricos, aplicados na avaliação de algoritmosPrevisão do preço de casas utilizando regressão linearCriação de gráficos e mapas para ajudar na interpretação de dadosEste é o curso ideal caso você queira aumentar significativamente seus conhecimentos em Estatística, Ciência de Dados e Machine Learning, mais de 160 aulas com exercícios resolvidos! O curso é para todos os níveis de conhecimento, ou seja, se você é iniciante ou de nível avançado conseguirá aproveitar o conteúdo.
Overview
Section 1: Introdução
Lecture 1 Boas-vindas e conteúdo do curso
Lecture 2 Mais sobre Ciência de Dados e Machine Learning
Lecture 3 Recursos para download
Section 2: População e amostra
Lecture 4 Introdução
Lecture 5 População e amostra
Lecture 6 Tabela de números aleatórios
Lecture 7 Amostragem aleatória simples
Lecture 8 Amostragem sistemática – teoria
Lecture 9 Amostragem sistemática – implementação
Lecture 10 Amostragem por grupos – teoria
Lecture 11 Amostragem por grupos – implementação
Lecture 12 Amostragem estratificada – teoria
Lecture 13 Amostragem estratificada – implementação
Lecture 14 Amostragem de reservatório – teoria
Lecture 15 Amostragem de reservatório – implementação
Lecture 16 Amostragem de reservatório – debug passo a passo
Lecture 17 Comparativo das amostragens
Lecture 18 EXERCÍCIO
Lecture 19 Solução o exercício
Lecture 20 Introdução a classificação
Lecture 21 Introdução ao algoritmo Naïve Bayes
Lecture 22 Classificação com Naïve Bayes 1
Lecture 23 Classificação com Naïve Bayes 2
Lecture 24 Classificação com Naïve Bayes 3
Lecture 25 Subamostragem e sobreamostragem – teoria
Lecture 26 Subamostragem com Tomek links – implementação
Lecture 27 Sobreamostragem com SMOTE – implementação
Lecture 28 EXERCÍCIO
Lecture 29 Solução para o exercício
Section 3: Dados absolutos e relativos
Lecture 30 Introdução
Lecture 31 Percentuais 1
Lecture 32 Percentuais 2
Lecture 33 EXERCÍCIO
Lecture 34 Solução para o exercício
Lecture 35 Índices, coeficientes e taxas
Lecture 36 EXERCÍCIO
Lecture 37 Solução para o exercício
Section 4: Distribuição de frequência
Lecture 38 Introdução
Lecture 39 Distribuição de frequência – teoria
Lecture 40 Distribuição de frequência – implementação 1
Lecture 41 Distribuição de frequência – implementação 2
Lecture 42 Histograma com numpy e matplotlib
Lecture 43 Histograma com pandas e seaborn
Lecture 44 EXERCÍCIO
Lecture 45 Solução para o exercício
Lecture 46 Introdução a regras de associação
Lecture 47 Algoritmo Apriori
Lecture 48 Regras de associação com Apriori
Section 5: Medidas de posição e dispersão
Lecture 49 Introdução
Lecture 50 Média aritmética, moda e mediana – dados não agrupados
Lecture 51 Média aritmética, moda e mediana – implementação
Lecture 52 Média aritmética ponderada
Lecture 53 Média aritmética, moda e mediana – dados agrupados
Lecture 54 Média aritmética, moda e mediana – implementação
Lecture 55 Média geométrica, harmônica e quadrática
Lecture 56 Quartis – dados não agrupados
Lecture 57 Quartis – implementação 1
Lecture 58 Quartis – dados agrupados
Lecture 59 Quartis – implementação 2
Lecture 60 Percentis
Lecture 61 EXERCÍCIO
Lecture 62 Solução para o exercício
Lecture 63 Amplitude amostral e diferença interquartil
Lecture 64 Variância – dados não agrupados
Lecture 65 Variância – implementação
Lecture 66 Desvio padrão – teoria e implementação
Lecture 67 Coeficiente de variação – teoria e implementação
Lecture 68 Desvio padrão com dados agrupados
Lecture 69 Desvio padrão com dados agrupados – implementação
Lecture 70 Árvores de decisão
Lecture 71 Regressão logística
Lecture 72 Avaliação de algoritmos de machine learning 1
Lecture 73 Avaliação de algoritmos de machine learning 2
Lecture 74 EXERCÍCIO
Lecture 75 Validação cruzada
Lecture 76 Solução para o exercício
Lecture 77 Seleção de atributos com variância
Lecture 78 EXERCÍCIO
Lecture 79 Solução para o exercício
Lecture 80 Valores faltantes com média e moda
Section 6: Distribuições estatísticas
Lecture 81 Introdução
Lecture 82 Tipos de variáveis
Lecture 83 Distribuição normal – teoria e prática
Lecture 84 Distribuição normal – altura das pessoas
Lecture 85 Enviesamento
Lecture 86 Distribuição normal – padronização
Lecture 87 Teoria central do limite
Lecture 88 Distribuição gama
Lecture 89 Distribuição exponencial
Lecture 90 Distribuição uniforme
Lecture 91 Distribuição de Bernoulli
Lecture 92 Distribuição binomial
Lecture 93 Distribuição de Poisson
Lecture 94 EXERCÍCIO
Lecture 95 Solução para o exercício
Lecture 96 Bernoulli Naïve Bayes
Lecture 97 Multinomial Naïve Bayes
Lecture 98 Algoritmo k-NN
Lecture 99 Padronização (z-score) e k-NN
Lecture 100 Introdução a regressão linear
Lecture 101 Dados enviesados em machine learning
Lecture 102 Introdução a redes neurais artificiais
Lecture 103 Inicialização de pesos em redes neurais artificiais
Lecture 104 Testes de normalidade
Section 7: Probabilidade
Lecture 105 Introdução
Lecture 106 Básico sobre probabilidade
Lecture 107 Permutação
Lecture 108 Combinação
Lecture 109 Interseção, união e complemento
Lecture 110 Eventos independentes e dependentes
Lecture 111 Probabilidade condicional
Lecture 112 Teorema de Bayes e redes bayesianas
Lecture 113 Redes bayesianas com o Netica
Lecture 114 EXERCÍCIOS E SOLUÇÕES
Lecture 115 Classificador Ótimo de Bayes e Naïve Bayes
Lecture 116 Probabilidade e distribuição normal 1
Lecture 117 Probabilidade e distribuição normal 2
Lecture 118 EXERCÍCIOS E SOLUÇÕES
Lecture 119 Probabilidade e distribuição binomial
Lecture 120 EXERCÍCIOS E SOLUÇÕES
Lecture 121 Probabilidade e distribuição de Poisson
Lecture 122 EXERCÍCIOS E SOLUÇÕES
Lecture 123 Previsões com probabilidade em machine learning
Section 8: Intervalos de confiança e testes de hipóteses
Lecture 124 Introdução
Lecture 125 Intervalos de confiança – introdução
Lecture 126 Intervalos de confiança – cálculos
Lecture 127 Intervalos de confiança – implementação
Lecture 128 EXERCÍCIO E SOLUÇÃO
Lecture 129 Distribuição T Student – teoria
Lecture 130 Distribuição T Student – implementação
Lecture 131 Intervalos de confiança em machine learning
Lecture 132 Teste de hipótese – introdução
Lecture 133 Teste de hipótese Z – cálculo
Lecture 134 Teste de hipótese Z – implementação
Lecture 135 EXERCÍCIO
Lecture 136 Solução para o exercício – teste T Student
Lecture 137 Qui Quadrado – cálculo
Lecture 138 Qui Quadrado – implementação
Lecture 139 Qui Quadrado – seleção de atributos
Lecture 140 ANOVA – análise de variância – teoria
Lecture 141 ANOVA – análise de variância – implementação
Lecture 142 ANOVA – seleção de atributos
Lecture 143 Mais testes de hipótese de normalidade
Lecture 144 Teste de Wilcoxon e Friedman
Lecture 145 EXERCÍCIO
Lecture 146 Solução para o exercício
Lecture 147 Teste de Nemenyi
Lecture 148 Dados não normais
Section 9: Correlação e regressão
Lecture 149 Introdução
Lecture 150 Covariância, coeficiente de correlação e determinação
Lecture 151 Implementação dos coeficientes
Lecture 152 EXERCÍCIO
Lecture 153 Solução para o exercício
Lecture 154 Correlação entre variáveis com Yellowbrick
Lecture 155 Aviso: aula regressão linear
Lecture 156 Introdução a regressão linear
Lecture 157 Regressão linear simples – implementação
Lecture 158 Métricas de erro – teoria e implementação
Lecture 159 Regressão linear múltipla
Lecture 160 EXERCÍCIO
Lecture 161 Solução para o exercício
Lecture 162 Seleção de atributos
Section 10: Visualização
Lecture 163 Introdução
Lecture 164 Gráfico de dispersão
Lecture 165 Gráfico de barra e setor
Lecture 166 Gráfico de linha
Lecture 167 Boxplot
Lecture 168 Gráfico com atributos categóricos
Lecture 169 Subgráficos
Lecture 170 Mapa com latitude e longitude
Lecture 171 EXERCÍCIO
Lecture 172 Solução para o exercício
Section 11: Considerações finais
Lecture 173 Considerações finais
Lecture 174 AULA BÔNUS
Pessoas que queiram entender a relação entre a Estatística, Ciência de Dados e Machine Learning,Pessoas que querem estudar Estatística para Ciência de Dados e Machine Learning, porém, não sabem por onde começar,Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial,Qualquer pessoa interessada em Estatística, Ciência de Dados e Machine Learning,Cientistas de Dados que queiram aumentar seus conhecimentos em Estatística
Course Information:
Udemy | Português | 20h 42m | 7.49 GB
Created by: Jones Granatyr
You Can See More Courses in the Developer >> Greetings from CourseDown.com