Les Data Sciences de A a Z

Data Science, Business Analytics, Data Analysis, Data Mining, Tableau, Statistiques, Modélisation, Régression, SQL, SSIS
Les Data Sciences de A a Z
File Size :
4.61 GB
Total length :
19h 30m

Category

Instructor

Hadelin de Ponteves

Language

Last update

Dernière mise à jour : 11/2017

Ratings

4.4/5

Les Data Sciences de A a Z

What you’ll learn

Réaliser correctement toutes les étapes d’un projet complexe de Data Science
Créer des Visualisations dans Tableau
Faire du Data Mining dans Tableau
Comprendre comment appliquer le test du khi-deux
Appliquer la méthode des Moindres Carrés Ordinaires pour faire des Régressions Linéaires
Evaluer tous types de modèles grâce au R-Squared
Evaluer tous types de modèles grâce au Adjusted R-Squared
Créer un modèle de Régression Linéaire Simple
Créer un modèle de Régression Linéaire Multiple
Créer des Dummy Variables
Interpréter les coefficients de la Régression Linéaire Multiple
Lire des outputs de modèles de Régression Linéaire
Utiliser les méthodes de Backward Elimination, Forward Selection et Bidirectional Elimination pour créer des modèles statistiques
Créer un modèle de Régression Logistique
Intégrer l’intuition de la Régression Logistique
Analyser les False Positives & False Negatives et comprendre la différence
Lire une Matrice de Confusion
Créer un Modèle Robuste de Segmentation Géo-Démographique
Transformer des variables indépendantes pour la modélisation
Dériver des variables indépendantes pour la modélisation
Vérifier la présence de multicolinéarité en utilisant le VIF (Variance Inflation Factor)
Avoir l’intuition de la multicolinéarité
Utiliser la courbe CAP (Cumulative Accuracy Profile) pour évaluer des modèles
Construire la courbe CAP dans Excel
Utiliser le Training set et le Test set pour construire des modèles robustes
Tirer des insights de votre courbe CAP
Comprendre le Odds Ratio
Tirer des business insights des coefficients d’une Régression Logistique
Comprendre à quoi ressemble la détérioration de modèle
Appliquer trois niveaux de maintenance de modèle pour empêcher la détérioration de modèle
Installer et utiliser SQL Server
Installer et utiliser Microsoft Visual Studio Shell
Nettoyer les données et chercher des anomalies
Utiliser SSIS (SQL Server Integration Services) pour uploader vos données dans une base de données
Créer des Conditional Splits dans SSIS
Gérer les erreurs de Text Qualifier
Créer des scripts dans SQL
Tirer profit de SQL pour des projets de Data Science
Créer des procédures stockées dans SQL
Présenter des projets de Data Science à des directeurs ou à un public

Les Data Sciences de A a Z

Requirements

Seulement une passion pour la réussite
Tous les logiciels utilisés dans ce cours sont disponibles gratuitement ou en démo

Description

Ce cours est la traduction française du cours de Data Sciences le plus vendu sur Udemy.
Extrêmement Utile…Incroyablement Pratique…Ultra Réaliste !
Il ne s’agit pas de l’un de ces cours utopiques où tout fonctionne parfaitement de manière irréaliste. Ce cours vous prépare au monde réel.
Dans ce cours vous allez vivre l’expérience réelle d’un Data Scientist, et cela inclut tous les moments difficiles qu’il peut ressentir dans son travail au quotidien: données corrompues, anomalies, irrégularités, tous les obstacles auxquels doit faire face le data scientist !
Ce cours va vous faire voyager dans le monde entier des Data Sciences. A l’issue de ce voyage, vous saurez:
Comment nettoyer et préparer vos données pour vos analysesComment bien visualiser vos donnéesComment créer des modèlesComment faire des prédictionsEt finalement, comment présenter vos découvertes et impressionner votre public

Ce cours va si bien vous préparer à la réalité du métier de Data Scientist que vous jonglerez avec vos divers projets de Data Science. Vous serez si bien entraînés et si bien formés que le monde réel sera pour vous un jeu d’enfant. Vous aurez des travaux à faire tout seul, si provocants et si challengings qu’ils vont vous mettre dans tous vos états… Mais vous n’abandonnerez pas ! Vous vaincrez !
Dans ce cours vous développerez une bonne maîtrise des outils suivants:
TableauSQLSSISGretl

Ce cours vous propose différentes approches préparées pour vous en fonction de vos besoins et objectifs. En utilisant ces approches, vous pouvez parcourir le cours et combiner les sections dans VOTRE PROPRE voyage qui va vous mener aux compétences dont VOUS avez besoin.
Ou bien sûr vous pouvez faire le cours en entier et vous former pour une incroyable carrière en Data Science.
Le choix est le votre. Rejoignez-nous dans ce voyage et commencez à apprendre dès aujourd’hui !
A très vite.
Bien à vous,
Kirill Eremenko & Hadelin de Ponteves

Overview

Section 1: Soyons enthousiastes !

Lecture 1 Bienvenue au cours Data Science A-Z

Section 2: Que sont les Data Sciences ?

Lecture 2 Intro (ce que vous allez apprendre dans cette section)

Lecture 3 Le job du futur

Lecture 4 Les domaines des Data Sciences

Lecture 5 Important: Approches du cours

Section 3: ————————— Partie 1: Visualisation —————————

Lecture 6 Bienvenue à la Partie 1

Section 4: Introduction à Tableau

Lecture 7 Intro (ce que vous allez apprendre dans cette section)

Lecture 8 Installer Tableau Desktop et Tableau Public

Lecture 9 Description du challenge et des données

Lecture 10 Connecter Tableau à un fichier CSV

Lecture 11 Naviguer dans Tableau – Mesures et Dimensions

Lecture 12 Créer un calculated field

Lecture 13 Ajouter des couleurs

Lecture 14 Ajouter des labels et changer le format

Lecture 15 Exporter votre worksheet

Lecture 16 Récapitulatif de la section

Section 5: Utiliser Tableau pour le Data Mining

Lecture 17 Intro (ce que vous allez apprendre dans cette section)

Lecture 18 Obtenir le Dataset

Lecture 19 Connecter Tableau à un fichier Excel

Lecture 20 Visualiser un A-B test dans Tableau

Lecture 21 Travailler avec les Aliases

Lecture 22 Ajouter une Reference Line

Lecture 23 Chercher des anomalies

Lecture 24 Une astuce pratique pour valider votre approche

Lecture 25 Récapitulatif de la section

Section 6: Data Mining avancé avec Tableau

Lecture 26 Intro (ce que vous allez apprendre dans cette section)

Lecture 27 Créer des bins et visualiser des distributions

Lecture 28 Créer un test de classification pour une variable numérique

Lecture 29 Combiner deux graphes et travailler avec dans Tableau

Lecture 30 Valider le Data Mining dans Tableau avec un test du khi-deux

Lecture 31 Test du khi-deux quand il y a plus de deux catégories

Lecture 32 Visualiser le solde et la distribution du salaire estimé

Lecture 33 Bonus: Test du khi-deux Partie 1 (Tutoriel de Stats)

Lecture 34 Bonus: Test du khi-deux Partie 2 (Tutoriel de Stats)

Lecture 35 Récapitulatif de la section

Section 7: —————————- Partie 2: Modélisation —————————-

Lecture 36 Bienvenue à la Partie 2

Section 8: Rappels de Statistiques

Lecture 37 Intro (ce que vous allez apprendre dans cette section)

Lecture 38 Types de variables: Catégorique vs Numérique

Lecture 39 Types de régressions

Lecture 40 Méthode des moindres carrés ordinaires

Lecture 41 R-squared

Lecture 42 Adjusted R-squared

Section 9: Régression Linéaire Simple

Lecture 43 Intro (ce que vous allez apprendre dans cette section)

Lecture 44 Introduction à Gretl

Lecture 45 Obtenir le dataset

Lecture 46 Importer les données et faire des statistiques descriptives

Lecture 47 Lire des outputs de Régression Linéaire Simple

Lecture 48 Tracer et analyser un graphe

Section 10: Régression Linéaire Multiple

Lecture 49 Intro (ce que vous allez apprendre dans cette section)

Lecture 50 Attention: les hypothèses de la Régression Linéaire Multiple

Lecture 51 Obtenir le dataset

Lecture 52 Les Dummy Variables

Lecture 53 Le piège des Dummy Variables

Lecture 54 Manières de construire un modèle: BACKWARD, FORWARD, STEPWISE

Lecture 55 Backward Elimination – Un peu de pratique

Lecture 56 Utiliser le Adjusted R-squared pour créer des modèles robustes

Lecture 57 Interpréter les coefficients de la Régression Linéraire Multiple

Lecture 58 Récapitulatif de la section

Section 11: Régression Logistique

Lecture 59 Intro (ce que vous allez apprendre dans cette section)

Lecture 60 Obtenir le dataset

Lecture 61 Problèmes Business de type Oui/Non

Lecture 62 L’intuition de la Régression Logistique

Lecture 63 Votre première Régression Logistique

Lecture 64 False Positives et False Negatives

Lecture 65 Matrice de Confusion

Lecture 66 Interpréter les coefficients de la Régression Logistique

Section 12: Construire un modèle robuste de segmentation géo-démographique

Lecture 67 Intro (ce que vous allez apprendre dans cette section)

Lecture 68 Obtenir le dataset

Lecture 69 Qu’est-ce que la segmentation géo-demographique ?

Lecture 70 Construisons le modèle – première itération

Lecture 71 Construisons le modèle – backward elimination: STEP-BY-STEP

Lecture 72 Transformer des variables indépendantes

Lecture 73 Créer des variables dérivées

Lecture 74 Vérifier la multi-colinéarité en utilisant VIF

Lecture 75 Matrice de Corrélation et Intuition de la multi-colinéarité

Lecture 76 Récapitulatif de la section

Section 13: Evaluer votre modèle

Lecture 77 Intro (ce que vous allez apprendre dans cette section)

Lecture 78 Le paradoxe de la précision

Lecture 79 Cumulative Accuracy Profile (CAP)

Lecture 80 Construire une courbe CAP avec Excel

Lecture 81 Evaluer le modèle en utilisant une courbe CAP

Lecture 82 Obtenir le template de courbe CAP

Lecture 83 Utiliser un test set pour empêcher l’overfitting

Lecture 84 Appliquer le modèle à un test set

Lecture 85 Comparer la performance sur le training set et le test set

Lecture 86 Récapitulatif de la section

Section 14: Tirer des insights de votre modèle

Lecture 87 Intro (ce que vous allez apprendre dans cette section)

Lecture 88 Des insights puissants tirés de votre courbe CAP

Lecture 89 Les coefficients de la Régression Logistique – Plan d’attaque (avancé)

Lecture 90 Le Odds Ratio (avancé)

Lecture 91 Odds Ratio vs Coefficients de la Régression Logistique (avancé)

Lecture 92 Tirer des insights des coefficients (avancé)

Lecture 93 Récapitulatif de la section

Section 15: Maintenir à jour votre modèle

Lecture 94 Intro (ce que vous allez apprendre dans cette section)

Lecture 95 A quoi ressemble la détérioration de modèle ?

Lecture 96 Pourquoi les modèles se détériorent-ils ?

Lecture 97 Trois niveaux de maintenance pour les modèles déployés

Lecture 98 Récapitulatif de la section

Section 16: ———————- Partie 3: Préparation des données ———————-

Lecture 99 Bienvenue à la partie 3

Section 17: Outils de Business Intelligence (BI)

Lecture 100 Intro (ce que vous allez apprendre dans cette section)

Lecture 101 Travailler avec les données

Lecture 102 Qu’est-ce que le Data Warehousing ? Qu’est-ce qu’une base de données (database)

Lecture 103 Installer Microsoft SQL Server 2014

Lecture 104 Créer une base de données test

Lecture 105 Qu’est-ce que le processus ETL (Extract Transform Load) ?

Lecture 106 Outils BI de Microsoft: Que sont SSDT-BI et SSIS/SSAS/SSRS ?

Lecture 107 Installer SSDT avec MSVS Shell

Section 18: ETL Phase 1: Data Wrangling avant l’upload

Lecture 108 Intro (ce que vous allez apprendre dans cette section)

Lecture 109 Préparer la structure de votre dossier pour votre projet de Data Science

Lecture 110 Obtenir le dataset pour cette section

Lecture 111 Deux choses que vous DEVEZ faire avant l’upload

Lecture 112 Notepad ++

Lecture 113 Editpad Lite

Section 19: ETL Phase 2: Procédure step by step d’upload des données dans SSIS

Lecture 114 Intro (ce que vous allez apprendre dans cette section)

Lecture 115 Créer un projet SSIS

Lecture 116 Préparer le dataflow

Lecture 117 Mettre en place la flat file source

Lecture 118 Mettre en place la OLE DB destination

Lecture 119 Exécuter l’upload

Lecture 120 Attention: contrôle de la qualité

Section 20: Gérer les erreurs pendant l’ETL (Phases 1 et 2)

Lecture 121 Intro (ce que vous allez apprendre dans cette section)

Lecture 122 Obtenir le dataset pour cette section

Lecture 123 Comment Excel peut mettre vos données en désordre

Lecture 124 Procédure à suivre pour le Data Wrangling avant l’upload

Lecture 125 Erreur de text qualifier dans SSIS

Lecture 126 Que faire quand votre fichier source est corrompu ? (Partie 1)

Lecture 127 Que faire quand votre fichier source est corrompu ? (Partie 2)

Lecture 128 Erreur de data truncation dans SSIS

Lecture 129 Astuce pratique pour trouver des anomalies en SQL

Lecture 130 Gestion automatique d’erreurs dans SSIS avec un Conditional Split

Lecture 131 Gestion automatique d’erreurs dans SSIS avec plusieurs Conditional Splits

Lecture 132 Analyser des fichiers d’erreur

Lecture 133 Attention: la chose que vous DEVEZ faire à chaque fois

Lecture 134 Les différents types d’erreurs dans SSIS

Lecture 135 Récapitulatif de la section

Lecture 136 Homework

Section 21: La programmation SQL pour les Data Sciences

Lecture 137 Intro (ce que vous allez apprendre dans cette section)

Lecture 138 Obtenir le dataset pour cette section

Lecture 139 Apprendre à connaître MS SQL Management Studio

Lecture 140 Raccourci pour uploader les données

Lecture 141 Utiliser SELECT * pour sélectionner les données

Lecture 142 Utiliser WHERE pour filtrer les données

Lecture 143 Utiliser des wildcards (% et _)

Lecture 144 Ajouter des commentaires

Lecture 145 Utiliser ORDER BY pour ordonner les données

Lecture 146 Les types de données

Lecture 147 La conversion implicite de type

Lecture 148 Utiliser Cast() vs Convert()

Lecture 149 Travailler avec les NULLs

Lecture 150 Comprendre comment fonctionnent les LEFT, RIGHT, INNER et OUTER Joins

Lecture 151 Les Joins avec des duplicates (valeurs dupliquées)

Lecture 152 Les Joins sur plusieurs colonnes

Lecture 153 Un peu de pratique avec les Joins

Section 22: ETL Phase 3: Data Wrangling après l’upload

Lecture 154 Intro (ce que vous allez apprendre dans cette section)

Lecture 155 Les trois types de tables: RAW table, WRK table, DRV table

Lecture 156 Obtenir le dataset pour cette section

Lecture 157 Créer une procédure stockée

Lecture 158 Exécuter une procédure stockée

Lecture 159 Modifier une procédure stockée

Lecture 160 Procédure stockée – Bloc CREATE TABLE

Lecture 161 Procédure stockée – Bloc INSERT INTO

Lecture 162 Procédure stockée – Blocs DROP TABLE et TRUNCATE TABLE

Lecture 163 Récapitulatif intermédiaire

Lecture 164 Créer la procédure stockée pour le second fichier source

Lecture 165 Ajouter des préfixes zéros

Lecture 166 Convertir des données à la main

Lecture 167 Créer un template de procédure stockée

Lecture 168 Archiver une procédure stockée

Lecture 169 Ce que vous pouvez faire après avec ces tables (DRV tables)

Section 23: Gérer les erreurs pendant l’ETL (Phase 3)

Lecture 170 Intro (ce que vous allez apprendre dans cette section)

Lecture 171 Obtenir le dataset pour cette section

Lecture 172 Uploader les données dans la RAW table

Lecture 173 Préparer la procédure stockée

Lecture 174 Gérer des erreurs en utilisant la fonction isnumeric()

Lecture 175 Gérer des erreurs en utilisant la fonction len()

Lecture 176 Gérer des erreurs en utilisant la fonction isdate()

Lecture 177 Vérifications supplémentaires pour le contrôle de la qualité – Balance

Lecture 178 Vérifications supplémentaires pour le contrôle de la qualité – Zipcode

Lecture 179 Vérifications supplémentaires pour le contrôle de la qualité – Birthday

Lecture 180 Partie 3 complétée

Lecture 181 Homework

Section 24: ————————— Partie 4: Communication —————————

Lecture 182 Bienvenue à la Partie 4

Section 25: Travailler avec des personnes

Lecture 183 Intro (ce que vous allez apprendre dans cette section)

Lecture 184 Travailler entre plusieurs départements

Lecture 185 Venez me voir avec un problème business

Lecture 186 Fixer les attentes avant de commencer le projet

Lecture 187 Allez vous asseoir avec eux

Lecture 188 L’art de dire “Non”

Lecture 189 Parfois vous devez aller au sommet

Lecture 190 Construire une culture de données

Section 26: Présenter ses résultats

Lecture 191 Intro (ce que vous allez apprendre dans cette section)

Lecture 192 Etude de cas

Lecture 193 Introduction de la présentation

Lecture 194 Analyse de l’introduction

Lecture 195 Les slides de la présentation – Pour que votre public dise “WOW”

Lecture 196 Ma méthode de brainstorming

Lecture 197 Comment faire une présentation à des directeurs

Lecture 198 La vérité n’est pas toujours belle

Lecture 199 La passion et le fameux “WOW”

Lecture 200 Bonus: ma présentation entière | LIVE 2015

Lecture 201 Bonus: liens vers d’autres exemples de storytelling

Section 27: Solutions des Homeworks

Lecture 202 Data Mining avancé avec Tableau – Visualiser Credit Score & Tenure

Lecture 203 Data Mining avancé avec Tableau – Test du khi-deux pour le pays

Lecture 204 Gérer les erreurs pendant l’ETL (Phases 1 et 2)

Lecture 205 Gérer les erreurs pendant l’ETL – “Vehicle Service” – Partie 1

Lecture 206 Gérer les erreurs pendant l’ETL – “Vehicle Service” – Partie 2

Lecture 207 Gérer les erreurs pendant l’ETL – “Vehicle Service” – Partie 3

Toute personne intéressée par les Data Sciences,Toute personne souhaitant améliorer ses compétences en data mining,Toute personne souhaitant améliorer ses compétences en modélisation statistique,Toute personne souhaitant améliorer ses compétences en préparation de données,Toute personne souhaitant améliorer ses compétences en communication et présentation

Course Information:

Udemy | Français | 19h 30m | 4.61 GB
Created by: Hadelin de Ponteves

You Can See More Courses in the Developer >> Greetings from CourseDown.com

New Courses

Scroll to Top