Machine Learning sous Python et R

groupe-personnes-diverses-ayant-reunion-affaires

Objectifs

Utiliser R et Python dans le cadre de modèles d’apprentissage et de fonctions algorithmiques

Pré-requis

Bonnes bases de statistiques et de data mining

La formation en détail

Les sessions de formation ont lieu de 9h00 à 12h30 et de 13h30 à 17h00

Généralités

  • Présentation et installation du logiciel R
  • GUIs et IDEs
  • Prise en main et premiers pas
  • Fonctions et packages
  • Utilisation des aides

Rappel des concepts de base du Data Mining

  • Introduction à R – Concepts de base
  • Syntaxe
  • Type de données
  • Import/Export de données
  • Manipulation des librairies

Manipulation des données

  • Rappels des grandeurs statistiques de bases
  • Calcul des grandeurs statistiques de bases avec R
  • Aperçu des types de visualisation courants en Data Mining
  • Fonctions et librairies de base de visualisation avec R

Data Preprocessing

  • Data Cleaning
  • Data Reduction (analyse en composantes principales)
  • Data Preprocessing et ACP avec R

Règles d’association

  • Rappels théoriques de l’algorithme Apriori
  • Application et exploitation des règles d’association avec R

Classification et régression

  • Règles bayésiennes naïves
  • Rappels théoriques
  • Initiation à la librairie “e1071” de R
  • Arbre de décision CART
  • Rappels théoriques
  • Initiation à la librarie “party” de R
  • Arbre de décision RandomForest
  • Rappels théoriques
  • Initiation à la librairie “randomForest” de R
  • Régression linéaire
  • Rappels théoriques
  • Initiation à la fonction lm() de R

Clustering

  • Centroid-based clustering
  • Algorithme du K-means
  • Fonction kmeans de R
  • Hierarchical clustering
  • Concepts théoriques
  • Fonction hclust de R
  • Density-based clustering
  • Concepts théoriques
  • Application dans R

Outils de support à R

  • Data preprocessing avec Dataiku
  • Utilisation de R dans Dataiku
  • Réflexion de groupe et apports théoriques du formateur.
  • Travail d’échange avec les apprenants sous forme de réunion – discussion.
  • Utilisation de cas concrets issus de l’expérience professionnelle.
  • Validation des acquis par des questionnaires, des tests d’évaluation, des mises en situation et des jeux pédagogiques.
  • Alternance entre apports théoriques et exercices pratiques (en moyenne sur 30 à 50% du temps)

Cette formation s’adresse au profil métier orienté Data Scientist

En formation présentielle

Accueil des apprenants dans une salle dédiée à la formation et équipée avec :

  • Ordinateurs
  • Vidéo projecteur ou Écran TV interactif
  • Tableau blanc ou Paper-Board

En formation distancielle

A l’aide d’un logiciel comme ® Microsoft Teams ou Zoom, un micro et une caméra pour l’apprenant.

  • Suivez une formation en temps réel et entièrement à distance. Lors de la session en ligne, les apprenants interagissent et communiquent entre eux et avec le formateur.
  • Les formations en distanciel sont organisées en Inter-Entreprise comme en Intra-Entreprise.
  • L’accès à l’environnement d’apprentissage (support de cours, ressources formateur, fichiers d’exercices …) ainsi qu’aux preuves de suivi et d’assiduité (émargement, évaluation) est assuré.
  • Les participants recevront une convocation avec le lien de connexion à la session de formation.
  • Pour toute question avant et pendant le parcours, une assistance technique et pédagogique est à disposition par téléphone au 02 35 12 25 55 ou par email à commercial@xxlformation.com
  • Positionnement préalable oral ou écrit.
  • Feuille de présence signée en demi-journée.
  • Evaluation des acquis tout au long de la formation.
  • Questionnaire de satisfaction
  • Attestation de stage à chaque apprenant
  • Evaluation formative tout au long de la formation.
  • Evaluation sommative faite par le formateur.
  • Nos formateurs sont des experts dans leurs domaines d’intervention
  • Leur expérience de terrain et leurs qualités pédagogiques constituent un gage de qualité

Inscription

Inter
Intra
Sur Mesure
Durée :
4 jours
Tarif :
750 € - Prix jour / personne
Référence :
4-PY-MLPR

Prochaines sessions

Inscription