openKampus

Ce que vous apprendrez ?


Prérequis

  • Connaissance des bases de Python Notions en manipulation de données avec Pandas Familiarité avec SQL pour l’interrogation de données

Contenu de la Formation

Total: 12 Chapitres Total hours: 8
  • Introduction au BigData
  • Différences clés entre Hadoop et Spark
  • Manipulation des RDD
  • Chargement et distibution de données avec PySpark
  • Nettoyage et transformation de données avec PySpark
  • Création des pipelines
  • Analyse de données avec PySpark
  • Création et manipulation des dataframes
  • Requêtes SparkSQL
  • SparkContext et StreamingContext
  • Création et manipulation de DStream
  • Communication avec des applications externes

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
ENNANIA

adil.ennania@openskillroom.com

Expérience en enseignement depuis 2006, à l'ISTA, MEN, Faculté Ben M'sik, Faculté de Khouribga et l'Académie Mohamed V de l'Aviation Civile,

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 8 hour
  • Language Français
  • Niveau de compétence. Débutant
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenKampus, la plateforme de formations synchrones qui valorise votre expertise.