Partager sur votre flux LinkedIn Twitter Facebook

Building Batch Data Pipelines on Google Cloud - Français

Building Batch Data Pipelines on Google Cloud - Français

magic_button Cloud Dataproc Data Pipeline ETL
These skills were generated by A.I. Do you agree this course teaches these skills?
24 heures Débutant universal_currency_alt 15 crédits

Les pipelines de données s'inscrivent généralement dans le paradigme EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours vous indiquera quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il vous présentera également plusieurs solutions Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.

Terminez cette activité et gagnez un badge ! Boostez votre carrière dans le cloud en montrant les compétences que vous avez acquises.

Badge pour Building Batch Data Pipelines on Google Cloud - Français
info
Informations sur le cours
Objectifs
  • Explorer différentes méthodes de chargement de données (EL, ELT et ETL) et déterminer quand les utiliser
  • Exécuter Hadoop sur Dataproc, exploiter Cloud Storage et optimiser les tâches Dataproc
  • Utiliser Dataflow pour créer vos pipelines de traitement de données
  • Gérer des pipelines de données avec Data Fusion et Cloud Composer
Prérequis
Pour pouvoir bénéficier de ce cours, les participants doivent avoir suivi la formation "Google Cloud Big Data and Machine Learning Fundamentals" ou disposer d'une expérience équivalente. Ils doivent également : • posséder des compétences de base dans un langage de requête courant tel que SQL ; • avoir de l'expérience en modélisation de données et maîtriser les opérations d'extraction, de transformation et de chargement (ETL) ; • avoir de l'expérience en développement d'applications dans un langage de programmation courant tel que Python ; • connaître les concepts de base du machine learning et/ou des statistiques.
Cible
Développeurs responsables de la conception de pipelines et d'architectures pour le traitement de données
Langues disponibles
English, español (Latinoamérica), 日本語, français et português (Brasil)
Que faire après avoir terminé ce cours ?
Après avoir terminé ce cours, vous pouvez consulter des contenus supplémentaires de votre parcours de formation ou parcourir le catalogue de formations.
Quels badges pouvez-vous gagner ?
Lorsque vous terminez un cours, vous obtenez un badge de réussite. Vos badges s'affichent sur votre profil, et vous pouvez les partager sur les réseaux sociaux.
Vous souhaitez suivre ce cours à la demande avec l'un de nos partenaires ?
Consultez les contenus Google Cloud disponibles sur Coursera et Pluralsight.
Vous préférez suivre un cours animé par un formateur ?
Aperçu