Compartilhar no feed do LinkedIn Twitter Facebook

Building Batch Data Pipelines on Google Cloud - Português Brasileiro

Building Batch Data Pipelines on Google Cloud - Português Brasileiro

magic_button Cloud Dataproc Data Pipeline ETL
These skills were generated by A.I. Do you agree this course teaches these skills?
24 horas Introdutório universal_currency_alt 15 créditos

Os pipelines de dados geralmente se encaixam em um dos três paradigmas: extração-carregamento, extração-carregamento-transformação ou extração-transformação-carregamento. Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.

Conclua esta atividade e ganhe um selo. Impulsione sua carreira na nuvem divulgando as habilidades que você aprendeu.

Selo para Building Batch Data Pipelines on Google Cloud - Português Brasileiro
info
Informações sobre o curso
Objetivos
  • Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)
  • Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc
  • Usar o Dataflow para criar pipelines de processamento de dados
  • Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer
Pré-requisitos
Para aproveitar ao máximo este curso, os participantes devem ter concluído o "Google Cloud: Big Data and Machine Learning Fundamentals" ou ter experiência equivalente. O participante também deve ter: • proficiência básica em linguagem de consulta comum, como SQL; • experiência com atividades de modelagem de dados e ETL (extração, transformação e carregamento); • experiência com desenvolvimento de aplicativos usando uma linguagem de programação comum, como Python; • conhecimento sobre machine learning e/ou estatística.
Público-alvo
Desenvolvedores responsáveis por projetar pipelines e arquiteturas para processamento de dados.
Idiomas disponíveis
English, español (Latinoamérica), 日本語, français, and português (Brasil)
O que eu faço quando terminar o curso?
Ao final do curso, você pode navegar pelo conteúdo complementar do programa de aprendizado ou conferir nosso catálogo.
Quais selos eu posso ganhar?
Ao terminar um curso, você receberá um selo de conclusão. Os selos são exibidos no seu perfil e podem ser compartilhados nas suas redes sociais.
Tem interesse em participar desse curso com um dos nossos parceiros?
Confira o conteúdo do Google Cloud no Coursera e no Pluralsight.
Prefere aprender com um instrutor?
Visualizar