arrow_back

Explorar dados da NCAA com o BigQuery

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Explorar dados da NCAA com o BigQuery

Lab 45 minutos universal_currency_alt No cost show_chart Introdutório
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP160

Laboratórios autoguiados do Google Cloud

Visão geral

O BigQuery é um banco de dados de análise NoOps, totalmente gerenciado e de baixo custo desenvolvido pelo Google. Com o BigQuery, é possível consultar vários terabytes de dados sem gerenciar infraestrutura e sem precisar de um administrador de banco de dados. O BigQuery usa SQL e está disponível no modelo de pagamento por utilização. Assim, você pode se concentrar na análise dos dados para encontrar informações relevantes.

Um conjunto de dados de partidas, times e jogadores de basquete da NCAA foi disponibilizado recentemente. Os dados de partidas incluem informações de cada jogada e tabelas de pontos desde 2009, além de placares finais desde 1996. Outros dados sobre vitórias e derrotas remontam à temporada de 1894-1895 no caso de alguns times.

Neste laboratório, você vai consultar o conjunto de dados da NCAA usando o BigQuery.

O que você vai aprender

  • Usar o BigQuery
  • Consultar o conjunto de dados públicos da NCAA
  • Gravar e exportar consultas

Pré-requisitos

  • Um projeto do Google Cloud
  • Um navegador, como o Chrome ou o Firefox

Configuração e requisitos

Antes de clicar no botão Start Lab

Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é iniciado quando você clica em Começar o laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório---não se esqueça: depois de começar, não será possível pausar o laboratório.
Observação: não use seu projeto ou conta do Google Cloud neste laboratório para evitar cobranças extras na sua conta.

Como iniciar seu laboratório e fazer login no console do Google Cloud

  1. Clique no botão Começar o laboratório. Se for preciso pagar, você verá um pop-up para selecionar a forma de pagamento. No painel Detalhes do laboratório à esquerda, você verá o seguinte:

    • O botão Abrir Console do Cloud
    • Tempo restante
    • As credenciais temporárias que você vai usar neste laboratório
    • Outras informações se forem necessárias
  2. Clique em Abrir Console do Google. O laboratório ativa recursos e depois abre outra guia com a página Fazer login.

    Dica: coloque as guias em janelas separadas lado a lado.

    Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
  3. Caso seja preciso, copie o Nome de usuário no painel Detalhes do laboratório e cole esse nome na caixa de diálogo Fazer login. Clique em Avançar.

  4. Copie a Senha no painel Detalhes do laboratório e a cole na caixa de diálogo Olá. Clique em Avançar.

    Importante: você precisa usar as credenciais do painel à esquerda. Não use suas credenciais do Google Cloud Ensina. Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
  5. Acesse as próximas páginas:

    • Aceite os Termos e Condições.
    • Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
    • Não se inscreva em testes gratuitos.

Depois de alguns instantes, o console do GCP vai ser aberto nesta guia.

Observação: para ver uma lista dos produtos e serviços do Google Cloud, clique no Menu de navegação no canto superior esquerdo. Ícone do menu de navegação

Abrir o console do BigQuery

  1. No Console do Google Cloud, selecione o menu de navegação > BigQuery:

Você verá a caixa de mensagem Olá! Este é o BigQuery no Console do Cloud. Ela tem um link para o guia de início rápido e as notas de versão.

  1. Clique em OK.

O console do BigQuery vai abrir.

O BigQuery abre, mas nenhum dado aparece. Felizmente, o BigQuery tem inúmeros conjuntos de dados abertos para você consultar. Também é possível fazer upload dos seus dados, e você vai concluir essa etapa na próxima seção.

Tarefa 1: localize o conjunto de dados público da NCAA no BigQuery

Nesta seção, você vai extrair alguns dados públicos para poder praticar a execução de comandos SQL no BigQuery.

  1. Clique em + ADICIONAR e selecione Conjuntos de dados públicos:

Menu suspenso "Adicionar dados" expandido com a opção de analisar conjuntos de dados públicos destacada

  1. Digite ncaa basketball na barra de pesquisa e pressione Enter.

  2. Clique no bloco NCAA Basketball e depois em Ver conjunto de dados.

Observação: uma nova guia abre no navegador. Agora, um novo projeto chamado bigquery-public-data foi adicionado ao painel "Explorador" aberto em ncaa_basketball

DatasetInfo

  1. Se bigquery-public-data não estiver presente no painel "Explorador", clique em + ADICIONAR e selecione Marcar um projeto com estrela por nome.

  2. Digite bigquery-public-data e clique em MARCAR COM ESTRELA.

  3. Clique em bigquery-public-data > ncaa basketball para visualizar as tabelas que podem ser analisadas.

Painel "Explorador" com o conjunto de dados ncaa_basketball destacado e várias tabelas listadas abaixo dele

  1. Clique em mbb_games_sr (tabela de resultados de jogos masculinos da NCAA) e na guia Visualizar para conferir as linhas de amostra de dados. Clique na guia Detalhes para encontrar metadados sobre a tabela.

  2. Clique na guia Detalhes para encontrar metadados sobre a tabela.

TableInfo

Pergunta: quantos jogos o conjunto de dados tem? Qual é o tamanho da tabela?

Resposta: a tabela tem cerca de 50 MB e mais de 29 mil jogos.

Pergunta: quantas jogadas individuais podemos analisar?

Dica:

  • Clique no conjunto de dados (lance a lance) mbb_pbp_sr.

Conjunto de dados NCAA com a tabela mbb_pbp_sr destacada

  • Depois, clique em Detalhes.

mbb_pbr_sr_Details

Resposta: mais de quatro milhões.

Vamos escrever códigos em SQL para saber que tipo de jogadas podemos analisar.

Tarefa 2: crie consultas

Quais tipos de jogos de basquete estão disponíveis?

  1. Clique no ícone + (Criar nova consulta).

  2. Copie e cole a consulta abaixo no editor:

#standardSQL SELECT event_type, COUNT(*) AS event_count FROM `bigquery-public-data.ncaa_basketball.mbb_pbp_sr` GROUP BY 1 ORDER BY event_count DESC;
  1. Clique em Executar.

Segundo os resultados, quantos arremessos históricos foram TWOPOINTMADE ou FREETHROWMISS?

Tabela de resultados da consulta com colunas de linha, event_type e event_count. Os dados nas linhas 4 e 11 estão destacados

Clique em Verificar meu progresso para conferir o objetivo.

Crie consultas

Tarefa 3: execute consultas divertidas

Quais foram os cinco jogos com o maior número de arremessos de três pontos? Qual é a precisão das tentativas?

  1. Clique no ícone + (Criar nova consulta) e adicione a consulta abaixo:
#standardSQL #most three points made SELECT scheduled_date, name, market, alias, three_points_att, three_points_made, three_points_pct, opp_name, opp_market, opp_alias, opp_three_points_att, opp_three_points_made, opp_three_points_pct, (three_points_made + opp_three_points_made) AS total_threes FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` WHERE season > 2010 ORDER BY total_threes DESC LIMIT 5;
  1. Clique em Executar.

Tabela de resultados da consulta

Uau! Os Tigers acertaram mais de 50% dos arremessos de três pontos em 22 de novembro de 2016.

Clique em Verificar meu progresso para conferir o objetivo.

Consulta 1

Quais são os cinco estádios de basquete que comportam a maior quantidade de público?

  1. Clique no ícone + (Criar nova consulta) e adicione a consulta abaixo:
#standardSQL SELECT venue_name, venue_capacity, venue_city, venue_state FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` GROUP BY 1,2,3,4 ORDER BY venue_capacity DESC LIMIT 5;
  1. Clique em Executar.

Tabela de resultados da consulta

Imagine que você está fazendo um arremesso diante de um público de 80 mil pessoas.

Clique em Verificar meu progresso para conferir o objetivo.

Consulta 2

Quais times participaram do jogo que teve a pontuação mais alta desde 2010?

  1. Clique no ícone + (Criar nova consulta) e adicione a consulta abaixo:
#standardSQL #highest scoring game of all time SELECT scheduled_date, name, market, alias, points_game AS team_points, opp_name, opp_market, opp_alias, opp_points_game AS opposing_team_points, points_game + opp_points_game AS point_total FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` WHERE season > 2010 ORDER BY point_total DESC LIMIT 5;
  1. Clique em Executar.

Tabela de resultados da consulta

Os Bulldogs e os Terriers participaram de um jogo que teve 258 pontos no total.

Clique em Verificar meu progresso para conferir o objetivo.

Consulta 3

Qual foi a maior diferença na pontuação da final de um campeonato nacional desde 2015?

  1. Clique no ícone + (Criar nova consulta) e adicione a consulta abaixo:
#standardSQL #biggest point difference in a championship game SELECT scheduled_date, name, market, alias, points_game AS team_points, opp_name, opp_market, opp_alias, opp_points_game AS opposing_team_points, ABS(points_game - opp_points_game) AS point_difference FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` WHERE season > 2015 AND tournament_type = 'National Championship' ORDER BY point_difference DESC LIMIT 5;
  1. Clique em Executar.

Tabela de resultados da consulta

Os resultados das finais são bem semelhantes. A maior diferença foi de 17 pontos, em 2018.

Clique em Verificar meu progresso para conferir o objetivo.

Consulta 4

Parabéns!

Você aprendeu a consultar o conjunto de dados de basquete da NCAA dentro do BigQuery. Agora você pode modificar e criar consultas para praticar o que aprendeu. Quer treinar com mais consultas sobre a NCAA? Confira o repositório do GitHub aqui.

Termine a Quest

Continue sua Quest com Google Cloud Solutions ll: Data and Machine Learning ou NCAA® March Madness®: Bracketology with Google Cloud. Uma Quest é uma série de laboratórios relacionados que formam um programa de aprendizado. Ao concluir uma Quest, você ganha um selo como reconhecimento da sua conquista. É possível publicar os selos e incluir um link para eles no seu currículo on-line ou nas redes sociais. Inscreva-se em qualquer Quest que tenha este laboratório para receber os créditos de conclusão na mesma hora. Confira o catálogo do Google Cloud Ensina para ver todas as Quests disponíveis.

Comece o próximo laboratório

Próximas etapas / Saiba mais

Treinamento e certificação do Google Cloud

Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.

Manual atualizado em 17 de outubro de 2023

Laboratório testado em 17 de outubro de 2023

Copyright 2024 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.