arrow_back

BigQuery を使用して NCAA Data を調べる

参加 ログイン
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

BigQuery を使用して NCAA Data を調べる

Lab 45分 universal_currency_alt No cost show_chart 入門
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP160

Google Cloud セルフペース ラボ

概要

BigQuery は、Google が低料金で提供する NoOps のフルマネージド分析データベースです。BigQuery を使用すると、インフラストラクチャを管理したりデータベース管理者を配置したりすることなく、テラバイト単位の大規模なデータをクエリできます。また、BigQuery では SQL が採用されており、従量課金制モデルでご利用いただけます。このような特長を活かし、お客様は有用な情報を得るためのデータ分析に専念できます。

NCAA バスケットボールの試合、チーム、選手のデータセットを新たに利用できるようになりました。試合データには、2009 年以降のプレイバイプレイとボックススコア、1996 年以降の最終スコアが含まれます。一部のチームについては、1994~1995 年シーズン以降の勝敗に関するデータも追加されています。

このラボでは、BigQuery を使って NCAA データセットを探し、クエリします。

ラボの内容

  • BigQuery の使用
  • NCAA 一般公開データセットに対するクエリ
  • クエリの作成と実行

必要なもの

  • Google Cloud プロジェクト
  • ChromeFirefox などのブラウザ

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの手順をお読みください。ラボの時間は記録されており、一時停止することはできません。[ラボを開始] をクリックするとスタートするタイマーは、Google Cloud のリソースを利用できる時間を示しています。

このハンズオンラボでは、シミュレーションやデモ環境ではなく、実際のクラウド環境を使ってご自身でラボのアクティビティを行うことができます。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。
  • ラボを完了するために十分な時間を確保してください。ラボをいったん開始すると一時停止することはできません。
注: すでに個人の Google Cloud アカウントやプロジェクトをお持ちの場合でも、このラボでは使用しないでください。アカウントへの追加料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

  1. [ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるポップアップでお支払い方法を選択してください。 左側の [ラボの詳細] パネルには、以下が表示されます。

    • [Google コンソールを開く] ボタン
    • 残り時間
    • このラボで使用する必要がある一時的な認証情報
    • このラボを行うために必要なその他の情報(ある場合)
  2. [Google コンソールを開く] をクリックします。 ラボでリソースが起動し、別のタブで [ログイン] ページが表示されます。

    ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。

    注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
  3. 必要に応じて、[ラボの詳細] パネルから [ユーザー名] をコピーして [ログイン] ダイアログに貼り付けます。[次へ] をクリックします。

  4. [ラボの詳細] パネルから [パスワード] をコピーして [ようこそ] ダイアログに貼り付けます。[次へ] をクリックします。

    重要: 認証情報は左側のパネルに表示されたものを使用してください。Google Cloud Skills Boost の認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
  5. その後次のように進みます。

    • 利用規約に同意してください。
    • 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
    • 無料トライアルには登録しないでください。

その後このタブで Cloud Console が開きます。

注: 左上にある [ナビゲーション メニュー] をクリックすると、Google Cloud のプロダクトやサービスのリストが含まれるメニューが表示されます。 ナビゲーション メニュー アイコン

BigQuery コンソールを開く

  1. Google Cloud コンソールで、ナビゲーション メニュー > [BigQuery] を選択します。

[Cloud コンソールの BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスには、クイックスタート ガイドとリリースノートへのリンクが表示されます。

  1. [完了] をクリックします。

BigQuery コンソールが開きます。

BigQuery が開きますが、まだ何もありません。しかし BigQuery にはクエリできる数多くの一般公開データセットがありますし、この後に行うように、自分で独自のデータをアップロードすることもできます。

タスク 1. NCAA 一般公開データセットを BigQuery で見つける

このセクションでは、一般公開データを pull して、BigQuery で SQL コマンドを実行してみます。

  1. [+ 追加] をクリックし、[公開データセット] を選択します。

[データを追加] プルダウン メニューが展開され、[一般公開データセットを調べる] オプションがハイライト表示されている

  1. 検索バーに「ncaa basketball」と入力して Enter キーを押します。

  2. [NCAA Basketball] のタイル、[データセットを表示] の順にクリックします。

: 新しいブラウザタブが開き、bigquery-public-data という新しいプロジェクトが [エクスプローラ] パネルに追加され、ncaa_basketball が表示されます。

データセット情報

  1. bigquery-public-data が [エクスプローラ] パネルに表示されない場合は、[+ 追加] をクリックし、[名前を指定してプロジェクトにスターを付ける] を選択します。

  2. bigquery-public-data」と入力して [スターを付ける] をクリックします。

  3. [bigquery-public-data] > [ncaa_basketball] をクリックして、探索するテーブルを表示します。

ncaa_basketball データセットがハイライト表示され、データセットの下にさまざまなテーブルがリストされている [エクスプローラ] パネル

  1. [mbb_games_sr](男子 NCAA 試合結果テーブル)をクリックし、[プレビュー] タブをクリックすると、データのサンプル列が表示されます。[詳細] タブをクリックすると、そのテーブルに関するメタデータが表示されます。

  2. [詳細] タブをクリックすると、そのテーブルに関するメタデータが表示されます。

テーブル情報

質問: このデータセットには何試合分のデータが含まれますか。このテーブルの大きさはどのくらいですか。

答え: テーブルは約 50 MB で、29,000 試合以上を探索できます。

質問: 分析できる個別のプレイはいくつありますか。

ヒント:

  • [mbb_pbp_sr](プレイバイプレイ)データセットをクリックします。

[ncaa_dataset] の [mbb_pbp_sr] テーブルがハイライト表示されている

  • 次に、[詳細] をクリックします。

mbb_pbr_sr の詳細

答え: 400 万を超える個別のバスケットボール プレイがあります。

では SQL を記述し、どのようなタイプのプレイを探索できるか確かめましょう。

タスク 2. クエリを記述する

どのようなタイプのバスケットボールのプレイがありますか。

  1. [+](クエリを新規作成)アイコンをクリックします。

  2. 以下のクエリをコピーして、エディタに貼り付けます。

# 標準 SQL SELECT event_type, COUNT(*) AS event_count FROM `bigquery-public-data.ncaa_basketball.mbb_pbp_sr` GROUP BY 1 ORDER BY event_count DESC;
  1. [実行] をクリックします。

結果から、過去のショットのうちいくつが TWOPOINTMADE か FREETHROWMISS だったか確認しましょう。

行、event_type、event_count の列が含まれたクエリ結果のテーブル。行 4 と行 11 のデータがハイライト表示される

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

クエリを記述する

タスク 3. 楽しいクエリ

スリーポイント ショットが最も多く成功した 5 試合はどれですか。また、それらの成功率はどうでしたか。

  1. [+](クエリを新規作成)アイコンをクリックして、次のクエリを追加します。
# 標準 SQL # スリーポイントが最も多く成功した試合 SELECT scheduled_date, name, market, alias, three_points_att, three_points_made, three_points_pct, opp_name, opp_market, opp_alias, opp_three_points_att, opp_three_points_made, opp_three_points_pct, (three_points_made + opp_three_points_made) AS total_threes FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` WHERE season > 2010 ORDER BY total_threes DESC LIMIT 5;
  1. [実行] をクリックします。

クエリ結果の表

結果を確認しましょう。Tigers は 2016 年 11 月 22 日にスリーポイント ショットが 50% も成功したのですね。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

クエリ 1

収容人数が上位 5 番目までのバスケットボールの競技場はどこですか。

  1. [+](クエリを新規作成)アイコンをクリックして、次のクエリを追加します。
# 標準 SQL SELECT venue_name, venue_capacity, venue_city, venue_state FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` GROUP BY 1,2,3,4 ORDER BY venue_capacity DESC LIMIT 5;
  1. [実行] をクリックします。

クエリ結果の表

80,000 人が見守る中でのショット、一体どんな気分でしょう。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

クエリ 2

2010 年以降に最高スコアを記録した試合はどのチームの対戦だったでしょうか。

  1. [+](クエリを新規作成)アイコンをクリックして、次のクエリを追加します。
# 標準SQL # 最高スコアを記録した試合 SELECT scheduled_date, name, market, alias, points_game AS team_points, opp_name, opp_market, opp_alias, opp_points_game AS opposing_team_points, points_game + opp_points_game AS point_total FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` WHERE season > 2010 ORDER BY point_total DESC LIMIT 5;
  1. [実行] をクリックします。

クエリ結果の表

Bulldogs と Terriers の試合で合計 258 点入りました。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

クエリ 3

2015 年以降のナショナル チャンピオンシップで、最終スコアの差は最大でどれだけですか。

  1. [+](クエリを新規作成)アイコンをクリックして、次のクエリを追加します。
# 標準 SQL # チャンピオンシップの試合で最大の点差 SELECT scheduled_date, name, market, alias, points_game AS team_points, opp_name, opp_market, opp_alias, opp_points_game AS opposing_team_points, ABS(points_game - opp_points_game) AS point_difference FROM `bigquery-public-data.ncaa_basketball.mbb_teams_games_sr` WHERE season > 2015 AND tournament_type = 'National Championship' ORDER BY point_difference DESC LIMIT 5;
  1. [実行] をクリックします。

クエリ結果の表

意外と接戦だったことがわかります。最大の差は 2018 年の 17 点差でした。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。

クエリ 4

お疲れさまでした

BigQuery 内の NCAA バスケットボール データセットをクエリする方法を学習しました。理解を深めるために、ぜひ上記のクエリを変更して独自のクエリを記述してみてください。NCAA クエリの演習をお探しの場合は、こちらの GitHub リポジトリをご覧ください。

クエストを完了する

Google Cloud Solutions ll: Data and Machine LearningNCAA® March Madness®: Bracketology with Google Cloud に進んでクエストを続けてください。クエストとは学習プログラムを構成する一連のラボのことで、完了すると成果が認められて上のようなバッジが贈られます。バッジは公開して、オンライン レジュメやソーシャル メディア アカウントにリンクできます。このラボの修了後、このラボが含まれるクエストに登録すれば、すぐにクレジットを受け取ることができます。受講可能なすべてのクエストについては、Google Cloud Skills Boost カタログをご覧ください。

次のラボを受講する

次のステップと詳細情報

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2023 年 10 月 17 日

ラボの最終テスト日: 2023 年 10 月 17 日

Copyright 2024 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。