arrow_back

Alquila una VM para procesar datos de terremotos

Unirse Acceder
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Alquila una VM para procesar datos de terremotos

Lab 40 minutos universal_currency_alt 1 crédito show_chart Introductorio
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP008

Labs de autoaprendizaje de Google Cloud

Descripción general

Si utilizas Google Cloud para configurar una máquina virtual que te permita procesar datos de terremotos, podrás librarte de las operaciones de TI secundarias para enfocarte en tus objetivos científicos. Así, serás capaz de transferir datos, procesarlos y luego presentar los resultados en varios formatos. En este lab, transferirás los datos de terremotos en tiempo real que publica el Servicio Geológico de los Estados Unidos (USGS) y crearás mapas similares al que se muestra en la siguiente imagen:

Mapa mundial en el que se muestran indicadores de sismos

En este lab, iniciarás una máquina virtual, accederás a ella de manera remota y, luego, crearás de forma manual una canalización para recuperar, procesar y publicar los datos.

Qué aprenderás

En este lab, aprenderás a realizar las siguientes tareas:

  • Crear una instancia de Compute Engine con permisos de seguridad específicos
  • Establecer una conexión SSH a la instancia
  • Instalar el paquete de software Git (para controlar versiones del código fuente)
  • Transferir datos a la instancia de Compute Engine
  • Transformar datos en la instancia de Compute Engine
  • Almacenar los datos transformados en Cloud Storage
  • Publicar los datos de Cloud Storage en la Web

Configuración

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs son cronometrados y no se pueden pausar. El cronómetro, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar (se recomienda el navegador Chrome)
Nota: Usa una ventana de navegador privada o de Incógnito para ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab: Recuerda que, una vez que comienzas un lab, no puedes pausarlo.
Nota: Si ya tienes un proyecto o una cuenta personal de Google Cloud, no los uses en este lab para evitar cargos adicionales en tu cuenta.

Cómo iniciar su lab y acceder a la consola de Google Cloud

  1. Haga clic en el botón Comenzar lab. Si debe pagar por el lab, se abrirá una ventana emergente para que seleccione su forma de pago. A la izquierda, se encuentra el panel Detalles del lab que tiene estos elementos:

    • El botón Abrir la consola de Google
    • Tiempo restante
    • Las credenciales temporales que debe usar para el lab
    • Otra información para completar el lab, si es necesaria
  2. Haga clic en Abrir la consola de Google. El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.

    Sugerencia: Ordene las pestañas en ventanas separadas, una junto a la otra.

    Nota: Si ve el diálogo Elegir una cuenta, haga clic en Usar otra cuenta.
  3. Si es necesario, copie el nombre de usuario del panel Detalles del lab y péguelo en el cuadro de diálogo Acceder. Haga clic en Siguiente.

  4. Copie la contraseña del panel Detalles del lab y péguela en el cuadro de diálogo de bienvenida. Haga clic en Siguiente.

    Importante: Debe usar las credenciales del panel de la izquierda. No use sus credenciales de Google Cloud Skills Boost. Nota: Usar su propia Cuenta de Google podría generar cargos adicionales.
  5. Haga clic para avanzar por las páginas siguientes:

    • Acepte los términos y condiciones.
    • No agregue opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
    • No se registre para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Cloud en esta pestaña.

Nota: Para ver el menú con una lista de los productos y servicios de Google Cloud, haga clic en el Menú de navegación que se encuentra en la parte superior izquierda de la pantalla. Ícono del menú de navegación

Tarea 1. Crea una instancia de Compute Engine con el acceso necesario a la API

  1. Para crear una instancia de Compute Engine, ve a Menú de navegación y haz clic en Compute Engine > Instancias de VM:

  2. Haz clic en Crear y espera a que se cargue el formulario “Crear una instancia”:

  3. Usa la región y zona predeterminadas para crear la instancia:

  4. En la sección Disco de arranque, haz clic en Cambiar.

  5. Cambia la Versión a Debian GNU/Linux 10 (buster).

  6. Deja los otros parámetros de configuración tal como están y haz clic en Seleccionar.

  7. Cambia la información de Identidad y acceso a la API de la cuenta de servicio predeterminada de Compute Engine a Permitir el acceso total a todas las APIs de Cloud y, luego, haz clic en Crear.

Verás un círculo verde con una marca de verificación cuando se cree la instancia.

Haz clic en Revisar mi progreso a continuación para verificar que estás avanzando en este lab.

Crear una instancia de Compute Engine con el acceso necesario a la API

Tarea 2. Establece una conexión SSH a la instancia

Puedes acceder a tu instancia de Compute Engine de forma remota mediante Secure Shell (SSH):

  1. Haz clic en el botón SSH junto a la VM que acabas de crear:

Se muestran los detalles de la instancia de VM.

Nota: Asegúrate de que tu navegador no bloquee las ventanas emergentes.

Las claves SSH se transfieren de forma automática. No se requiere software adicional para establecer una conexión SSH directamente desde el navegador.

  1. Para obtener más información sobre la instancia de Compute Engine, ingresa lo siguiente en la línea de comandos:
cat /proc/cpuinfo

Deberías ver un resultado similar al siguiente:

processor : 0 vendor_id : GenuineIntel cpu family : 6 model : 63 model name : Intel(R) Xeon(R) CPU @ 2.30GHz ....

Tarea 3. Instala el software

  1. En la ventana de SSH, ingresa los siguientes comandos:
sudo apt-get update sudo apt-get -y -qq install git sudo apt-get install python-mpltoolkits.basemap
  1. Ingresa Y cuando se te pregunte si se puede utilizar más espacio del disco.

  2. Comprueba que se haya instalado Git:

git --version

Deberías ver un resultado similar al siguiente:

git version 2.20.1

Haz clic en Revisar mi progreso a continuación para verificar que estás avanzando en este lab.

Instalar el software

Tarea 4. Transfiere datos del USGS

  1. En la ventana de SSH, ingresa el siguiente comando para descargar el código de GitHub:
git clone https://github.com/GoogleCloudPlatform/training-data-analyst Nota: Si recibes un mensaje de error de autorización de Git, es probable que hayas escrito mal la URL de GitHub. Copia el código anterior y pégalo.
  1. Navega a la carpeta correspondiente a este lab:
cd training-data-analyst/CPB100/lab2b
  1. Examina el código ingest mediante el comando less:
less ingest.sh

El comando less te permite ver el archivo. Presiona la barra espaciadora para desplazarte hacia abajo; la letra b para crear una copia de seguridad de una página, y la letra q para salir.

  1. Ingresa q para salir del editor.

El programa ingest.sh descarga un conjunto de datos del Servicio Geológico de los EE.UU. sobre los terremotos que se produjeron durante los últimos 7 días. Observa la ubicación en la que se descarga el archivo (disco o Cloud Storage).

  1. Ingresa el siguiente comando para ejecutar el código ingest:
bash ingest.sh

Haz clic en Revisar mi progreso a continuación para verificar que estás avanzando en este lab.

Transferir datos del USGS

Tarea 5. Transforma los datos

Utilizarás un programa de Python para transformar los datos sin procesar en un mapa de actividad sísmica:

El código de transformación se explica detalladamente en este notebook.

Lea el texto si desea comprender lo que hace el código de transformación. El notebook en sí se escribió en Datalab, un producto de Google Cloud que utilizarás más adelante en esta serie de labs.

  1. En la instancia de Compute Engine, ingresa el siguiente comando para instalar los paquetes de Python necesarios:
bash install_missing.sh
  1. Ingresa el siguiente comando para ejecutar el código de transformación:
python3 transform.py
  1. Si ingresas el siguiente comando, verás que hay un nuevo archivo de imagen earthquakes.png en tu directorio actual:
ls -l

Haz clic en Revisar mi progreso a continuación para verificar que estás avanzando en este lab.

Transformar los datos

Tarea 6. Crear un bucket de Cloud Storage

Para este paso, regresa a Cloud Console.

  1. En Menú de navegación, selecciona Cloud Storage:

  2. Haz clic en + Crear. Luego, crea tu bucket con las siguientes características:

  • Elige un nombre de bucket único a nivel global (que no sea alguno que desees usar para tus propios proyectos) y, luego, haz clic en Continuar.
  • Puedes dejarlo como Multi-Regional, o bien cambiarlo a Regional para mejorar la velocidad y reducir los costos (elige la misma región que la de tu instancia de Compute Engine).
  • Para Elige cómo controlar el acceso a los objetos, desmarca la casilla Aplicar la prevención de acceso público a este bucket y selecciona Preciso para Control de acceso.
  1. Luego, haz clic en Crear.

Anota el nombre del bucket, ya que deberás escribirlo cuando en las instrucciones te soliciten que ingreses <TU-BUCKET>.

Tarea 7. Almacena datos

Ahora aprenderás a almacenar los datos originales y transformados en Cloud Storage.

  1. En la ventana de SSH de la instancia de Compute Engine, ejecuta el siguiente comando y cambia <TU-BUCKET> por el nombre del bucket que creaste antes:
gsutil cp earthquakes.* gs://<TU-BUCKET>/earthquakes/

Con este comando, se copian los archivos en tu bucket de Cloud Storage.

  1. Regresa a la consola de Cloud y, en la página Navegador de Cloud Storage, haz clic en el botón Actualizar, que está cerca de la parte superior de la página. Ahora, haz clic en el nombre del bucket y, luego, en la carpeta /earthquakes.

Allí deberías ver los siguientes tres archivos:

  • earthquakes.csv
  • earthquakes.htm
  • earthquakes.png

Haz clic en Revisar mi progreso a continuación para verificar que estás avanzando en este lab.

Crear un bucket y almacenar datos

Tarea 8. Publica los archivos de Cloud Storage en la Web

Ahora publicarás los archivos de tu bucket en la Web.

  1. Para crear una URL de acceso público para los archivos, haz clic en los tres puntos al final del archivo earthquakes.htm y selecciona Editar acceso en el menú desplegable.

  2. En la superposición que aparece, haz clic en el botón + Agregar entrada.

  3. Ingresa los siguientes valores para agregar un permiso para todos los usuarios:

  • En Entidad, selecciona Pública.
  • En Nombre, ingresa allUsers.
  • En Acceso, selecciona Lector.
  • Luego, haz clic en Guardar.

Página de edición de acceso

  1. Repite los pasos anteriores con earthquakes.png.

  2. Haz clic en el nombre de un archivo de Cloud Storage publicado y observa la URL y cómo esta se relaciona con el nombre y contenido de tu bucket. Debería parecerse a lo siguiente:

https://storage.cloud.google.com/YOUR-BUCKET-NAME/earthquakes/earthquakes.png
  1. Si haces clic en el archivo de imagen earthquakes.png y, luego, en la URL pública, se abrirá una nueva pestaña con la siguiente imagen cargada:

Mapa mundial con indicadores de sismos

  1. Continúa y cierra la ventana de SSH.

¡Felicitaciones!

Completaste este lab y aprendiste a iniciar una instancia de Compute Engine, acceder a ella de manera remota y luego crear de forma manual una canalización para recuperar, procesar y publicar los datos.

Finaliza tu Quest

Este lab de autoaprendizaje forma parte de la Quest Scientific Data Processing. Una Quest es una serie de labs relacionados que forman una ruta de aprendizaje. Si completas esta Quest, obtendrás una insignia como reconocimiento por tu logro. Puedes hacer públicas tus insignias y agregar vínculos a ellas en tu currículum en línea o en tus cuentas de redes sociales. Inscríbete en esta Quest o en cualquiera que contenga este lab y obtén un crédito inmediato de finalización. Consulta el catálogo de Google Cloud Skills Boost para ver todas las Quests disponibles.

Realiza tu próximo lab

Continúa tu Quest con Datos meteorológicos en BigQuery o prueba Procesamiento distribuido de imágenes en Cloud Dataproc.

Próximos pasos/Más información

Aquí se muestran algunos pasos para continuar:

  • Consulta USGS.gov para obtener información más completa. Por ejemplo:
  • Regístrate para recibir notificaciones automáticas de los terremotos que ocurran en tu área.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 16 de octubre de 2023

Prueba más reciente del lab: 19 de octubre de 2023

Copyright 2024 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.