Photo by Alexander Sinn on Unsplash
Travesuras de los sábados de SQL: un día de datos, conocimientos y diversión
El aprendizaje es una parte esencial de la vida, y asistir a SQL Saturday ATL es una excelente manera de aprender sobre diferentes temas. En mi experiencia, pude aprender sobre DataOps, Gerilumn, Data Governance y Machine Learning.
Durante mi tiempo en SQL Saturday, asistí a seis sesiones y me gustaría compartir algunos de los puntos clave de cada una de ellas.
Sesión 1: Casos prácticos de uso para modelos compuestos por Kevin Arnold
En esta sesión aprendí sobre Power BI y sus diferentes aspectos. El objetivo principal de los modelos compuestos es enriquecer, ampliar y obtener una visión general. También aprendí sobre los cuatro modos principales para conectarse a fuentes de datos, que son conexión de importación, consulta directa, mixta y en vivo. El objetivo principal de los modos compuestos es ampliar, enriquecer y obtener una visión general. También discutimos algunos casos de uso y aprendimos sobre imágenes personalizadas.
Sesión 2: Arquitectura de canalización de datos: principios y consideraciones clave de diseño por Jean Joseph
La sesión de Jean Joseph fue informativa e interesante. Discutimos qué es una canalización de datos y sus componentes, tipos y casos de uso. Una canalización de datos es un método en el que se obtienen datos sin procesar de varias fuentes de datos y luego se transfieren a un almacén de datos, como un lago de datos o un almacén de datos, para su análisis. También aprendimos sobre el patrón arquitectónico moderno de procesamiento de datos y dos enfoques diferentes para la arquitectura Lambda. Además, aprendimos sobre la arquitectura Kappa, que procesa datos en tiempo real para cargas de trabajo analíticas y transaccionales utilizando un enfoque basado en eventos y una pila de tecnología unificada.
Sesión 3: NextGen AI: aprendizaje de refuerzo profundo y enseñanza automática para sistemas autónomos por Barkha Herman
Barkha Herman habló sobre el aprendizaje de refuerzo profundo, que me recordó a AWS DeepRacer. Aprendimos sobre los cuatro principales problemas diferentes o categorías de clasificación que la IA ha encontrado hasta ahora, que son el problema de clasificación, la predicción, la detección de anomalías y el problema de agrupamiento. Además, aprendimos sobre el proyecto Bonsai Tree, que es un servicio de Microsoft que ayuda a optimizar el rendimiento de fabricación, la optimización de procesos químicos, la administración de energía de edificios, la logística y la optimización de la cadena de suministro, la fabricación discreta y de procesos, CPG/minorista y transporte de energía.
Ve a apoyar a Barkha :)
Sesión 4: DataOps 101: una mejor manera de desarrollar y entregar análisis de datos por John Kerski
En la sesión de John Kerski, analizamos un ejemplo sorprendente de un analista de datos entre su jefe y la importancia de DataOps. DataOps incorpora varias metodologías y conceptos como DevOps, Agile y Lean Manufacturing. Hace hincapié en la integración y el despliegue continuos, promueve la colaboración entre los equipos de desarrollo y operaciones, y sigue los principios ágiles de equipos autoorganizados y entrega de valor rápidamente. DataOps también simplifica y estandariza los procesos, aumenta la automatización y trata los datos y sus transformaciones como un producto en una línea de fabricación, lo que requiere un control constante de la calidad de los datos en cada paso. También aprendimos por qué es importante hacerlo reproducible, aprender o adoptar Git, monitorear la calidad y el rendimiento, detectar errores antes que los clientes y reducir el heroísmo y evitar el agotamiento.
Sesión 5: Primeros pasos con bases de datos de gráficos y lenguajes de consulta de gráficos por Taylor Riggan
En la sesión de Taylor Riggan, realizamos un curso intensivo de tecnología de gráficos (bases de datos) y cómo comenzar a usar Jupyter Notebook. Aprendimos qué es un gráfico, cómo está diseñado específicamente para almacenar y navegar relaciones, y cómo los nodos representan objetos del mundo real, mientras que los bordes almacenan relaciones entre objetos. También aprendimos que se pueden agregar propiedades y etiquetas a los nodos y bordes, y que existen diferentes tipos de gráficos, incluidos gráficos dirigidos y no dirigidos.
Sesión 6: Comparta los informes de Power BI en su organización de la manera correcta por Daniel Glenn
Daniel Glenn discutió cómo compartir informes de Power BI en una organización de la manera correcta. Cubrió varios métodos para compartir datos, incluidos grupos, usuarios específicos, espacios de trabajo, aplicaciones, incrustar, publicar en la web y Teams. La sesión fue informativa y atractiva, y Daniel incluso hizo preguntas divertidas sobre temas controvertidos como la pizza de piña y los tomates en los perritos calientes.
¡Y eso es una envoltura, amigos! Mi experiencia en SQL Saturday fue increíble. Me divertí mucho asistiendo a varias sesiones sobre temas como DataOps, Gerilumn, Data Governance, Machine Learning y más. Pero eso no es todo, ¡también tuve la suerte de ganar no uno sino dos sorteos! ¡Gracias patrocinadores y voluntarios por un gran evento! :)