Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso de PowerBI. Totalmente práctico, aprende los principales trucos con los mejores especialistas

Imprescindible para el mercado laboral actual. Con Certificado de realización!!

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 8 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

LinceBI, la mejor solución Big Data Analytics basada en Open Source

LinceBI incluye Reports, OLAP, Dashboards, Scorecards, Machine Learning y Big Data. Pruébala!!

25 feb. 2019

Snowflake, The Data Warehouse built for the Cloud



Hace unas semanas, tuvimos la suerte de acudir al evento de presentación en España que realizó Snowflake

Breakfast Insights 24/01/19:

Ponentes:
  • Benoit Dageville: Uno de los fundadores
  • Thibaut Ceyrolle: Vicepresidente EMEA
  • Pedro Martins: Outsystems.

Topics:
  • Presentan al equipo de ventas de España. Oficinas en Madrid y Barcelona.
  • Posibilidades datawarehouse, de procesamiento y almacenamiento en la nube.
  • Flexible, escalable y ágil al ser un entorno cloud. Cuentan con alianzas con AWS, Azure
  • Principales sectores a los que se dirigen son empresas de internet, seguros, banca, salud, IoT
  • Principal inversor el grupo Sequoia que también ha invertido en Airbnb, Apple, Google, Facebook...
  • Info sobre pricing: https://www.snowflake.com/pricing/

El discurso principal se orienta a dedicar el tiempo a la toma de decisiones en lugar de a procesar datos (simplificar el ETL y el DW, para que 'negocio' decida)

La charla más interesante fue la de Pedro Martins donde destacó que buscaban una solución con soporte para datos  estructurados y semi estructurados, conexiones de distintos orígenes (herramientas BI, machine learning...), capacidades SQL, simplicidad a la hora de preparar los datos y escalibilidad de almacenaje y computación. 





Su caso de uso tenía como fuentes sistemas propios de su plataforma de Outsystems, datos de telemetría o Salesforce. 

Usaban pentaho, Fivetran y el contector cloud de AWS S3 para la parte de ETL y la carga de datos en Snowflake. En cuanto a self service para analítica usaban R, Tableau y Qlik además de dashboards desarrollados por ellos.

El diseño del DW lo dividían en 3 secciones, una que llamaban raw, similar a un staging, y para el equipo técnico,  otra analistas donde estaba basicamente el DW y finalmente una donde tenían las métricas accesibles para los usuarios de negocio.    

Destacaban de Snowflake la facilidad para la definición de datasets accesibles a diferentes roles de usuario. Parece ser que se trata de "virtual datamarts" que no tienen persistencia física como sucede en las soluciones tradicionales.

Nos hubiera gustado ver algo de la interfaz de trabajo y/o definición de DW pero todo lo que mostraron fueron ppts. 


En cualquier caso, se puede ver aquí: https://resources.snowflake.com/youtube-all-videos/snowflake-introduction-demo

0 comentarios: