Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso de PowerBI. Totalmente práctico, aprende los principales trucos con los mejores especialistas

Imprescindible para el mercado laboral actual. Con Certificado de realización!!

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 8 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

Aprende gratis Analytics OLAP sobre Pentaho

La solución open source para business intelligence y Big Data sobre Pentaho, no te lo pierdas!!

22 oct. 2018

Curso online para aprender ETL, DataWarehouse (30, 31 Octubre)


Aprende los fundamentos de los procesos ETL y Data Warehouse

Curso online para aprender ETL, DataWarehouse


Información relacionada:


Explicacion sencilla de arquitecturas Business Intelligence



En este post muy útil, se hace un repaso a las diferentes alternativas en que la información puede ser consumida por los usuarios y las diferentes formas de almacenamiento de la misma.  Habría que decir, que todas ellas son formas de analizar la información y tomar decisiones, esto es, Business Intelligence; aunque en rigor, sólo las más óptimas en cuanto a uso de Data Marts DW y optimización del acceso por los usuarios, se consideran de...


Data Lakes: Definiciones y Plataformas. Descarga gratuita del White Paper



Un gran estudio de más de 40 páginas por parte de Philip Russom, que puedes descargar gratuitamente desde aquí Os dejo a continuación, un resumen de los contenidos y algunos de los principales hallazgos del estudio. Muy interesante. Para saber más de Data Lakes: Diferencias entre Data Lake y Data Warehouse junio 07, 2017  Bases de Datos, data warehouse, teoria  No comments Let’s briefly take...


Big Data para PowerBI



Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...


Big Data Olap con Superset (AirBnB)



Os venimos contando desde hace ya un tiempo, el potencial del mundo Big Data y OLAP Business Intelligence, con diferentes tecnologías. Hoy, os contamos la arquitectura usando Superset, creado por AirBnB Nuestros compañeros de Stratebi han creado un entorno de prueba para que lo veas, además, en funcionamiento Información publicada recientemente sobre el tema: - x50 faster 'near real time' Big Data OLAP Analytics Architecture - Comparacion...


From Big Data to Fast Data



Muy buen articulo de Raul Estrada. Principales puntos: 1. Data acquisition: pipeline for performance In this step, data enters the system from diverse sources. The key focus of this stage is performance, as this step impacts of how much data the whole system can receive at any given point in time. Technologies For this stage you should consider streaming APIs and messaging solutions like: Apache Kafka - open-source stream processing...


Quieres trabajar en Big Data/Analytics y tienes ganas de aprender?



Tenemos un plan de formación y carrera para profesionales con una base inicial y muchas ganas de aprender. Escríbenos a rrhh@stratebi.com (Marzo 2018) Podrás participar en proyectos y en desarrollos con las tecnologías más modernas, como Dashboards en tiempo real. Hemos creado también la solución LinceBI, que está revolucionando el Business Intelligence basado en open source El trabajo puede ser presencial en Madrid o remoto, en cualquier parte...

21 oct. 2018

Como hacer Deep Learning con Pentaho



Hace ya unas semanas os hablábamos de como Pentaho Data Integration podía orquestar los procesos de Machine Learning (lo que llamábamos Machine Intelligence)
Hoy damos un paso más, y os contamos como hacer 'deep learning con Pentaho'


En breve, Pentaho va a presentar una evolución de Pentaho Machine Intelligence

Este otoño, se lanzará la versión 1.4 de PMI como una actualización del PMI existente, que es un complemento experimental para Pentaho Data Integration (PDI).

La versión inicial de PMI se centró en el aprendizaje automático clásico y la capacidad de construir, usar y gestionar modelos de aprendizaje automático de cuatro bibliotecas de aprendizaje automático: el Scikit-Learning de Python, el Machine Learning with R de R, la biblioteca de Machine Learning de Spark y WEKA



Con la próxima versión de PMI, se integra una nueva biblioteca de aprendizaje automático, lo que se denomina "motores de ejecución": Deep Learning para Java (DL4J).


Esto significa que PMI ahora puede realizar operaciones de aprendizaje profundo (capacitación, validación, prueba, construcción, evaluación y uso de modelos de aprendizaje profundo) directamente desde PDI. Suena interesante!!

Deep Learning está ganando mucha atención en la industria por su capacidad para operar con datos no estructurados como imágenes, video, audio, etc.

El Deep Learning es una adición reciente al dominio de Inteligencia Artificial del aprendizaje automático, aunque técnicamente la tecnología ha existido desde hace mucho tiempo




Visto en el blog de Hitachi

Mas de 25 novedades en PowerBI


Desde hace ya unos cuantos meses, os venimos contando sobre PowerBI, la herramienta de Data Discovery que cubre las necesidades para crear Dashboards, por parte de usuarios finales y avanzados.

Además, para tener una solución completa BI y Analytics, puedes complementarla con soluciones Open Source como Pentaho, LinceBI y todo tipo de integraciones Machine Learning y Big Data

Mas información sobre PowerBI (cursos, buenas prácticas, integración)



Ultimas Novedades:


Algunas de las funcionalidades más importantes de los últimos meses:

Junio 2018
Reporting

·  1) Control del radio en los gráficos de anillo



·  2) Edición de etiquetas de detalles en los gráficos de anillo y tarta.



Modelado

·  3) Filtrado y Ordenación en vista de datos



Nuevos gráficos (Custom Visuals)

·  4) Organization Chart



Julio 2018
Modelado

·  5) Modelos mixtos (Tablas en modo: Import / Direct Query/ Dual)





Reporting

·  6) Formato de papel tapiz de fondo (Wallpaper)

·     

    7) Diseño escalonado (stepped) en gráficos de línea y combo





Analytics


·  8) Obtener información del factor de distribución más importante en nuestros datos



Agosto 2018
Reporting

·  9) Exportar informes en PDF





·  10) Formato condicional en tablas y matrices en función de otros campos.





















Analytics

·  11) Integración con Python para transformar datos y crear visualizaciones


































Modelado

12) Nuevas funciones DAX estadísticas (Similares a las existentes en Excel)














Nuevos gráficos (Custom Visuals)

·  13) Scatter Chart by Akvelon


   
     14) 3AG Systems – Column Chart with Variance



·   
      15) Pivot Slicer


Septiembre 2018
Reporting

·  16) Uso de campos categóricos en eje X de gráficos Scatter chart

·  
17) Copiar valores y selección desde tablas y matrices




















·   



    18 )Temas predefinidos en Power BI desktop





















·   


   19 )Tooltips disponibles de forma general y no en fase beta.


















Preparación de Datos

·  20) M Intellisense





Analytics


·  21) Agregaciones /Tablas resumen agregadas




















Conectividad de datos

·   22 )Conector a Archivos PDF
·   23) Conector Dataflows

·  
   24) Conector a SAP BW con soporte para propiedades de las medidas

Nuevos gráficos (Custom Visuals)

·  25) Horizon Chart

·  
    26) Text Enhancer

·   
    27)Advance Card

·         
    28)Multi KPI




























Para Saber más de PowerBI:



Big Data para PowerBI



Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...

Working together PowerBI with the best open source solutions



Here you can see a nice sample combining PowerBI with open source based Business Intelligence solutions, like LinceBI, in order to provide the most complete BI solution with an affordable cost - Predefined Dashboards - Adhoc Reporting - OLAP Analysis - Adhoc Dashboarding - Scorecards More info: - PowerBI functionalities - PowerBI traini...


Comparativa de Costes Tableau vs PowerBI



  Os dejamos un documento listo para descargar, con una comparativa muy completa de costes entre Tableau y PowerBI (hay que decir que el informe ha sido encargado por Tableau, por lo que puede tener cierto sesgo).  Por ejemplo, en cuanto al esfuerzo de este tipo de proyectos, si tenemos en cuenta que ambas son herramientas de Data Discovery (usuario final), no se tiene suficientemente en cuenta la parte más importante, el modelado,...