Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso de PowerBI. Totalmente práctico, aprende los principales trucos con los mejores especialistas

Imprescindible para el mercado laboral actual. Con Certificado de realización!!

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 8 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

LinceBI, la mejor solución Big Data Analytics basada en Open Source

LinceBI incluye Reports, OLAP, Dashboards, Scorecards, Machine Learning y Big Data. Pruébala!!

22 mar. 2019

Libro gratuito: Big Intelligence


Nuestro buen amigo y colaborador en TodoBI, Antonio Miranda, acaba de publicar un libro mas que interesante y que, además, os podéis descargar gratuitamente y que os recomendamos:

"Big Intelligence. Nuevas capacidades Big Data para los sistemas de vigilancia estratégica e inteligencia competitiva"


Las grandes empresas de internet han creado un nuevo Mercado cuyos productos y servicios son el fundamento de un término paraguas que llamamos Big Data, que le da nuevas alas a las actividades y procesos que suelen englobarse en los conceptos de Vigilancia Estratégica e Inteligencia competitiva


A esa fusión de Big Data aplicado a la Vigilancia Estratégica e Inteligencia Competitiva lo ha denominado en este libro “Big Intelligence”.


Contiene apartados tecnológicos sobre temas muy de moda como Machine Learning, Data Science, Procesamiento de Lenguaje Natural, Ontologías, Web semántica, Bases de Datos NoSQL, apartados específicos sobre Vigilancia Estratégica e Inteligencia Competitiva y su implementación con enfoque Big Data, una presentación en tono divulgativo y también algunos modelos de procesos que pueden ser de vuestro interés.


20 mar. 2019

Data is the source of Business Value


Gran articulo de Bill Schmarzo

Bi isn't big data and big data isn't BI

Compartimos con vosotros esta interesante presentacion de Mark Madsen que explica de forma muy visual la relación entre BI y Big Data

 

19 mar. 2019

Data Science Lifecycle




Es difícil explicarlo mejor en un solo gráfico!!

18 mar. 2019

Tutorial de Real Time Big Data con Apache Storm

Los compañeros de Stratebi realizan charlas técnicas internas sobre diferentes tecnologías en el ámbito del Business Analytics, Big Data, etc... y nos las pasan para compartirlas con poder compartirlas con todos vosotros.

En este primero se habla de Real Time Big Data con Apache Storm. Puedes ver muchas Aplicaciones Online Big Data explicadas en el enlace anterior

Prometen hacer más, estad atentos




Presentaciones:




14 mar. 2019

Consejos para presentar bien los datos


Interesante y útil la presentación de StephanieEvergreen.com, con ejemplos y consejos sobre visualización


StephanieEvergreen.com.#sthash.4suMLKwJ.dpuf
StephanieEvergreen.com.#sthash.4suMLKwJ.dpuf
StephanieEvergreen.com.#sthash.4suMLKwJ.dpuf
StephanieEvergreen.com. #sthash.4suMLKwJ.dpuf
StephanieEvergreen.com. #sthash.4suMLKwJ.dpuf


12 mar. 2019

Vocabulario Visual


Hay tantas maneras de visualizar los datos ¿cómo sabemos cuál elegir? Haga clic en una de las siguientes categorías para decidir qué relación de datos es la más importante en su historia, luego observe los diferentes tipos de gráficos dentro de la categoría para formar algunas ideas iniciales sobre lo que podría funcionar mejor.

Esta lista no pretende ser exhaustiva, ni un asistente, pero es un punto de partida útil para realizar visualizaciones de datos informativas y significativas.


'True facts' del Business Intelligence

Algunos puntos que conviene tener en cuenta a todos los que realizan proyectos Business Intelligence, que nos comenta nuestro compañero Emilio Arias:

- "La visualización 'SI' importa"



Vista espacial del diseño de los nuevos Resorts en la costa de Dubai

- Por mucho que los analistas digan que lo importante son los datos, hasta los controllers, te pedirán la mejor visualización posible 
 - Y la querrán en todos los browsers (en todos) y todas las versiones (hasta las obsoletas) y en todos los dispositivos (hasta en los paneles de las neveras) 
 - La memoria es visual, no lo olvides - Una imagen vale más que mil palabras.... y que mil números 
 - El color atrae. Cifras negras sobre fondo blanco no. 
 - Los hombres del tiempo llevan decenios representando las temperaturas sobre un mapa con iconos, simbolos y flechas... y se dirigen a una gran audiencia... 

 - Controla los riesgos




















- No quieras analizar más información de la necesaria y hagas inviable el sistema
- No quieras hacerlo todo tú, por ahorrar, y que luego no te sirva
- No te quedes 'comprometido' con una tecnología que luego no puedas integrar
- No crees unas expectativas a tus usuarios que luego no se correspondan con la realidad
- No crees unas expectativas a tus usuarios que luego no se correspondan con la realidad
- No crees unas expectativas a tus usuarios que luego no se correspondan con la realidad

11 mar. 2019

Smart Cities, que son y para que sirven




Las Smart Cities y todo lo que rodea su expansión: transparencia, tecnología, Open Data, Big Data, Internet de las cosas (IoT), Open Source, ya están aquí y han venido para quedarse.



Nuestros compañeros de Stratebi también han preparado una presentación sobre Smart Cities y su apoyo en Open Source y Business Intelligence


10 mar. 2019

Por que es interesante Elastic y Kibana?



Hace unos días se celebró en Madrid el evento Elastic{ON} tour, dónde los creadores y usuarios del conocido motor de búsqueda y analítica de datos, contaron las novedades sobre el mismo, así como algunos casos de uso en empresas como Orange o Banco Santander.

Shay Banon, creador de Elastic, abrió el evento con una presentación acerca del presente y futuro de Elastic. En primer lugar, puso de manifiesto que esta herramienta surgida como un motor de búsqueda en una base de datos de documentos (índice invertido), se ha convertido en un conjunto de herramientas mucho más potente, ELK (Elasctiserach, Logstash y Kibana), dónde los usuarios además de implementar un sistema de búsquedas interactivos, tiene la posibilidad de implementar analítica de datos mediante la creación métricas de agregación (medias, recuentos, máximos, histogramas…), cuadros de mando y procesos de machine learning que se pueden crear de forma muy sencilla usando la herramienta Kibana.


Además, distintos miembros de elastic presentaron las novedades en algunas de las características más importantes y novedosas:

·  Data Rollups: Pre agregación de datos de histórico mediante un asistente en Kibana, para mejorar el rendimiento de las consultas analíticas.

·  Canvas: Para la creación de cuadros de mando pixel-perfect con Kibana, mucho más personalizables que los que actualmente podemos desarrollar. Además, se mostró un ejemplo usando el módulo de Elastic que permite consultar datos con lenguaje SQL, en lugar de usar la sintaxis clásica de la API JSON de elascticsearch.

·   Machine Learning: Se hizo hincapié en las características para la detección de outliers y generación de predicciones, características muy útiles por ejemplo para la detección de fallos o sobrecargas en infraestructuras.

·   Elastic Common Schema: Esquema para el mapeo de campos comunes (ej. campos geográficos, como la ciudad)


No menos importantes fueron los casos de uso mostrados por Orange y Banco Santander.
En el caso de Orange, usan Elastic para varios objetivos como la monitorización de las infraestructuras (redes móviles, tv) o el análisis de los datos de llamadas (CDR).

En el caso del Banco Santander, lo están usando para proporcionar una plataforma de análisis financiero a través de su nube privada, como servicio de valor añadido a los inversores. En ambos casos se trata arquitecturas dónde se ha desplegado Elastic en clústeres que van de 10 a cientos de nodos.

Además, destaca la presencia de otros componentes de datos como Kafka, cola de mensajes distribuida que facilita el movimiento de datos en tiempo real a distintas partes de la Big Data pipeline y aumenta la tolerancia a fallos actuando como un buffer persistente.

Por todo ello, consideremos que Elastic es una herramienta consolidada para la implementación de búsquedas y analítica sobre logs u otros conjuntos de datos con características Big Data. 

No obstante, en cuanto a la analítica de datos, existen algunas limitaciones frente a planteamientos tradicionales de Data Warehousing, como la imposibilidad de hacer joins entre tablas (índices o tipos de documentos en elasctic) y otras limitaciones en la forma de agregar los datos o la creación de métricas. 

Por ellos es importante determinar si nuestro escenario de Big Data Analytics puede ser cubierto usando únicamente Elastic (ELK). No obstante, dado que la integración con entornos Hadoop es posible (ej. a través de Spark), podemos combinar lo bueno de ambos mundos para el procesamiento analítico del Big Data, como así proponemos en nuestro Big Data Stack.




7 mar. 2019

'Comparativa Big Data Analytics', descarga el paper gratuito


El uso de sistemas Business Intelligence (BI) suele obtener una respuesta muy rápida e interactiva cuando se utilizan cuadros de mando, informes y consultas analíticas detalladas. Las aplicaciones de BI que cumplen con este requisito de procesamiento interactivo se conocen como aplicaciones OLAP (On-Line Analytical Processing). 

Sin embargo, cuando trabajamos con fuentes de datos con características de Big Data (Volumen, Variedad y Velocidad), nuestras tablas de métricas (por ejemplo, volumen de ventas, unidades...) y aquellas tablas que describen el contexto (por ejemplo, fecha, cliente, producto) podrían almacenar miles de millones de filas, lo que hace que los requisitos de procesamiento sean muy elevados, incluso para las tecnologías Big Data más avanzadas.

Por ello, se ha creado este estudio muy completo que, por primera vez, y de forma rigurosa, compara el rendimiento de las diferentes alternativas para realizar Big Data Analytics





**Download free 27 pages whitepaper ''Big Data Analytics benchmark' 
**Download free 27 pages whitepaper ''Big Data Analytics benchmark' 




Para soportar las aplicaciones OLAP con Big Data, en los últimos años han surgido múltiples tecnologías que prometen excelentes resultados. Algunas de los más conocidos son Apache Kylin, Vertica, Druid, Google Big Query o Amazon Red Shift. 





En este whitepaper describimos las tecnologías Big Data OLAP que forman parte del benchmark: Apache Kylin y Vertica. 



Además de comparar estas tecnologías entre sí, también las hemos comparado con la base de datos relacional PostgreSQL. 

Esta tecnología de código abierto, a pesar de no ser una base de datos Big Data, suele ofrecer muy buenos resultados para los sistemas OLAP tradicionales. Por lo tanto, consideramos que valía la pena incluir PostgreSQL para medir sus diferencias con Kylin y Vertica en un escenario de Big Data OLAP.


LinceBI, solución analítica basada en código abierto, utiliza estas tecnologías para un rendimiento escalable y más rápido en Business Intelligence 




More Info:


OLAP for Big Data. It´s possible?



Hadoop is a great platform for storing a lot of data, but running OLAP is usually done on smaller datasets in legacy and traditional proprietary platforms.   OLAP workloads are beginning to migrate to the one data lake that is running Hadoop and Spark. Fortunately, there are a number of Apache projects that are starting to make OLAP possible on Hadoop.  Apache Kylin For an introduction to this interesting Hadoop project, check...



6 mar. 2019

Big Data Dictionary: From A to Z

4 mar. 2019

STDashboard (Web Dashboard Editor open source based), Video Tutorials



You can see on this series of VideoTutorials, the main features of STDashboard (best open source based web dashboarding tool, with no licenses and professional support included) and how it works

STDashboard is part of LinceBI Open Analytics solution

0. STDashboard (Dashboard for end users in minutes)
1. STDashboard (LinceBI Open Source BI/BigData Solution)
2. STDashboard (LinceBI Vertical Dashboarding Solution)
3. STDashboard (Cubes, Schemas and Templates Management)
4. STDashboard (Config, PDF Export, Layouts...)
5. STDashboard (Graphs, Measures and Dimensions)
6. STDashboard (drill through, drill up, filters)
7. STDashboard (Fix Panel, filter between panels)
8. STDashboard (Customizations, Graphs and external content)
9. STDashboard (Extra Tools, Zoom, Aggregate Data)

Know more:


Introducing STMonitoring for Pentaho



One of the things more useful when you are running a Pentaho production environment with a lot of users accessing the BI server, using reports, dashbords, olap analysis... is monitor the whole user performance.                             That´s why we´ve created STMonitoring (included free in all of the projects we help to develop and in some solutions, like LinceBI)....


STReport (Web Reporting Open Source based tool) Video Tutorials



You can see on this series of VideoTutorials, main features of STReport (best open source web reporting tool based, with no licenses and professional support included) and how it works STReport is part of LinceBI Open Analytics solution 1. STReport (creating simple report using rows, groups, filters) 2. STReport (Models, exploring categories and glossary) 3. STReport (Work area, hidden sections, limit results, info options...) 4. STReport...


List of Open Source Business Intelligence tools



Here you can find an updated list of main business intelligence open source tools. If you know any other, don´t hesitate to write us - Talend, including ETL, Data quality and MDM. Versions OS y Enterprise - Pentaho, including Kettle, Mondrian, JFreeReport and Weka. Versions OS y Enterprise - BIRT, for reporting - Seal Report, for reporting - LinceBI, including Kettle, Mondrian, STDashboard, STCard and STPivot - Jasper Reports, including...


STDashboard, a free license way to create Dashboards



The improvements in this version of STDashboard are focused on user interface for panel and dashboard and also some enhancement in performance and close some old bugs. It works with Pentaho and embeded in web applications You can see it in action in this Pentaho Demo Online and as a part of LinceBI suite STDashboard doesn´t requiere anual license, you can manage unlimited users and it´s open source based.  STDashboard includes professional...


New features in STDashboard for Pentaho



The improvements in this version of STDashboard are focused on user interface for panel and dashboard and also some enhancement in performance and close some old bugs. It works with Pentaho versions 5, 6 and 7 You can see it in action in this Pentaho Demo Online About UI improvements:  - New set of predefined dashboard templates. We have designed a new way to manage dashboard panels that allow you to shape the dashboard in almost any...


Create Dashboards in minutes with Open Source



Just a sneak preview of new functionalities we are including in Pentaho in order end user can create their own powerful dashboards in minutes. We call it STDashboard, by our colleagues of Stratebi. These new functionalities include: new templates, panel resize, drag and drop, remove and create panels, Pentaho 7 upgrade... As always and as other Pentaho plugins we´ve created (STPivot, STCard and STReport), they are free and included in all of...


Tutorial: Creacion de Dashboards con soluciones Open Source



Cada vez son más demandados los Cuadros de Mando y la buena noticia es que gran parte de ellos pueden hacerse con soluciones Open Source: Pentaho, CDE, dc.js... Como novedad, también puedes crearlos con StDashboard: How to create your own Dashboards in Pentaho Os incluimos las principales claves para construir potentes Cuadros de Mando, del Curso de creación de Dashboards Open Source: Si os ha interesado, podéis también: -...


12 aplicaciones gratuitas para crear Dashboards



Muchos de vosotros nos preguntáis sobre los Dashboards, que cada vez son mas demandados para soluciones de todo tipo: Business Intelligence, Real Time, Big Data, IoT, Direccion (EIS), etc... Os traemos una recopilación de 12 soluciones gratuitas para tener cuadros de mando, en algunos casos, además son open source y en otros puedes tenerlo en tus propios servidores sin depender del fabricante de software comercial, como veis hay algunos casos ClicData ...

3 mar. 2019

Como funciona Microsoft Power BI? Todo lo que necesitas saber


Todo lo que necesitas saber sobre la herramienta de Data Discovery que está revolucionando la toma de decisiones en las empresas lo tienes aquí:



Para saber más de PowerBI (ver demos online en enlace anterior, cursos e info a continuación):

Big Data para PowerBI



Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...


Whitepaper gratuito 'Usos de Machine Learning por sectores'



Ya tenéis disponible un Estudio muy interesante de más de 60 páginas, que os podéis descargar gratuitamente desde el enlace anterior Que podéis encontrar? Más información: Plataforma Online de Soluciones Big Data y Machine Learning (Demos y Aplicaciones) Aplicación práctica de Machine Learning con Bases de Datos Analyticas. Descargar Paper VideoTutorial Machine Learning para Predicción de Ventas VideoTutorial PowerBI con R Aplicación...


Usando Python con PowerBI



Muy interesante la nueva funcionalidad que permite el uso de Python en PowerBI, que se añade a la ya conocida capacidad con R, que os comentábamos no hace mucho En este artículo de Tommi Ranta explica paso a paso como preparar un entorno Python, habilitar Python en Power BI, importar datos y aplicar clustering a los datos y crear visualización personalizadas en Power BI utilizando Python.  Todo el material necesario para replicar...


Machine Learning Demo Tutorial



En este demo tutorial (que puedes probar directamente en el enlace anterior), se han utilizado los datos de la cadena de heladerías para predecir las ventas en función de ciertas variables como el calendario laboral, la temperatura o el número de horas de apertura.  Para su implementación se ha seleccionado el algoritmo de regresión GBT (árboles potenciados por gradiente) y se ha utilizado la tecnología Apache Spark que permite...


Como integrar Saleforce y PowerBI



Os contamos las posibilidades de integración de las dos soluciones Business Intelligence y CRM más extendidas del mercado: PowerBI y Salesforce Gracias a la posibilidad de integración de las herramientas se abre una gran cantidad de posibilidades Ahora puede obtener información en tiempo real de los datos de Salesforce mediante la conexión a través de Power BI Según los principales estudios, tanto Salesforce como Microsoft PowerBI lideran...

Videotutorial: Usando R para Machine Learning con PowerBI



Si te gusta el Business Intelligence, Machine Learning y conoces algo de R, no te puedes perder este Videotutorial: Temario del Videotutorial: 1º Posibilidades de R dentro de Power BI  2º Instalar R y RStudio  3º Matriz de Correlación para el sector Retail  4º Árbol Decisión Titanic  5º Clustering K-Means Estados Unidos  6º Clustering DBSCAN Estados Unidos para detectar Outliers  7º Forecasting Exponencial Smoothing...


Las 50 claves para aprender y conocer PowerBI



Si tenéis curiosidad por conocer sobre todas las posibilidades de PowerBI, como funciona, integración, costes, etc... no te puedes perder este documento.  Altamente recomendable!!! También te puede interesar: Las 50 claves para conocer Futbol Analytics julio 18, 2018  Analytics, big data, open source, Stratebi, Tablero Futbolero  No comments Os presentamos un estudio muy...


Descarga Paper gratuito: Zero to beautiful (Data visualization)



Quieres conocer la mejor manera de contar una historia a través de los datos y la visualización? Pues no te puedes perder este white paper que nos ofrecen desde PowerBI y que te puedes descargar gratuitamente Quieres saber más sobre PowerBI: Demos, Formación, Desarrollo... Info en español Using data visualization to tell a story: You know which charts best represent your data, and you understand best practices for sharing insights. Now it’s...


Top Business Intelligence Tools study



This complete, 300 pages study, is a comprehensive comparative of some of the most important Business Intelligence tools (this study will include new tools in next editions).  Has been created by analytics experts Stratebi. This document include in depth features, modules and architecture analysis, considering: - PowerBI - Tableau - Qlikview - Pentaho - SAS - Information Builders - Amazon Quicksight A very complete study for all business...


Tutorial: How to Integrate your Jedox Planning Sheet into Microsoft Power BI Reports


Muy interesante la integración de dos de nuestras herramientas favoritas: PowerBI y Jedox ...


Working together PowerBI with the best open source solutions



Here you can see a nice sample combining PowerBI with open source based Business Intelligence solutions, like LinceBI, in order to provide the most complete BI solution with an affordable cost - Predefined Dashboards - Adhoc Reporting - OLAP Analysis - Adhoc Dashboarding - Scorecards More info: - PowerBI functionalities - PowerBI traini...




In recent posts, we explained how to fill the gap between Big Data and OLAP, using Tableau, Pentaho and Apache Zeppelin. Now, we´ll show you how to use PowerBI for Big Data Dashboards using Apache Kylin. Also try online in our Big Data Demo site Arquitecture: In this use case we have used together Apache Kylin and Power BI to support interactive data analysis (OLAP) and developing a dashboard, from data source with Big Data features (Volume,...