Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso de PowerBI. Totalmente práctico, aprende los principales trucos con los mejores especialistas

Imprescindible para el mercado laboral actual. Con Certificado de realización!!

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 8 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

LinceBI, la mejor solución Big Data Analytics basada en Open Source

LinceBI incluye Reports, OLAP, Dashboards, Scorecards, Machine Learning y Big Data. Pruébala!!

31 may. 2018

Descarga gratis el Estudio: 'Impacto del Big Data y Advanced Analytics en España'


Muy interesante el estudio que ha realizado Esade y puedes descargar sobre el uso del Big Data y Advance Analytics en España, tema que nos encanta en TodoBI





El presente estudio nace con el objetivo de conocer el estado de adopción e impacto que está teniendo el Big Data en las empresas de nuestro país. 

Aquí podemos ver los problemas a los que se enfrentan las compañías en sus iniciativas Big Data Analytics:





Mediante un cuestionario dirigido a los responsables ejecutivos y técnicos de las mismas, se ha analizado a las compañías respecto a  cinco dimensiones:

1) Visión  estratégica  y  modelo  organizativo 
2) Inversión  y  creación  de  valor 
3) Cultura y talento



4) Infraestructura de datos
5) Prioridades a futuro



30 may. 2018

La Tabla Periodica interactiva del Machine Learning



Que gran visualización y que útil, pincha en la tabla periódica para descubrirlo

28 may. 2018

Top Business Intelligence Tools study


This complete, 300 pages study, is a comprehensive comparative of some of the most important Business Intelligence tools (this study will include new tools in next editions). 

Has been created by analytics experts Stratebi. This document include in depth features, modules and architecture analysis, considering:

- PowerBI
- Tableau
- Qlikview
- Pentaho
- SAS
- Information Builders
- Amazon Quicksight

A very complete study for all business intelligence interested who are evaluating to use some of this tools


27 may. 2018

Nuestro mundo en datos


Para todos los que consideran que la mejor forma de estar informados y opinar con criterio de historia, economía y política es basarse en datos, esta es tu web: Our World in Data




Curso en Madrid de Machine Learning


13, 14 de Junio, Madrid

Hace poco os contábamos en detalle sobre Machine Learning, ahora os proponemos la posibilidad de formaros en este interesante y eminentemente práctico Curso presencial en Madrid, para aprender sobre lo que allí os contábamos

Echa un vistazo a algunos ejemplos de de aplicación en Big Data

Son plazas limitadas, por lo que no lo dejéis escapar









25 may. 2018

Webinar STPivot4 Open Source for Pentaho ya disponible


Mas de 100 inscritos al Webinar sobre Business Intelligence Open Source, centrado en el uso de la herramienta OLAP, STPivot4, disponible en Github y en el Marketplace de Pentaho

Os dejamos el video completo del Webinar realizado





Este pasado jueves 24 de Mayo hemos tenido un Webinar para conocer y sacar el mejor partido a STPivot4, la solución open source, analytics OLAP sobre Pentaho, que también puedes usar sobre ecosistemas Big Data como Apache Kylin.

Toda la info y registro de STPivot4

STPivot puede ser descargado gratuitamente desde Github y desde el Marketplace de Pentaho







20 may. 2018

Data: Languages in the world

19 may. 2018

Bloom, Graph Visualisation y Discovery tool para Neo4j


Muy interesante la presentación de la nueva herramienta de visualización para Neo4J, Bloom, realmente espectacular

Además, tienes otras posibilidades de visualización para Neo4J

Aquí podéis ver una Demo usando Neo4J con los Panama Papers y para cálculo de distancias, en este caso usando Linkurious

Bloom visually reveals the value of data relationships and identifies connectedness paths between interesting clusters and nodes. These situations often include:


  • Identifying the relationship (or hidden path) between individuals
  • Connecting people to activities, locations, compaines, devices and other objects
  • Demonstrating to management the innovative impact of graphs
  • Illustrating the context and paths of graph designs and Cypher queries
Bloom gives you the ability to:
  • Inspect the animated graph by panning and zooming across the visible domain
  • Snapshot scenes using a screen capture tool and paste to publish
  • Select a node and toggle to understand properties and adjacent nodes based on its relationships
  • Edit nodes, relationships and properties
  • Pick a template and view the metadata perspective of that template against your data
  • Initiate queries within the search box based on suggestions and template phrases
  • Advance the scene and choose a new query to execute in the search box
  • Save your history including “hints” that inform the illustration so Bloom remembers where you left off

17 may. 2018

Pentaho 8.1 ya esta aquí, conoce las novedades!!



Pentaho 8.1 ya esta disponible (aquí para descargar de Sourceforge) y que mejor que Pedro Alves para contarnos. Os dejamos las principales novedades y en que versión (EE o CE) están disponibles:

Cloud Google Storage (EE)

Google BigQuery – JDBC Support  (EE/CE)

Google BigQuery – Bulk Loader  (EE)


Google Drive  (EE/CE)

Analytics over BigQuery  (EE/CE, depending on the tool used)

Big Data / Adaptive Execution Layer (AEL) Improvements 

Bigger and Better (EE/CE)

Sub Transformation support (EE/CE)

Big Data formats: Added support for Orc (EE/CE)

Worker Nodes (EE)

New Streaming Datasources: MQTT, and JMS (Active MQ / IBM MQ) (EE/CE)


Safe Stop (EE/CE)

Streaming Dataservices (EE/CE)

CTools and Streaming Visualizations (EE/CE)

Time Series Visualizations (EE/CE)

Data Exploration Tool Updates (EE)


 Additional updates:

     Salesforce connector API update (API version 41)
     Splunk connection updated to version 7
     Mongo version updated to 3.6.3 driver (supporting 3.4 and 3.6)
     Cassandra version updated to support version 3.1 and Datastax 5.1
     PDI repository browser performance updates, including lazy loading
     Improvements on the Text and Hadoop file outputs, including limit and control file handling
     Improved logging by removing auto-refresh from the kettle logging servlet
     Admin can empty trash folder of other users on PUC
     Clear button in PDI step search in spoon
     Override JDBC driver class and URL for a connection
     Suppressed the Pentaho ‘session expired’ pop-up on SSO scenarios, redirecting to the proper login page
     Included the possibility to schedule generation of reports with a timestamp to avoid overwriting content

In summary (and wearing my marketing hat) with Pentaho 8.1 you can:

      Deploy in hybrid and multi-cloud environments with comprehensive support for Google Cloud Platform, Microsoft Azure and AWS for both data integration and analytics
      Connect, process and visualize streaming data, from MQTT, JMS, and IBM MQ message queues and gain insights from time series visualizations
      Get better platform performance and increase user productivity with improved logging, additional lineage information, and faster repository access

7 may. 2018

Webinar gratuito para aprender STPivot sobre Pentaho



El próximo jueves 24 de Mayo tienes un Webinar para conocer y sacar el mejor partido a STPivot4, la solución open source, analytics OLAP sobre Pentaho, que también puedes usar sobre ecosistemas Big Data como Apache Kylin.

Toda la info y registro del Webinar

STPivot puede ser descargado gratuitamente desde Github y desde el Marketplace de Pentaho







2 may. 2018

Como obtener beneficios de tus datos en lugar de cederlos gratuitamente


Eso es lo que promete la startup Wibson, con un buen número de especialistas y fondos detrás. La idea es buena, habrá que seguirles la pista para ver si su uso se va extendiendo
"Wibson is a blockchain-based, decentralized data marketplace that provides individuals a way to securely and anonymously sell validated private information in a trusted environment"
"In today’s economy, data equals money. Unfortunately, it doesn’t mean money for you.Giant tech companies cleverly use the Internet’s underlying technical protocols to capture and control your personal information"