TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Pentaho: la solucion Open Source Business Intelligence


1) Demos Actualizado ( 2017 ): Demos Online de Stratebi-Pentaho Acceder, nuevas funcionalidades y soluciones por industrias

Ya disponible Pentaho 7 CE   !!!
2) Formación: Nuevos ( Workshops BI Open Source )
3) Video Tutoriales: Casi 3 horas para conocer las claves de Pentaho


- Introducción a Pentaho (mas de 1 hora, con ejemplos, antiguo)
- Tutorial Schema Workbench, Pentaho
- Dashboard Editor - Pentaho Community
-
Tutorial Dashboard Editor (Part 1)
- Tutorial Eclipse BIRT (Tut. 6)
- Tutorial Mondrian cubes (Jpivot,
-
STPivot, improving Jpivot
- Tutorial Pentaho Report Designer
-
Pentaho, Intalio, Liferay, Alfresco,

4) Mas recursos:
Color del texto
- Tutorial Cuadros de mando con CDE
- Desarrollos propios: STPivot y STDashboard - Las ultimas noticias del Business Intelligence: twitter TodoBI_OS
-
Integración de Liferay y Pentaho .
-
STReport , Comparativa de herramientas Open Source.
-
Comparativa de Algoritmos de Data Mining.
- Demos Online Pentaho
- Trucos y Documentos
- STPivot
- STDhasboard

- Redopenbi : La Red del BI Open Source en castellano (mas de 1.300 miembros)
Os recomendamos también ver los posts actualizados, con las entradas más recientes , o contactar con nuestros compañeros especialistas de Stratebi , para más ayuda.
5) Información general:
La visibilidad que nos está dando Pentaho , la solución de software libre de BI de sus componentes, se ha convertido en un interesante ejercicio de análisis de la arquitectura de una suite de BI.
En las siguientes lineas vamos a comentaren que estado actual se encuentra la solución y que con que componentes cue nta, para llevar a cabo un proyecto BI, como se indica en la siguiente gráfica:

Introducción a Pentaho
Pentaho se define a si mismo como una plataforma de BI “orientada a la solución” y “centrada en procesos” que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos.

Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrado con un motor de workflow de procesos de negocio. La plataforma será capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la información adecuada en el momento adecuado.
Su modelo de ingresos parece estar orientado a los servicios (soporte, formación, consultoría y soporte a ISVs y distribuciones OEM) aunque en alguno de los documentos y páginas que hemos examinado aparece mencionado algunas funcionalidades “Premium” que hacen pensar en ingresos por futuras versiones o funcionalidades de pago.
En su web presenta una organización por productos:
Reporting , Análisis , Dahsboards y Data Mining , acompañado por dos introducciones: a la plataforma y a los productos . En dichas introducciones se hace mención específica al workflow como una de las capacidades BI claves de la plataforma.
Presentando y entregando la información.
Dashboard
Pentaho presenta informes en los formatos habituales (html, excel, pdf...) mediante JfreeReport , proyecto incorporado recientemente a Pentaho junto con su responsable Thomas Morgner, u otras plataformas como BIRT o JasperReports . Para la generación de PDFs utilizan, como podría ser previsible, el conocidísimo Apache FOP . Asimismo incorpora la librería JPivot , gracias a la cual podemos ver tablas OLAP a través de un browser y realizar las aplicaciones típicas de análisis OLAP (drill down, slice and dice...).
Recientemente se anunció Pentaho Report Design Wizard, una herramienta de diseño de informes, que facilita el trabajo con JfreeReport y supera sus limitaciones. Suponemos que algo tiene que ver JFreeDesigner, el diseñador de informes para JFreeReport de jfree.org, ya que Thomas Morgner es también el responsable de
JFreeDesigner .
Los dashboards son un desarrollo propio de Pentaho. Recogen información de todos los componentes de la plataforma incluyendo aplicaciones externas, feeds RSS y páginas web. Incluyen gestión y filtrado del contenido, seguridad basada en roles y drill down. Pueden ser integrados en terceras aplicaciones, en portales o dentro de la plataforma Pentaho.
Para generar gráficos se apoyan en
JFreeChart , una librería para generar los gráficos más comunes (2D, 3D, barras, líneas series temporales, Gantt...), interfaces para acceder a diferentes fuentes de datos, exportación a PNG, JPEG y PDF y soporte para servlets, JSPs, applets y aplicaciones clientes.
Los
WebServices son una característica fundamental de Pentaho . Las acciones, que son las tareas más sencillas que constituyen una solución de Pentaho, pueden publicarse como WebServices. Pentaho utiliza como motor de WebServices Apache Axis , quedando los servicios descritos en el lenguaje de definición de servicios web WSDL .
Para entregar la información Pentaho se apoya en una infraestructura
JMS para enviar correos electrónicos y Quartz , un scheduler opensource integrable en aplicaciones J2EE (de hecho necesita ser instanciado). También está anunciado un feed RSS propio, para posicionarse en el desktop.
La solución BI

Reporting
El servidor OLAP
Para obtener la funcionalidad de procesamiento analítico en línea (OLAP) se utilizan otras dos aplicaciones: el servidor OLAP Mondrian , que combinado con Jpivot , permiten realizar querys a Datamarts, que los resultados sean presentados mediante un browser y que el usuario pueda realizar drill down y el resto de las navegaciones típicas.
Algunas cuestiones interesantes sobre Mondrian:
- Mondrian utiliza MDX como lenguaje de consulta, que no tendría nada de raro si no fuera porque fue un lenguaje propuesto por Microsoft.
-
En noviembre de 2005 Mondrian se incorporó al proyecto Pentaho , incluyendo a su fundador Julian Hyde.
- Mondrian funciona sobre las bases de datos estándar del mercado: Oracle, DB2, SQL-Server, MySQL... lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho.
- JPivot está considerado con un “proyecto hermano” de Mondrian. Al incorporarse Mondrian también lo ha hecho JPivot
Data Mining

Por supuesto, qué sería de una aplicación de BI sin Data Mining. Para tal fin, Pentaho está incorporando la tecnología WeKa . Decimos está incorporando, porque a día de hoy el roadmap de Pentaho indica que están en ello. Weka es una herramienta extensible e integrable que incluye herramientas para realizar transformaciones sobre los datos, tareas de clasificación, regresión, clustering, asociación y visualización. Aquí , puede encontrarse un manual en español.
ETL

Se trata de la joya de la corona.
Kettle es un proyecto belga que incluye un conjunto de herramientas para realizar ETL. Uno de sus objetivos es que el proyecto ETL sea fácil de generar, mantener y desplegar.
Se compone de 4 herramientas:
- SPOON: permite diseñar de forma gráfica la transformación ETL.
- PAN ejecuta la transformaciones diseñadas con SPOON.
- CHEF permite, mediante una interfaz gráfica, diseñar la carga de datos incluyendo un control de estado de los trabajos.
- KITCHEN permite ejecutar los trabajos batch diseñados con Chef.
Cuadros de Mando

Otras tecnologías con las que se complementa y que podemos incluir en nuestros desarrollos:

"Esperamos que esta explicación de Pentaho os sea de utilidad. Seguiremos informando sobre el tema. Si alguno de vosotros la ha probado también o la está usando, estaremos encantados de recibir vuestros comentarios"
Nestic-Todobi