Material Big Data

Lanzados ppts informativos de tecnologías BigData: Hadoop, Hbase, Hive, Zookeeper...

Apuntate al Curso de PowerBI. Totalmente práctico, aprende los principales trucos con los mejores especialistas

Imprescindible para el mercado laboral actual. Con Certificado de realización!!

Pentaho Analytics. Un gran salto

Ya se ha lanzado Pentaho 8 y con grandes sorpresas. Descubre con nosotros las mejoras de la mejor suite Open BI

LinceBI, la mejor solución Big Data Analytics basada en Open Source

LinceBI incluye Reports, OLAP, Dashboards, Scorecards, Machine Learning y Big Data. Pruébala!!

26 dic. 2018

Tutorial gratuito de Introduccion a Pentaho


Ya tenéis disponible el Curso de Introducción a Pentaho, con más de dos horas y media de duración, actualizado, que cubre todos los aspectos para crear potentes soluciones Business Intelligence y Data Warehouse, con gran cantidad de ejemplos prácticos, que esperamos os sea de utilidad

Se hace un repaso a todas las herramientas necesarias para la construcción de estas soluciones, indicando paso a paso como usarlas, así como ejemplos reales de aplicación.


El Tutorial cubre los siguientes apartados:

- ETL

- Metadatos
- Reporting
- Modelos Mondrian
- Analisis OLAP
- Cuadros de Mando
- Scorecards
- Big Data...





Puedes ver también el Tutorial de Creación de Cuadros de Mando Open Source

Diferencias entre Business Intelligence y Data Science (bien explicado)

Muy buena y clarificadora explicación, desde un punto de vista práctico de las diferencias entre estas dos disciplinas



Saber más:

Workshops Big Data Analytics en Madrid y Barcelona


2018 ha sido un buen año, en el que hemos vuelto a organizar nuestros workshops sobre tecnologías Open Source aplicadas al Big Data, Analytics, OLAP y Business Intelligence, en diferentes ciudades en España, así como también en algunas ciudades en Latam (Lima, Asunción, Santiago de Chile...) Hace unas semanas, cerrábamos de la mejor de las maneras, con el Workshop Big Data OLAP realizado en Madrid, en donde se cubrió todo el aforo (algunos amigos...

Como empezar a aprender Big Data en 2 horas


Big Data es uno de los hitos de estos últimos años. Son muchas las personas que quieren acercarse y conocer, primero lo más básico, para tener unas nociones generales. Pero resulta complicado encontrar una rápida guía, que en un par de horas, sirva para 'defendernos' en esto del Big Data, máxime si no se tienen altos skills técnicos Por ello, hemos recopilado una serie de infografías, presentaciones, webinar, demos y documentación para que...

Los mejores posts de TodoBI sobre Data Science durante el verano


Este verano os hemos traído material muy interesante, con muchos documentos y tutoriales. Aquí tenéis un resumen: Videotutorial: Usando R para Machine Learning con PowerBI septiembre 04, 2018  machine learning, powerBi, R  No comments Si te gusta el Business Intelligence, Machine Learning y conoces algo de R, no te puedes perder este Videotutorial: Temario del Videotutorial: 1º Posibilidades de R dentro...

Glosario de Inteligencia Artificial (AI)


Red neuronal artificial (RNA) Un algoritmo que intenta imitar al cerebro humano, con capas de "neuronas" conectadas que se envían información entre sí. Algoritmos de caja negra Cuando el proceso de toma de decisiones o la salida de un algoritmo no puede ser fácilmente explicado por el ordenador o el investigador detrás de él. Computer vision El campo de la I.A. se ocupa de enseñar a las máquinas a interpretar el mundo visual, es decir, a ver. Aprendizaje...

Machine Learning Demo Tutorial


En este demo tutorial (que puedes probar directamente en el enlace anterior), se han utilizado los datos de la cadena de heladerías para predecir las ventas en función de ciertas variables como el calendario laboral, la temperatura o el número de horas de apertura.  Para su implementación se ha seleccionado el algoritmo de regresión GBT (árboles potenciados por gradiente) y se ha utilizado la tecnología Apache Spark que permite...


24 dic. 2018

Workshop Big Data Analytics en Madrid y Barcelona


2018 ha sido un buen año, en el que hemos vuelto a organizar nuestros workshops sobre tecnologías Open Source aplicadas al Big Data, Analytics, OLAP y Business Intelligence, en diferentes ciudades en España, así como también en algunas ciudades en Latam (Lima, Asunción, Santiago de Chile...)

Hace unas semanas, cerrábamos de la mejor de las maneras, con el Workshop Big Data OLAP realizado en Madrid, en donde se cubrió todo el aforo (algunos amigos no pudieron entrar y ya lo sentimos). Para el 2019 haremos más!!

En este post, más adelante, tenéis el acceso a todas las presentaciones, papers, demos, etc...

Hoy os dejamos un resumen de dicho Workshop, con todas las presentaciones incluidas:





TEMARIO WORKSHOP ANALYTICS & BIG DATA


  • 0. Introducción al Workshop por Emilio Arias (Editor TodoBI.com y profesor Master BI-Big Data)
  • 1. Big Data Analytics: Concepto y arquitecturas
  • a. Definición e implantación en grandes empresas.
  • b. Lince BI - Big Data Stack: Solución completa para la implementación de un Data Lake.
  • c. Big Data Demos: Demostraciones interactivas de casos de uso usando las tecnologías anteriores.


  • 2. Apache Kylin: Consultas analíticas sub-segundo en Hadoop sobre billones de filas
  • a. Arquitectura y características principales.
  • b. Demostración práctica del funcionamiento de Kylin.
  • c. Presentación de un caso de uso real con Kylin.
  • d. Presente y futuro de Kylin y Kyligence.
  • 3. Vertica: Tecnología columnar y MPP para el Big Data estructurado
  • a. Arquitectura y características principales.
  • b. Demostración práctica del uso de Vertica.
  • c. Presentación de un caso de uso real con Vertica.
  • 4. Benchmark soluciones Big Data OLAP y conclusiones
Descarga todas las presentaciones, acceso a Demos y el Benchmark de Tecnologías Big Data OLAP (Vertica, Apache Kylin, PostgreSQL), incluyendo también la presentación de Luke Han (Apache Kylin) que también realizó en el Big Data Spain


Los amigos de , Iñigo Martínez Lasala y Alberto Miera, tras realizar su ponencia en el evento Workshop Tecnologías Big Data Analytics y Olap, organizado por




CEO de la herramienta explica el concepto “Kyligence”






Asistimos al evento Workshop Tecnologías Big Data Analytics y Olap organizado por . – en AC Hotel - Crew Lounge


6 dic. 2018

Todas las presentaciones y videos del Pentaho Community Meeting (PCM18) en Bolonia


Hace unos días, os detallábamos todo lo que había pasado en el evento anual de Pentaho. Hoy os traemos todas las presentaciones (tanto las grabaciones de las ponencias como las propias presentaciones). Un gran material!!!




















Toda la info desde la web de Hitachi Vantara

Se busca Analytics Front End Developer (Dashboard Samurai)


Nuestros compañeros de Stratebi (expertos en Data Analytics y creadores de LinceBI) están buscando un/a Dashboard Samurai (Analytics Frontend Developer)

Tu camiseta te está esperando. Escribe!!

Conocimientos Mínimos:
- HTML5
- CSS
- Javascript
- Bootstrap
- JQuery
- JSON
- APIs RestFul
- SQL
- Git

Conocimientos Recomendados:
- Chart.js
- D3.js
- Angular.js
- Leaflet.js
- Require.js
- Vue.js


Retribución:
- Según experiencia y conocimientos
- Se valorará el interés en conocer y aprender nuevos frameworks y tecnologías
- Habituado/a a trabajar con tecnologías open source
- Conocimientos de diseño gráfico
- Se valorará interés en aprender Big Data y Machine Learning

Ubicación:
- Se valorará presencial en Madrid y Barcelona 
- También la posibilidad de trabajo remoto 

New Pentaho Roadmap and Pentaho 8.2 available for download


Pentaho 8.2 its available!!! Download it, check all new features

Here you have fresh news about future Pentaho roadmap: Pentaho, 8.2, Pentaho 9 thanks to our friend Nelson Sousa, @UbiquisBI





Hace 8 ho

1 dic. 2018

Resumen del Pentaho Community Meeting (PCM18) en Bolonia


Durante los pasados días 23, 24 y 25 de Noviembre se ha celebrado la 11ª edición del Pentaho Community Meeting en Bolonia (Italia). Estuvimos allí y tenemos muchas cosas que contaros.

Se trató de la edición que contó con un mayor número de inscritos, cerca de 300 fans de Pentaho y nos hicimos con nuestra camiseta de la 11ª edición, para sumar a la colección

El evento se realizó además en un palacio, un punto todavía más espectacular en una ciudad muy recomendable. En este evento de 3 días no faltaron los Hackathons, cervezas, visitas turísticas, más cervezas.... que pueden acabar así:




Agenda:

En este enlace tenéis la Agenda de las más de 20 ponencias realizadas, divididas en sesiones generales (al comienzo) y Business and Technical tracks



Para tener un detalle de todo lo que se contó en el PCM18, nuestros amigos de IT-Novum, nos lo han detallado muy bien en su blog. Gran trabajo!!

Ver todo el hilo del PCM18 en twitter



Nuestros compañeros de Stratebi fueron la única empresa española representada (han estado en todos los PCM desde el comienzo), incluso con una ponencia sobre Big Data OLAP 




Muchos de los ponentes han ido compartiendo sus presentaciones, aquí os dejamos algunas de ellas:

Presentación de Matt Casters (creador de Kettle)




Presentación de Raimonds Simanovskis



Pedro Alves presentando el roadmap de Pentaho con muchas novedades muy interesantes (por cierto, la versión 8.2 está a punto de salir)













Presentación de Bart Maertens



22 nov. 2018

Curso de PowerBI, no te lo pierdas!!



Power BI es un conjunto de aplicaciones de análisis de negocios que permite analizar datos y compartir información. ¡Es la solución perfecta destinada a la inteligencia empresarial! (3 y 4 de Diciembre)

Conoce sus características técnicas



Con Power BI podrás crear potentes informes utilizando diferentes fuentes de datos: SAP HANA, MySQL, Teradata, IBM DB2, Dynamics Navision, CRM, SQL. Archivos de Excel, .CSV, JASON o descargar datos procedentes de servicios en línea como Facebook, Google Analytics, CRM de Salesforce, Marketo, MailChimp...

Curso Online de Power BI (temario y registro)


Fecha: Del 3 de dic. al 4 de dic. de 2018
Horario: 15:00 h - 21:00 h ( CEST - Madrid)
Lugar: Plataforma web con profesor 100% del tiempo



Big Data para PowerBI



Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...


Working together PowerBI with the best open source solutions



Here you can see a nice sample combining PowerBI with open source based Business Intelligence solutions, like LinceBI, in order to provide the most complete BI solution with an affordable cost - Predefined Dashboards - Adhoc Reporting - OLAP Analysis - Adhoc Dashboarding - Scorecards More info: - PowerBI functionalities - PowerBI traini...


12 nov. 2018

Las 25 mejores visualizaciones de 2018


Muy interesantes, echad un vistazo (Ver visualizaciones):

Visto en towards data science

9 nov. 2018

Curso de Machine Learning en Madrid (15 y 16 de Noviembre)

Si estás por Madrid los próximos jueves y viernes (15 y 16 de Noviembre), no te pierdas este curso, eminentemente práctico que organizan nuestros compañeros de Stratebi. Web del Curso (temario, metodología e inscripción)















 Público objetivo

  • Profesionales TIC: Consultores BI, Científicos de Datos...
  • Profesionales de Negocio: Que quieran reorientar su carrera profesional o tener los conocimientos necesarios para aplicar en sus empresas
  • Profesionales de Ciencias Aplicadas o Económicas: Matemáticos, Estadísticos, Físicos, Económicas, Empresariales, Técnicos, Informáticos...

 Observaciones

  • Metodología: El curso intercala partes teóricas en las que se imparten conceptos fundamentales para comprender los ejercicios prácticos que se imparten.
  • Requerimientos: Conceptos básicos de: Álgebra Linea y Cálculo. Los asistentes deberán venir con su propio equipo portátil
  • Entrega de Certificado: Todos los asistentes recibirán Certificado de Realización


 Temario

1. Introducción al Machine Learning

  • Técnicas
    • Clasificación
    • Regresión
    • Clustering
  • Preprocesamiento y Reducción dimensional
  • Selección de atributos
  • Evaluación del rendimiento
    • Matrices de confusión
    • Principales KPIs R2, MAE, MSE

2. Regresión (Predicción de valores continuos)

  • Principales algoritmos 
    • Ordinal Least Squares
    • Ridge Regression
    • Laso Regression
    • Elastic Net
  • Ejemplos

3. Clasificación (Identificación de la categoría a la que pertenece un objeto)

  • Principales algoritmos 
    • Logistic Regression
    • Support Vector Machines
    • KNearest Neighbors
    • Decision Trees
    • Random Forest
    • Multi-layer Perceptron
  • Ejemplos

4. Clustering (Agrupación de objetos similares en conjuntos)

  • Principales Algoritmos
    • KMeans
    • Spectral Clustering
    • DBSCAN
  • Ejemplos
Formación Machine Learning con Scikit-Learn librería Data Science (Anaconda con Python 3

29 oct. 2018

Que tipo de gráfico te gusta más?


New features for STReport (open source based reporting tool)


The new version of STReport comes with interesting new features:

STReport, which is part of the LinceBI suite and which integrates with Pentaho and many other solutions, you can see it in operation in the Online Demo


New features:


- Improvements in the visualization of statistics: New graphs have been introduced with Echarts. We remind you that to access this section is from the Pentaho Menu, View; STReport Statistics.





- Search for fields in categories: Allows you to filter the fields of the categories.



Info. About: New taskbar icon informs about tool version and compilation date



New possibilities of visualization and data export: Both in edit mode and in run mode, it has been added the possibility of exporting data to Excel without the template format. 
In other words, only data without logo, sections of the report are exported... In addition, the possibility of displaying the data in table form also in run mode has been introduced (in edit mode it was already possible to do so)



Minor bugs/improvements resolution: New multi-language labels added, revised formula definition, problems rendering STReport in an iframe, problems resizing browser window, date field filters...