Apache Atlas [https://atlas.apache.org/2.0.0/index.html] es una herramienta
open-source, con licencia Apache 2.0, para la gobernanza del dato la cual
permite la integración con todo el ecosistema de datos de las empresas. Puedes
descargarte un paper en español
[http://stratebi.es/todobi/May20/
Leer más...
Si te has encontrado con estos problemas en tu organización, esta presentación
[https://www.slideshare.net/zanorte/9-problemas-en-proyectos-data-analytics] te
será de gran utilidad:
Leer más...
Hace unas pocas semanas, más de 300 apasionados del deporte, del futbol sobre
todo, y de los datos, se reunieron en el Workshop práctico de algo más de dos
horas que realizaron los compañeros de Stratebi
[https://www.stratebi.com/sports-analytics]
Os dejamos el enlace en donde podéis tener acceso
Leer más...
En el mundo de ciencia de datos, en Python son indispensables dos librerías que
introducen las estructuras fundamentales para representar y manipular los datos:
numpy con su array N-dimensional y pandas con su Series y DataFrame. Son la base
de cualquier software científico y de análisis de datos, como SciPy
Leer más...
Os dejamos un paper bien completo de una de las herramientas más completas de
integración, Talend, que además, como sabéis, tiene también una versión Open
Source
Hoy os podéis descargar directamente desde aquí
[http://stratebi.es/todobi/May20/Talend_Cloud.pdf], este completo paper, en
donde abordamos algunas de las
Leer más...
The use of Business Intelligence (BI) systems usually gets a very fast and
interactive response when using dashboards, reports and detailed analytical
queries. BI applications that meet this interactive processing requirement are
known as OLAP (On-Line Analytical Processing) applications.
However, when we work with data sources with Big Data features
Leer más...
En este enlace [https://github.com/vertica/awesome-vertica] tenéis una muy buena
recopilación de enlaces sobre la mejor base de datos analítica, con tiempos que
mejoran en más de 5 a 10 veces los conseguidos con bases relacionales
tradicionales. En TodoBI hemos publicado mucho sobre Vertica. Síguelo en el tag
Leer más...
1. Novedades Pdi 9.0
Las principales novedades de PDI 9.0
[https://help.pentaho.com/Documentation/9.0/What's_new_in_Pentaho_9.0] son las
siguientes:
Multi-clúster de Hadoop
* Los usuarios pueden acceder y procesar datos de múltiples clústeres de
Hadoop, de diferentes distribuciones y versiones,
Leer más...
Dado que existen muchos algoritmos, como hemos venido contando ultimamente
[https://todobi.com/tag/machine%20learning/], os vamos a dar unas pistas para
ayudaros:
1. Cuando usar Machine Learning
Lo primero que tenemos que tener en cuenta es que, aunque hablar y usar Machine
Learning es una tendencia y es
Leer más...