A finales del mes pasado (Junio 22-26) tuvo lugar el evento anual de Databricks,
la conocida distribución cloud del motor de procesamiento distribuido Big Data
[http://bigdata.stratebi.com/] y machine learning open source, Apache Spark. En
esta ocasión, las circunstancias impuestas por el Covid-19 han motivado que el
evento
Leer más...
Dataiku [https://www.dataiku.com/] es una herramienta colaborativa de
tratamiento de datos donde pueden trabajar conjuntamente científicos de datos,
ingenieros de datos y analistas de datos. A su vez tiene paneles dedicados a la
monitorización de los equipos para ayudar a los gerentes de proyecto a controlar
la actividad
Leer más...
This is a must. If you need extra info for this tools don´t hesitate to read
this blog or write us. You can check more of this technologies in action here
Big Data Lab [http://bigdata.stratebi.com]
Leer más...
Os mostramos un ejemplo de como hacer funcionar un Cluster Hadoop con ejemplos y
aplicaciones prácticas:
Se trata de un clúster Hadoop con la distribución de Hadoop de Hortonworks HDP
2.6.5, la cual es 100% open source e incluye las últimas versiones de Apache
Hive, Spark, Kafka, Superset,
Leer más...
[http://stratebi.es/TodoBi/Jul19/BigData_Quality.pdf]
Las empresas cada vez necesitan almacenar y procesar más datos sobre sus
clientes, proveedores, personal o pedidos.
Sin embargo, a mayor Volumen de datos, mayor es la probabilidad de que existan
datos incorrectos, como las direcciones o teléfonos que afecten de forma
Leer más...
[http://bigdata.stratebi.com/]
En las siguientes Aplicaciones, Cuadros de Mando y ejemplos podéis ver el
funcionamiento práctico del Big Data en diferentes casos y usando diferentes
tecnologías: Kafka, Spark, Apache Kylin, Neo4J....
Acceder a los ejemplos [http://bigdata.stratebi.com/]
Si quieres saber más de Big Data, te pueden
Leer más...
[http://bigdata.stratebi.com/spark-streaming/index.htm]
Acceso Dashboard online [http://bigdata.stratebi.com/spark-streaming/index.htm]
Al abrirse la página de esta demostración, se solicita una conexión con el end
pointque provee los datos de la wikipedia, mediante un WebSocket
[https://es.wikipedia.org/wiki/WebSocket].
Enel servidor se
Leer más...
We could consider three types of Real Time when we manage data and depends on
each stage:
1. Real Time Processing: Is the possibility of ingest data at the time the event
is produced in real live. This includes only processing step, i.e copying data
from source to destiny
Leer más...
[https://4.bp.blogspot.com/--ux7WT5mxWc/W3bPM5ugd0I/AAAAAAAAEI4/LqceYejlfmE5_KcEyQomvfr5kX6K9JP-gCLcBGAs/s1600/ML_Spark2.png]
Uno de los capítulos más interesante del curso ' Curso de Data Engineers', de
nuestros compañeros de Stratebi [http://www.stratebi.com/] es el 11. Machine
Learning con Spark
Este curso incluye ejercicios prácticos sobre
Leer más...