TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Etiqueta: spark

Total 12 artículos

Databricks Spark + AI Summit 2020: Resumen de las principales novedades de Spark 3.0 y conferencias del evento

A finales del mes pasado (Junio 22-26) tuvo lugar el evento anual de Databricks, la conocida distribución cloud del motor de procesamiento distribuido Big Data y machine learning open source, Apache Spark. En esta ocasión, las circunstancias impuestas por el Covid-19 han motivado que el evento se desarrolle íntegramente online

Una introduccion a Dataiku

Dataiku es una herramienta colaborativa de tratamiento de datos donde pueden trabajar conjuntamente científicos de datos, ingenieros de datos y analistas de datos. A su vez tiene paneles dedicados a la monitorización de los equipos para ayudar a los gerentes de proyecto a controlar la actividad de su equipo. Descarga

Haciendo funcionar un Cluster Hadoop

Os mostramos un ejemplo de como hacer funcionar un Cluster Hadoop con ejemplos y aplicaciones prácticas: Se trata de un clúster Hadoop con la distribución de Hadoop de Hortonworks HDP 2.6.5, la cual es 100% open source e incluye las últimas versiones de Apache Hive, Spark, Kafka, Superset,