Barcelona Spark Meetup Announces Changes in Leadership Team to accommodate its rapid growth

2017-08-09T12:14:28+00:00 January 13th, 2016|

Today, Barcelona Spark Meetup announces changes in its leadership team. Joan Capdevila, a current co-organizer, will be appointed new head organizer to accommodate the rapid growth of our meetup. Ferran Galí, a member from the very first beginning, will join the leadership team as a co-organizer in the area of Big Data platforms. The former head organizer, Jordi Torres, will remain a while longer in the team as co-organizer centering his activity in the area of Advanced Analytics. This change is motivated by the fact that Apache Spark is growing beyond its limits with more technologies seeking integration with it. The new leadership will guide this period where our meetup members not only wants to follow the innovation coming from Apache Spark community, but they also hope to [...]

Spark Summit: Stories about Spark, HPC and Barcelona

2017-08-09T12:15:26+00:00 November 25th, 2015|

Dear readers, I’m a little bit late posting this information, but I have been up to my eyes with work!. Few weeks ago I attended the European Spark Summit held in Amsterdam. It was a wonderful opportunity to meet and talk with the spark community. The summit started with Matei Zaharia, who talked about how spark usage is evolving and Ion Stoica talking about how Spark is entering into enterprises. There were a lot of interesting presentations. You can download them and see the recorded video presentations on this web site. BSC also gave a presentation where we presented what we are doing with Spark in our research supercomputing center in Barcelona. Below you can find the slides that we presented. Attending the summit also gave us the opportunity [...]

Cursos que usan/usarán el libro INTRODUCCIÓN A APACHE SPARK

2017-08-09T12:16:31+00:00 October 30th, 2015|

A continuación encontrarán una lista de los cursos que están usando/usarán el libro INTRODUCCIÓN A APACHE SPARK para empezar a programar el Big Data editado por la editorial UOC de los autores Mario Macías, Mauro Gómez, Rubèn Tous y Jordi Torres. En cada curso indicamos la persona de contacto por si es de vuestro interés conocer más detalle de las asignaturas o masters en cuestión. Si tienen un curso que usa el libro y quieren que su curso aparezca en esta lista, pueden enviar la información a nuestra cuenta de correo Libro.Spark@gmail.com.   Asignatura Big Data & Data Mining del master MASTEAM (Master's degree in Applied Telecommunications and Engineering Management) en la Castelldefels School of Telecommunications and Aerospace Engineering (EETAC) de la University Politècnica de Catalunya - UPC Barcelona Tech. Responsable de la asignatura: Cristina [...]

Acte de presentació del nou llibre INTRODUCCIÓN A APACHE SPARK para programar el Big Data

2017-08-09T12:16:44+00:00 October 18th, 2015|

En nom dels autors em complau informar-vos en primícia de la presentació del llibre INTRODUCCIÓN A APACHE SPARK para empezar a programar el Big Data de l'editorial UOC . Es tracta del primer llibre sobre Apache Spark escrit en castellà amb el suport de MATEI ZAHARIA (creador d'Spark, CTO a Databricks i vicepresident d'Apache Spark) que n'ha escrit el pròleg . L'acte serà presentat per ALEIX RUIZ DE VILLA ,director Data Science de La Vanguardia, i comptarà amb la participació de MARC TORRENT, Director del Big Data Center of Excellence Barcelona, entitat organizadora del BIG DATA CONGRESS que es celebra el mateix dia a Barcelona i en el marc on es presenta aquest llibre sobre el Big Data. Us esperem dimarts, 3 de novembre a les 19.00 h., a l'Aula Master de l'edifici A3 [...]

Barcelona Spark Meetup: Nueva temporada de actividades otoño-invierno 2015/16

2017-08-09T12:17:07+00:00 October 4th, 2015|

Este mes de Octubre empezamos nueva temporada del Barcelona Spark Meetup con más de 900 miembros. Gracias a todos por vuestro soporte al meetup!. A continuación podéis ver la lista de actividades programadas para esta nueva temporada otoño-invierno. Empezamos en Octubre con una conferencia excepcional de Chris Fregly del  IBM Spark Technology Center de San Francisco en California. Todo un honor para Barcelona tener a Chris entre nosotros.  Recordar que a finales de Octubre hay el primer Spark Summit en Europa. Si estáis interesados en asistir y sois miembros de nuestro meetup podéis obtener un descuento del 10% usando el código . Para Noviembre hemos organizado un meetup conjuntamente con el Barcelona R Users Group y el Barcelona Machine Learning Study Group para hablar de la combinación de Spark, R y Machine Learning. Para este encuentro tenemos el lujo de disponer de [...]

Ya está disponible la nueva versión de Apache Spark 1.5

2017-08-09T12:15:50+00:00 September 11th, 2015|

Apache Spark es actualmente uno de los paquetes de código abierto más importantes en el espacio del Big Data y por el que importantes empresas como IBM, SAP, Oracle o Amazon han apostado, siendo asimismo grandes contribuidores. Hace unos días avanzábamos en este blog que estábamos a las puertas de la nueva versión de Apache Spark.   Pues ya lo tenemos aquí, hace un par de días el equipo de Spark lo anunció. Destaca el hecho que se ha contado con 230 contribuidores  y más de 1,400 commits. Si nos fijamos en el siguiente gráfico podemos ver como Apache Spark continua creciendo en número de contribuidores, la mejor garantía de buena salud de un proyecto open source [1]: En el blog de Databricks podemos encontrar un post de Reynold Xin and Patrick [...]

Ya disponible en fase de pruebas la nueva versión Spark 1.5

2017-08-09T12:16:01+00:00 August 26th, 2015|

Sin duda la velocidad de crucero que lleva Databricks es difícil de seguir. Hace unos días, mientras estábamos dando una conferencia con la gente de Databricks y explicándoles que  teníamos totalmente operativa la versión 1.4 de Spark en el supercomputador Marenostrum, ellos va y hacen pública la versión 1.5 de Spark! Desde esta semana Databricks permite probar en su Cloud Databricks la nueva versión de Spark, la 1.5.0. Si les interesa pueden pedir una cuenta de prueba para 30 días en esta página. La versión oficial será liberada dentro de unas semanas. Si están interesados en saber más detalles les recomiendo la presentación que realizará Patrick Wendell, este jueves a las 7 de la tarde (hora española) que pueden seguir por internet. En esta nueva versión de Spark, con aportaciones de más de 220 contribuidores, podemos encontrar nuevos algoritmos [...]

“Big Data Analytics and Apache Spark”

2017-08-09T12:19:45+00:00 July 4th, 2015|

Enclosed you will find the slides of my conference "Big Data Analytics and Apache Spark" held at UPC on June 15th. This conference is one of the  1st anniversary  events of our of Barcelona Spark Meetup!. The presentation was already distributed to the attendees but here I leave a copy for those who could not come and are interested in its content  (We are already over 800 members!). I hope you find the slides useful.  (PDF Link) Two pictures of the event: (thank you  Nacho!):  

Conferència: Present i futur del Big Data

2017-08-09T12:20:12+00:00 June 13th, 2015|

Gràcies a tots i a totes per l'acollida de la conferència del proper dilluns dins dels actes del 1r aniversari del Barcelona Spark Meetup. Hem canviat de sala per donar més cabuda i ara la conferència serà a la sala d'Actes del Vèrtex ( UPC - Campus Nord - Edifici Vèrtex, Planta S-1). Plaça Eusebi Güell, 6 , Barcelona (map) dilluns 15 de juny de 18:00 a 19:00. Parlarem del Big Data i les seves implicacions, fent una referencia especial a la technologia Apache Spark, que ha vist una ràpida adopció per les empreses d'una àmplia gamma de sectors. Intentarem explicar el perquè de tot plegat donant una visió introductòria des d'un punt de vista tècnic debatent alhora les implicacions de l'aparició d'aquesta nova tecnologia. La presentació serà en català però les [...]

Conferència: Introducció a la tecnologia Apache Spark

2017-08-09T12:20:26+00:00 May 30th, 2015|

Dins dels actes del 1r aniversari del Barcelona Spark meetup s'ha volgut fer alguns actes en format de portes obertes. En aquest sentit s'ha programat aquesta conferència oberta a un públic tècnic però encara no iniciat en el món de l'Apache Spark en la que parlarem aquesta tecnologia emergent en el món del Big Data.  Apache Spark es un potent motor open source de processat i anàlisi de dades  desenvolupat originalment  a la University de Berkeley  en el 2009 i que al 2013 ja es va fundar una empresa al voltant d'aquest projecte, l'empresa Databricks. Des del seu llançament Spark ha vist una ràpida adopció per les empreses d'una àmplia gamma d'indústries. En aquests moments potències d'Internet com Yahoo o Baidu ja han desplegat Spark. El mateix hem fet al BSC sobre [...]

1r aniversario del Barcelona Spark Meetup

2017-08-09T12:20:32+00:00 May 30th, 2015|

Hace ahora un año que pusimos en marcha el Barcelona Spark Meetup, un grupo alrededor de Apache Spark, una de las tecnologías Big Data que más ha crecido últimamente. Junto al BSC, dan apoyo a esta iniciativa la UPC, la FIB, FIB Alumni,  itnig y COEINF. El grupo cuenta  ya con más de 600 miembros de perfiles diversos: ingenieros de datos, profesores, estudiantes, investigadores, científicos de datos y profesionales de machine learning e inteligencia artificial. Con motivo de este primer aniversario,  desde Barcelona Spark Meetup se han organizado 4 actividades alrededor de Apache Spark: Barcelona Apache Spark Workshop 2015 (en inglés): 2, 5, 8, & 12 junio. UPC Campus Nord. Los estudiantes del Máster Internacional de Innovación e Investigación de la FIB han preparado unas presentaciones, en total 8 horas, que ofrecen una visión completa de [...]

Integración de Apache Spark y Cassandra en Barcelona

2017-08-09T12:23:10+00:00 April 6th, 2015|

Para el próximo Barcelona Spark Meetup hemos preparado una presentación del trabajo que estamos llevando a cabo en nuestro grupo de investigación en el BSC con Spark. Aprovecharemos para contar las última “news” del Spark Summit 2015 del próximo Marzo que se celebra en New York donde el BSC presenta la ponencia “multi-modal big data analysis within the Spark ecosystem in Marenostrum supercomputer” además de contar también nuestra experiencia de colaboración con el departamento de aplicaciones del BSC (CASE) utilizando Apache Spark y Cassandra para optimizar el acceso a su repositorio de datos de simulaciones realizadas con el software Alya. La Charla irá a cargo de Cesare Cugnasco, ingeniero de investigación del Barcelona Supercomputing Center el próximo Miercoles 8 de Abril del 2015 a las 19:00 de la tarde en ITNIG (C/àlaba 61, 5-2. Barcelona - map). Como [...]