What we mean by/Qué queremos decir con “High-Performance Big-Data Analytics”?

2017-08-09T12:15:33+00:00 November 21st, 2015|

    ES    Hoy en día nos encontramos inmersos en un nuevo proceso en el que las "cosas" pasan del mundo físico al mundo digital y son accesibles desde cualquier dispositivo electrónico. El Cloud Computing es lo que hace posible que la tecnología digital penetre en todos los rincones de nuestra economía y la sociedad. Este nuevo escenario no sólo permite a los usuarios conectarse a través de sus dispositivos móviles al mundo digital que se avecina, sino que empieza también a permitir la conexión de cualquier objeto o dispositivo. Esto causará un diluvio de información digital, que se conoce como Big Data. Existen actualmente diferentes frameworks Big Data de código abierto que proporcionan los medios para lidiar con este diluvio de datos. Estos frameworks permiten abstraer [...]

Introducción práctica al Deep Learning con TensorFlow de Google – parte 1

2017-08-09T12:16:21+00:00 November 20th, 2015|

ACTUALIDAD: Nuevo libro sobre TensorFlow con el título  “HELLO WORLD EN TENSORFLOW para iniciarse en la programación del Deep Learning”, estará disponible para consultar en esta web a partir de su presentación el próximo lunes 1 de febrero. ¡Están todos invitados a la presentación! Versión en papel ya disponible en el portal lulu.com (y próximamente en el de amazon.com) y algunos ejemplares se podrán adquirir en la presentación.     NOTA: La información contenida en la  recopilación de les 8 post sobre TensorFlow  (este era el primero) se ha actualizado y ampliado completamente en este nuevo libro.      La prensa generalista como La Vanguardia o El País que encuentro en el restaurante donde voy a comer, ya llevan tiempo mencionando de manera tímida las palabras Deep Learning. Pero esto no ha hecho más que empezar, y sin duda [...]

Cursos que usan/usarán el libro INTRODUCCIÓN A APACHE SPARK

2017-08-09T12:16:31+00:00 October 30th, 2015|

A continuación encontrarán una lista de los cursos que están usando/usarán el libro INTRODUCCIÓN A APACHE SPARK para empezar a programar el Big Data editado por la editorial UOC de los autores Mario Macías, Mauro Gómez, Rubèn Tous y Jordi Torres. En cada curso indicamos la persona de contacto por si es de vuestro interés conocer más detalle de las asignaturas o masters en cuestión. Si tienen un curso que usa el libro y quieren que su curso aparezca en esta lista, pueden enviar la información a nuestra cuenta de correo Libro.Spark@gmail.com.   Asignatura Big Data & Data Mining del master MASTEAM (Master's degree in Applied Telecommunications and Engineering Management) en la Castelldefels School of Telecommunications and Aerospace Engineering (EETAC) de la University Politècnica de Catalunya - UPC Barcelona Tech. Responsable de la asignatura: Cristina [...]

Acte de presentació del nou llibre INTRODUCCIÓN A APACHE SPARK para programar el Big Data

2017-08-09T12:16:44+00:00 October 18th, 2015|

En nom dels autors em complau informar-vos en primícia de la presentació del llibre INTRODUCCIÓN A APACHE SPARK para empezar a programar el Big Data de l'editorial UOC . Es tracta del primer llibre sobre Apache Spark escrit en castellà amb el suport de MATEI ZAHARIA (creador d'Spark, CTO a Databricks i vicepresident d'Apache Spark) que n'ha escrit el pròleg . L'acte serà presentat per ALEIX RUIZ DE VILLA ,director Data Science de La Vanguardia, i comptarà amb la participació de MARC TORRENT, Director del Big Data Center of Excellence Barcelona, entitat organizadora del BIG DATA CONGRESS que es celebra el mateix dia a Barcelona i en el marc on es presenta aquest llibre sobre el Big Data. Us esperem dimarts, 3 de novembre a les 19.00 h., a l'Aula Master de l'edifici A3 [...]

New Big Data position in our research group: Junior Developer in multimedia big data analytics

2017-08-09T12:16:54+00:00 October 9th, 2015|

Hi, are you interested to join BSC team? BSC-CNS (Barcelona Supercomputing Center – Centro Nacional de Supercomputación) is the National Supercomputing Facility in Spain and manages MareNostrum, one of the most powerful supercomputers in Europe. Currently we are over 400 staff from 41 countries.  To get an idea of what its like to work at the BSC take a look at this video: https://www.youtube.com/watch?v=VRkEii7OzRE Attached you will find information of a new position in our research group autonomic systems and ebusiness platforms at BSC. The candidate will be incorporated at full-time to the "Autonomic Systems and eBusiness Platforms" research line from BSC. Candidate's main task will be oriented toward the development and support for the assigned tasks to the research group in the Computer Vision and Big Data Analytics [...]

Barcelona Spark Meetup: Nueva temporada de actividades otoño-invierno 2015/16

2017-08-09T12:17:07+00:00 October 4th, 2015|

Este mes de Octubre empezamos nueva temporada del Barcelona Spark Meetup con más de 900 miembros. Gracias a todos por vuestro soporte al meetup!. A continuación podéis ver la lista de actividades programadas para esta nueva temporada otoño-invierno. Empezamos en Octubre con una conferencia excepcional de Chris Fregly del  IBM Spark Technology Center de San Francisco en California. Todo un honor para Barcelona tener a Chris entre nosotros.  Recordar que a finales de Octubre hay el primer Spark Summit en Europa. Si estáis interesados en asistir y sois miembros de nuestro meetup podéis obtener un descuento del 10% usando el código . Para Noviembre hemos organizado un meetup conjuntamente con el Barcelona R Users Group y el Barcelona Machine Learning Study Group para hablar de la combinación de Spark, R y Machine Learning. Para este encuentro tenemos el lujo de disponer de [...]

Marenostrum visit with Supercomputer Architecture students

2017-08-09T12:15:43+00:00 September 16th, 2015|

Enclosed you will find some pictures of our visit with David Vicente. Thank you David for the explanations. we really enjoyed the visit an it will be very useful for my course. Now, you can see some pictures from last year visit with Sergi Girona. Thank you Sergi for your explanations, we really enjoyed the visit and was an excellent introduction to the course.

Ya está disponible la nueva versión de Apache Spark 1.5

2017-08-09T12:15:50+00:00 September 11th, 2015|

Apache Spark es actualmente uno de los paquetes de código abierto más importantes en el espacio del Big Data y por el que importantes empresas como IBM, SAP, Oracle o Amazon han apostado, siendo asimismo grandes contribuidores. Hace unos días avanzábamos en este blog que estábamos a las puertas de la nueva versión de Apache Spark.   Pues ya lo tenemos aquí, hace un par de días el equipo de Spark lo anunció. Destaca el hecho que se ha contado con 230 contribuidores  y más de 1,400 commits. Si nos fijamos en el siguiente gráfico podemos ver como Apache Spark continua creciendo en número de contribuidores, la mejor garantía de buena salud de un proyecto open source [1]: En el blog de Databricks podemos encontrar un post de Reynold Xin and Patrick [...]

Our research group at BSC is opening 2 Positions to collaborate with research project

2017-08-09T12:15:54+00:00 September 9th, 2015|

  If you are interested to join BSC now you have an opportunity in one of the two open positions. POSITION 1:  Junior Developer The candidate will be incorporated at full time to the "Autonomic Systems and eBusiness Platforms" research line from BSC. Candidate's main task will be oriented toward the development and support for the assigned tasks to the research group in the ASCETiC project funded by the European Commission in its 7th Frame Program. Two types of tasks can be differentiated: Tasks supporting project management: the candidate must collaborate in the daily project management. This includes the organization/attendance of/to conference calls, travelling to project meetings, preparation of presentations, deliverables writing, etc. Tasks supporting technical developments: the candidate must collaborate in the design and implementation of [...]

Ya disponible en fase de pruebas la nueva versión Spark 1.5

2017-08-09T12:16:01+00:00 August 26th, 2015|

Sin duda la velocidad de crucero que lleva Databricks es difícil de seguir. Hace unos días, mientras estábamos dando una conferencia con la gente de Databricks y explicándoles que  teníamos totalmente operativa la versión 1.4 de Spark en el supercomputador Marenostrum, ellos va y hacen pública la versión 1.5 de Spark! Desde esta semana Databricks permite probar en su Cloud Databricks la nueva versión de Spark, la 1.5.0. Si les interesa pueden pedir una cuenta de prueba para 30 días en esta página. La versión oficial será liberada dentro de unas semanas. Si están interesados en saber más detalles les recomiendo la presentación que realizará Patrick Wendell, este jueves a las 7 de la tarde (hora española) que pueden seguir por internet. En esta nueva versión de Spark, con aportaciones de más de 220 contribuidores, podemos encontrar nuevos algoritmos [...]

¿Cómo puede mejorar el “internet de las cosas” metrópolis como Barcelona?

2017-08-09T12:16:07+00:00 July 30th, 2015|

El Internet de las Cosas ya está aquí y, sin duda, ha venido para quedarse. A pesar de que para mucha gente sea invisible y aún no sea consciente de ello, ya está aquí y nos acompaña a todas partes. Básicamente se trata de tres cosas: conectar miles de millones de objetos (sensores, ropa, coches, relojes, maquinaria, etc.); recoger la información que estos han obtenido; y analizar esta información para extraer conocimiento. Se calcula que 50 mil millones de computadoras, teléfonos inteligentes y sensores de todo tipo estarán conectados a través de internet en 2020, hecho que augura un mercado de miles de millones. Sus aplicaciones son muy diversas, y una de ellas es conseguir unas ciudades más sostenibles. Un objetivo muy de actualidad y que afecta [...]

Big Data Analytics and Bikes: Tour de France

2017-08-09T12:19:26+00:00 July 19th, 2015|

Are you a fan of le Tour de France?. For the first time in Tour de France history, all riders racing in this year’s event have GPS on their bikes (placed under each rider’s bicycle seat). The data collected from this device includes:  the stage winner’s top speed, average speed and time per kilometer;  the fastest riders up key climbs; the speed of the winner at the finish line; the top speed achieved by a rider on the day; average speed across all riders; among others With this information the global service provider Dimension Data provides real-time information on each of the 200 riders as they travel 3,360 kilometers  in 21 stages. For instance, do you now that for the first 11 stages we know that (source): The highest speed [...]