La física de partículas consigue que la máquina aprenda el tratamiento a medida que se multiplican los datos del colisionador
The Tech Crunch
Por Devin Coldewey, para The Tech Crunch Mayo 5 de 2018
El volumen de datos que los físicos de partículas deben sortear en el Gran Colisionador de Hadrones es asombroso, y está por aumentar en un orden de magnitud. Para hacer frente a este torrente de datos, CERN está recurriendo al aprendizaje automático, que ofrece premios para los modelos de Inteligencia Artificial que pueden atravesar el desorden y ayudar a hacer el próximo avance.
Dentro de los detectores masivos que salpican los anillos del LHC, los protones acelerados a la velocidad de la luz cercana se estrellan entre sí con una energía increíble y producen una fuente de partículas exóticas de corta vida que impactan en los sensores que cubren las paredes. Las mejoras realizadas en los campos magnéticos que guían a estos protones alrededor del anillo significan que, una vez que podría esperar un par de docenas de colisiones para obtener datos, pronto habrá cientos.
Ideal para los científicos, pero con más colisiones viene más información, en este caso un orden de magnitud más. Los viejos métodos de clasificar y categorizar los datos son demasiado lentos, le dijeron los investigadores a Nature. Así que están haciendo lo que cualquier científico de datos moderno haría cuando se enfrentara a un conjunto masivo de datos ruidosos: entregárselo a los AI.
Uso el término libremente, por supuesto, los modelos de aprendizaje automático son realmente geniales para masticar grandes cantidades de datos en busca de lo que han sido entrenados para encontrar. La práctica de la medicina, la astronomía y, por supuesto, la psicología (cortesía de Facebook) han sido avanzadas por esta práctica capacidad de separar el trigo estadístico de la paja. La física de partículas es solo otro ejemplo de ello.
Una pequeña competencia saludable, como siempre, es una buena forma de poner en marcha el campo. Así que CERN estableció TrackML, un concurso relativamente discreto en el que los físicos y los científicos de datos pueden descargar conciertos de datos reales de colisionadores y entrenar modelos para clasificarlos correctamente. Por supuesto, hay terabytes disponibles para la selección, pero querrá usar este conjunto de datos en particular.
El pozo de premios es relativamente pequeño, con un total de $ 25,000 disponible para los ganadores. Tal vez usaron todo su dinero en ... ya sabes, actualizando el colisionador de partículas más grande del mundo con cryomagnets de última generación.
No hay tarifa de inscripción, así que si estás interesado en darle una oportunidad, dirígete a Kaggle, donde se realiza el concurso, y descarga tu propia copia de los datos. Tienes mucho tiempo: las presentaciones deben enviarse en agosto. Ah, y todo lo que envíes será de fuente abierta, así que no te preocupes porque van a comercializar tu algoritmo.
With a tiny help from Google
The Tech Crunch
Por Devin Coldewey, para The Tech Crunch Mayo 5 de 2018
El volumen de datos que los físicos de partículas deben sortear en el Gran Colisionador de Hadrones es asombroso, y está por aumentar en un orden de magnitud. Para hacer frente a este torrente de datos, CERN está recurriendo al aprendizaje automático, que ofrece premios para los modelos de Inteligencia Artificial que pueden atravesar el desorden y ayudar a hacer el próximo avance.
Dentro de los detectores masivos que salpican los anillos del LHC, los protones acelerados a la velocidad de la luz cercana se estrellan entre sí con una energía increíble y producen una fuente de partículas exóticas de corta vida que impactan en los sensores que cubren las paredes. Las mejoras realizadas en los campos magnéticos que guían a estos protones alrededor del anillo significan que, una vez que podría esperar un par de docenas de colisiones para obtener datos, pronto habrá cientos.
Ideal para los científicos, pero con más colisiones viene más información, en este caso un orden de magnitud más. Los viejos métodos de clasificar y categorizar los datos son demasiado lentos, le dijeron los investigadores a Nature. Así que están haciendo lo que cualquier científico de datos moderno haría cuando se enfrentara a un conjunto masivo de datos ruidosos: entregárselo a los AI.
Uso el término libremente, por supuesto, los modelos de aprendizaje automático son realmente geniales para masticar grandes cantidades de datos en busca de lo que han sido entrenados para encontrar. La práctica de la medicina, la astronomía y, por supuesto, la psicología (cortesía de Facebook) han sido avanzadas por esta práctica capacidad de separar el trigo estadístico de la paja. La física de partículas es solo otro ejemplo de ello.
Una pequeña competencia saludable, como siempre, es una buena forma de poner en marcha el campo. Así que CERN estableció TrackML, un concurso relativamente discreto en el que los físicos y los científicos de datos pueden descargar conciertos de datos reales de colisionadores y entrenar modelos para clasificarlos correctamente. Por supuesto, hay terabytes disponibles para la selección, pero querrá usar este conjunto de datos en particular.
El pozo de premios es relativamente pequeño, con un total de $ 25,000 disponible para los ganadores. Tal vez usaron todo su dinero en ... ya sabes, actualizando el colisionador de partículas más grande del mundo con cryomagnets de última generación.
No hay tarifa de inscripción, así que si estás interesado en darle una oportunidad, dirígete a Kaggle, donde se realiza el concurso, y descarga tu propia copia de los datos. Tienes mucho tiempo: las presentaciones deben enviarse en agosto. Ah, y todo lo que envíes será de fuente abierta, así que no te preocupes porque van a comercializar tu algoritmo.
With a tiny help from Google