Participez au challenge data 2018 !

Des challenges de traitement de données sont organisés par l’équipe Data de l’ENS, pour mettre en relation les entreprises avec d’excellents étudiants, ingénieurs et chercheurs en traitement de données.

logo_challenge_data

Les challenges proposés par des entreprises ou des laboratoires sont issus de problématiques concrètes qu’ils rencontrent dans leurs activités. Ils sont organisés sous forme de compétitions d’apprentissage statistique, par le site web challengedata.ens.fr (à la manière de Kaggle). Plus de 2000 étudiants, chercheurs et ingénieurs ont participé à ces challenges en 2017.

Cette initiative s’inscrit dans un esprit d’échange scientifique, avec un partage de données et de résultats.

Les données mises à disposition par les entreprises et laboratoires doivent être non-confidentielles. Les rapports algorithmiques des étudiants et des chercheurs sont mis à disposition des entreprises.

La  plate-forme web assure les échanges de données et l’évaluation automatique des résultats des participants. L’évolution des scores et du classement est visible en temps réel.

Pourquoi participer ?

Les challenges offrent aux entreprises un accès aux algorithmes les plus performants, quel que soit le problème proposé, grâce au classement en direct des résultats et à la diversité des participants.

Les entreprises peuvent nouer des contacts avec les meilleurs étudiants Français et les professionnels participant à leur challenge.

Cela se fait lors de la présentation des challenges au Collège de France, par courriel en cours de challenge, et lors de la cérémonie de clôture, à l’Institut Henri Poincaré. Ces mises en contact ont donné lieu à de nombreux stages et embauches au cours des années précédentes.

Quels types de projet ?

Chaque entreprise peut proposer un problème d’apprentissage supervisé (classification,  régression, prédiction, ranking…), en mettant à disposition des données d’entraînement et de test.

Tous types de données sont acceptés, qu’il s’agisse de signaux médicaux, images, vidéos, mesures physiques, sons, séries financières, textes, questionnaires marketing, suivi de clics sur le web, etc.

Il est recommandé de définir un problème intéressant et relativement facile à comprendre pour les participants, même si sa résolution peut être très difficile et mettre en jeu des algorithmes sophistiqués.

 

Comment participer ?

Nous vous invitons à déposer un projet le plus tôt possible avant le 13 octobre 2017, par courriel à challenge.data@ens.fr. Merci de faire figurer dans votre soumission (au plus une page A4) :
– le nom de l’entreprise et une brève description de ses activités ;
– les nom et courriel du responsable du projet ;
– la définition du projet d’apprentissage supervisé, en précisant s’il s’agit d’un problème de classification, régression, prédiction, ranking… ;
– une description des variables d’entrée (x) et des variables à prédire (y), en précisant le nombre d’exemples, répartis entre entraînement et test ;
– une métrique permettant de quantifier les erreurs de prédiction sur y ;
– une proposition d’algorithme simple pour obtenir un premier résultat de prédiction sur les données (qui sera implémenté).

 

Calendrier

  • Jusqu’au 13 octobre 2017 : réception des projets
  • Fin octobre à décembre 2017 : sélection, finalisation et intégration des projets
  • Janvier 2018 : présentation des projets au Collège de France
  • Janvier à décembre 2018 : compétition en ligne.
En savoir plus