Participez au Challenge Data

Challenge data, qu’est-ce que c’est ?

Avec le soutien de la Fondation Sciences Mathématiques de Paris et la chaire CFM-ENS Modèles et Sciences des Données, l’École normale supérieure (Ulm) organise au cours de l’année universitaire 2016-2017 des compétitions d’apprentissage statistique (à la manière du site Kaggle) destinées à des étudiants en master et doctorat, avec la participation de chercheurs. Ces challenges sont proposés par des entreprises et sont issus de problématiques concrètes qu’elles rencontrent dans leur activité. Ils s’inscrivent dans un esprit d’échange scientifique, avec un partage de données et résultats : les données mises à disposition par les entreprises doivent être non-confidentielles, et les rapports algorithmiques des élèves et des chercheurs sont mis à disposition des entreprises. Une plate-forme web dédiée, challengedata.ens.fr, assure les échanges de données et l’évaluation automatique des résultats des participants.

Pourquoi participer au Challenge data ?

Ces challenges offrent aux entreprises la possibilité d’avoir accès aux résultats des algorithmes les plus performants, quel que soit le problème proposé, grâce à un classement permanent des résultats des participants. De plus, la présentation des projets et des entreprises à l’École normale supérieure et la  cérémonie de clôture permettent aux entreprises de rencontrer et d’évaluer d’excellents étudiants, en vue d’un stage par exemple, et de discuter avec des chercheurs de leurs problèmes techniques. De nombreux masters en statistiques et sciences des données sont partenaires de cette compétition, dont les masters Mathématiques, Vision et Apprentissage (MVA) de l’Ecole normale supérieure (Cachan), Data Science de l’université Paris Saclay, MASH de l’université Paris-Dauphine et Mathématiques appliquées de l’université Pierre et Marie Curie.

Quels types de projet sont attendus ?

Chaque entreprise propose un problème d’apprentissage supervisé (classification ou régression), en mettant à disposition pour les participants des données d’entraînement et de test. Tous les types de données sont acceptés, qu’il s’agisse de signaux médicaux, images, mesures physiques, sons, séries financières textes, questionnaires marketing, suivi de clics sur le web, etc. Il est recommandé de définir un problème dont l’exposition est relativement facile à comprendre pour les participants et dont la résolution a un véritable impact, même si cela peut être difficile et mettre en jeu des algorithmes sophistiqués.

Comment participer ?

Nous vous invitons à déposer un projet le plus tôt possible avant le 23 septembre 2016, par courriel à challenge.data@ens.fr. Merci de faire figurer dans votre soumission : le nom de l’entreprise, les nom et courriel du responsable du projet, éventuellement les nom et courriel d’un partenaire universitaire ; une description de l’entreprise (50 mots), une description du projet d’apprentissage supervisé (100 à 200 mots) en précisant s’il s’agit d’un problème de classification ou de régression, une description du type de données, les nombre d’exemples d’entraînement et d’exemples de tests, les nombre et type de variables, une mesure pour l’évaluation des soumissions, et les résultats déjà obtenus sur les données.

Calendrier

– Du 1er au 23 septembre 2016 : soumission des projets (challenge.data@ens.fr) et sélection.
– Octobre à Novembre 2016 : présentation des challenges et des entreprises à l’ENS (Ulm)
– Novembre 2016 : ouverture de la compétition
– Juin 2017 : clôture de la compétition

En savoir plus