CoRISST
R&D / FCE
Domaine : Ingénierie des connaissances
Résumé
Le projet CoRISST vise à donner un accès plus présis à l'information contenue dans des documents semi-structurés en combinant la sémantique apportée par la structure XML et la sémantique extraite du contenu (entre les balises).
Ce projet est un complément aux projets Infomagic du pole Cap Digital et Fame2 du pole System@tic.
Il a pour but la mise en relation de connaissances sémantiques et syntaxiques induites par des analyses linguistiques avec des connaissances sémantiques et syntaxiques provenant de la structure de documents XML afin d’améliorer les performances d’un moteur de recherche sur des bases XML et d’accroître ses possibilités. Le CEA et NewPhenix apportent leur compétences sur les moteurs de recherche et le traitement automatique des langues, le LIP6 sa compétence dans les moteurs XML et dans les méthodes d’apprentissages et les partenaires valideurs, ADISE et Jouve, apportent respectivement les domaines d’application médical et juridique. Afin de pouvoir évaluer l’impact des différentes méthodes utilisées, une évaluation utilisateur d’envergure sera mise en place. Celle-ci permettra de plus de mettre au point les mesures d’évaluation des moteurs XML qui font pour l’instant défaut à la communauté.
Porteur
Christian Fluhr / CEA
Partenaires
PME : NewPhenix,ADISE, Jouve
Etablissement P.E.R. : CEA, Paris 6 - LIP 6
Grandes entreprises : BULL
Retour