LexSynt

 
Accueil
Le projet
Documents
Réunion du 23/05/2005 à Paris
Ordre du jour
  • objectifs poursuivis par chaque équipe et redéfinition des objectifs communs
  • organisation du travail et planning des réunions
  • dépenses prévisionnelles et autres sources de financement (ANR, ACI, etc.)
  • ouverture à d'autres partenaires
  • exposés scientifiques des partenaires
Compte rendu (par Sylvain Kahane)
Présents : Olivier Blanc (IGM), Lionel Clément (Signes), Eric de la Clergerie (Atoll), Matthieu Constant (IGM), Laurence Danlos (Lattice), Gil Francopoulo (LED/LexiquePourLeTal), Kim Gerdes (ERSS), Bruno Guillaume (Calligramme), Evelyne Jacquey (Atilf), Sylvain Kahane (Modyco), Piet Mertens (Leuven), Alexis Nasr (Lattice), Guy Perrier (Calligramme), Azim Roussanaly (LED), Benoit Sagot (Atoll/Lattice), Jacques Steinlin (Lattice), Jesse Tseng (LED) Escusés : Didier Bourigault (ERSS), Marianne Desmets (Modyco), Eric Laporte (IGM), Alain Polguère (OLST), Susanne Salmon-Alt (Atilf)

Tour de table

La matinée a été consacrée à un tour de table. Les participants se divisent en deux catégories (on peut appartenir aux deux) : les producteurs (ceux qui ont des ressources lexicales à apporter au groupe) et les consommateurs (ceux qui recherchent des ressources lexicales). Les uns et les autres souhaitent participer à la valorisation des ressources existantes. Les principales ressources dont nous pourrions disposer :
  • le lexique-grammaire (IGM)
  • le lexique des verbes Proton (Leuven)
  • le Dico/Dicouebe (OLST)
  • le TLFi et les lexiques dérivés (Atilf)
  • le Lefff (Atoll) et ses cousins
  • les lexiques extraits automatiquement du corpus annoté de Paris 7 (Lattice)
  • les lexiques extraits avec Syntex (ERSS)
Nous avons aussi une multitude de grammaires, formalismes, analyseurs, etc., dont je ne donne pas la liste.

Statut des ressources

Nous devons rapidement résoudre la question de l'accessibilité de ces ressources. Lesquelles sont accessibles aux membres du groupe ? Partiellement ou dans leur totalité ? Lesquelles peuvent être réinvestis dans une nouvelle ressource ? La question des différents types de licences sera discutée à la réunion du 12 septembre (intervenants possibles : Kim Gerdes, Bernard Lang) Nous devons ensuite discuter le statut de la ou les ressources que nous produirons.

Inventaire

Nous allons faire un tableau des ressources, où chacun décrira les ressources dont il dispose. Les consommateurs rempliront une fiche similaire sur la ressource (idéale) qu'il souhaite. Chaque fiche doit comporter les informations suivantes :
  • nom de la ressource (dont numéro de la version si possible)
  • historique de la ressource (date de création, principales étapes)
  • contact (personne + url)
  • propriétaire
  • licence (type de distribution), interrogation possible sur le web, etc.
  • développeurs
  • estimation quantitative (nombre d'entrées global, par catégories syntaxiques, locutions, etc.) et caractérisations des entrées (vocables ou lexies, locutions, constructions, etc.)
  • estimation qualitative (mode de production, étapes de vérification, fiabilité des données, etc.)
  • microstructure (description des entrées, types d'information)
  • macrostructure (organisation du lexique, description intensionnelle, liens entre entrées, etc.)
  • format physique (maison, LMF, XML, etc.)
  • un exemple d'entrée (+ commentaires éventuels)
  • divers
Je vous propose qu'au moins les premières fiches soient envoyées à tous, que les suivants se calent sur les premiers. Je vous fixe le 6 juin comme deadline pour qu'on en discute à taln. Pour le site web, je veux bien en plus
  • un extrait éventuel à télécharger (me dire si vous voulez un accès réservé au groupe)
  • des images : logo du labo, de la ressource et image de votre exemple si vous avez une visualisation graphique

Site Web

Le site web. Nous allons mettre en place un site (adresse prévue : www.lexsynt.org) Il serait bien que le site soit en place pour 3 juillet, date de la soumission à l'ARA MD. Je m'en occupe pour l'instant avec les ressources humaines de mon équipe (Modyco gère déja de gros sites comme celui du projet PFC). Nous avons souhaité que le site soit très ouvert et appelle tout un chacun à nous rejoindre s'il le souhaite. Nous aurons également une partie réservée notamment pour les ressources que nous souhaitons partagées et dont le statut n'est pas publique. Le site comprendra les fiches et les infos qui sont sur le site actuel (mise à jour) : http://panini.u-paris10.fr/lexsynt/

Nouveaux partenaires.

Nous restons bien-sur ouverts à l'intégration de nouveaux partenaires (et à l'intégration d'autres ressources). En même temps nous somme déjà beaucoup et il est important de stabiliser le groupe avant de s'élargir. Cela dit nos activités n'ont rien de secret et libre à chacun d'en parler et de proposer des nouveaux partenaires au groupe.

Exposés scientifique

  • Jacques Steinlin (Lattice) sur le Dicouebe
  • Evelyne Jacquey (Atilf) : Extraction d'information de sous-catégorisation à partir du TLFi

Prochaines réunions

  • jeudi 30 juin à Nancy (thème : la description des verbes, organisation Bruno Guillaume [Bruno.Guillaume_at_loria.fr]). Nous avons proposé que chacun présente une entrée verbale à la réunion du 30 et si possible l'entrée de DESIRER.
  • lundi 12 septembre à Paris (thème : ce que veulent les grammaires + les différentes licences)

Autres thèmes possibles de réunion

  • format intensionnel ou extensionnel du lexique (macrostructure du lexique)
  • suite du parcours du lexique : locutions et collocations, mots grammaticaux, constructions, etc.

Divers

  • Gil Francopoulo [gil.francopoulo_at_wanadoo.fr] rappelle que tout ceux qui le souhaitent peuvent rejoindre l'action LexiquePourLeTal qu'il coordonne et qui possèdent déjà 80 membres pour le volet francophone. Le document LMF (Lexical Markup Framework) proposant des directives pour le format des lexiques pour le tal peut lui être demandé.
  • Une liste de diffusion sera créée pour le groupe. Coordinateur : Eric de la Clergerie.
Site Web : B. GUILLAUME
Valid XHTML 1.1! Valid CSS!