|
Accueil
Le projet
Documents
|
Réunion du 12/09/2005 à Paris
Compte rendu (par Jesse Tseng)
présents : Sylvain Kahane (MoDyCo), Susanne Alt (ATILF), Olivier Blanc
(IGM), Didier Bourigault (ERSS), Lionel Clément (Labri), Matthieu
Constant (IGM), Eric de la Clergerie (ATOLL), Gil Francopoulo (Loria),
Claire Gardent (Loria), Marie-Laure Guénot (LPL), Bruno Guillaume
(Loria), Eric Laporte (IGM), Alexis Nasr (Lattice), Sébastien Paumier
(IGM), Guy Perrier (Loria), Jean-Marie Pierrel (ATILF), Javier Sastre
(IGM), Jesse Tseng (Loria)
Exposé de J-M Pierrell'ATILF répond à un appel d'offres du CNRS création d'un centre de compétence ("CC") pour les corpus, dictionnaires, lexiques (et outils) il ne s'agit pas de financer le développement de nouvelles ressources mais d'assurer la pérennité des ressources 3 niveaux d'organisation
premier texte (document de travail) pour motiver, expliquer candidature de Nancy, diffusé aux directeurs de labo SHS quel positionnement par rapport à LexSynt et aux autres projets de recherche ? 2e appel d'offre pour ce genre de projet, leur donner plus de moyens (financiers) sans être leur principal financement rôle du centre de ressources : proposer une palette d'outils (de distribution)
CNRS vraisemblablement validera peu de centres, a demandé une concertation préalable
rôle d'ELRA ? ELRA gère (vend) les ressources avec exclusivité cette politique a changé ? ELRA n'est pas considéré (par le Ministère etc.) comme l'association _officielle_ (mais incohérence, le CNRS impose parfois la collaboration avec ELRA) par ex. Technolangue, ELRA a un statut privilégié CNRS cherche à "mutualiser" les ressources mais cela exige énormément de moyens
organisation du CC
pas une instance de moyens pour subventionner des projets mais une cellule de moyens humains pour organiser les projets, recenser leurs besoins Technolangues 2 : objectif d'élargir le catalogue de l'ELRA incompatibilité ? OK mais non-exclusivité, refuser de signer une telle convention soutien du Ministère sur ce point mais désavantage pour nos équipes (par rapport aux équipes qui n'exigeraient pas la non-exclusivité) réponse globale de la communauté : plus de poids appel lancé par le Département SHS, focalisé sur la section 34 pour démarrer il y aura des discussions avec d'autres EPST comment s'y prendre, si on a un lexique ou autre ressources
ressource répertoriée considérée comme une publication pour évaluation par le CN moyens humains
avis du comité scientifique : quelle zone d'influence ?
appel d'offres en 2e phase (initialement prévu sur crédits 2005, mais retardé)
collaborations à l'étranger : équipes partenaires peuvent aussi faire appel au centre de compétence ? oui, s'ils le souhaitent (la question des moyens, ex. ACI, est plus compliquée)
modes de distribution (licences) conseil scientifique conseillera, ne prendra pas la décision pour l'équipe penser à l'affectation d'un expert juridique à moyen terme ? éviter que deux équipes du CNRS ne refassent la même ressource première tache : enquête pour répertorier les ressources existantes, identifier leurs caractéristiques (métadonnées) possibilité de sortir des ressources francaises du catalogue ELRA ? confiance en les ressources
directeur du CC = directeur de l'ATILF ? au départ, le CNRS souhaite s'appuyer sur une structure pérenne (pour envisager plus tard une unité autonome) quelles centres partenaires ?
oral (un autre CC) avec centres partenaires ERSS, Lyon, LPL... les grammaires ? indissociables des lexiques pas exclu mais aujourd'hui elles sont peu nombreuses questions administrativesprochaine réunion : 10 novembre 2005
Exposé de Bernard Langlexiques : droits des bases de données ? grammaires : plutôt droits d'auteur nos lexiques: des bases de données ou plutôt comme des dictionnaires papier ? Les droits des logiciels rentrent dans tous ces cadres... 1. droits d'auteurportent sur des créations d'esprit avec une forme originale toute création qui porte l'empreinte de la personnalité de son auteur droits finis mais non bornés 2. droits des brevets / des inventionsliés à la réalisation d'une fonctionnalité
durée de 20 ans mais il faut payer régulièrement, sinon tombe dans le domaine public ADPIC/TRIPS : accords de l'OMC concernant la propriété intellectuelle il faut appliquer la convention de Berne (OMPI/WIPO) [aussi OEB/EPO brevets, INPI en France] -> directives UE [ "acts" aux USA ] -> lois des états membres 3. droits des marquessur le nom et la caractérisation (représentation symbolique) d'un produit (une trentaine de catégories, ou toutes catégories) pour empêcher la modification et la réédition d'une ressource sous le même nom (e.g., "Lexique Syntaxique Paris 7") e.g., "Open Cola" --> "Open Cola Paris 7" conseil : nom générique (non-protégé) + nom spécifique (déposé) c.f. la paternité dans les droits d'auteur les noms des universités : faut les déposer ? se fait couramment 4. droits des bases de donnéescollections "sui generis" car déjà protégées par les droits d'auteur visent à compléter, à harmoniser les droits d'auteur protéger l'investissement que représente la collection en donnant un droit exclusif sur la création réutilisation sans licence ? non en même temps, valeur mesurée en termes d'investissement humain (qui est de moins en moins important à force d'utiliser des méthodes automatiques) réutilisation des ressources faites à la main ? vaut mieux pas utilisation pour valider une autre ressource ? limite, peut être vue comme une extraction CEB/EPC 1973 : sont exclus de la brevetabilité
bagarre pour breveter les logiciels
question sur les données primaires : si on utilise le corpus du Monde pour créer une ressource secondaire, le Monde a-t-il des droits dessus ? "usage personnel" appropriation de (Euro)WordNet par ELRA : légitime ? probablement, droits cédés par contrat attaquer ELRA par les droits de la concurrence sinon, les court-circuiter, ignorer leurs droits en attendant qu'ils réagissent... notre lexique : redistribution ? faut choisir le modèle "Creative Commons" kit de licences dans un projet fédérateur on doit se mettre d'accord avant de commencer à travailler sérieusement licence de type GPL (libre, mais pour toute commercialisation, une part revient au pot commun) LGPL-LR, créée à MLV Exposé de Claire GardentLexique syntaxique et tables du LADL discussion organisation de cadres extraits sous forme de métagrammaire (ou de règles lexicales) procédure de création du graphe à partir de la table rien supprimé, rien ajouté, mais parfois un travail d'interprétation (surtout dépendances entre colonnes, l'oméga) problème de fusionnement de lexiques (lexique TAL simplifié plus lexique existant pour un parseur donné) : méthodes à définir le LG continue à évoluer ? oui (version web n'est pas la même que dans le livre) licence : lexique sera un produit dérivé, donc la même licence LGPL-LR s'impose (licence "virale", peut rendre impossible le fusionnement de ressources) peut-être envisager une collaboration avec Susanne et Eric (Laporte): projet de mise au format LMF des tables de LADL (ce qui implique une interprétation) |
|
|
Site Web : B. GUILLAUME |