Font Size: a A A

Un Modele D' Interpretation Et De Traitement Du Texte Francais Pour La Realisation D'un Systeme Question-Reponse

Posted on:2011-06-12Degree:DoctorType:Dissertation
Country:ChinaCandidate:H Y LiFull Text:PDF
GTID:1115330332482964Subject:French Language and Literature
Abstract/Summary:PDF Full Text Request
Le travail presente dans cette these s'inscrit dans le contexte du Traitement automatique des langues naturelles (TALN). Il a pour objectif de proposer une approche de traitement automatique de la langue francaise en exploitant conjointement les theories operationnelles les plus connues de l'occident:le reseau semantique, les primitives, la representation des connaissances etc., et celles recemment developpees en Chine:le classement exhaustif des phrases et le quintuple des concepts abstraits proposes par la theorie HNC (Reseau Hierarchique des Concepts).Notre travail ne vise pas a satisfaire directement les besoins commerciaux. Il se contente de proposer une autre possibility d'approche du traitement de texte automatique. Nous allons faire l'experience de cette nouvelle approche sur un conte francais. Si ce modele reste un prototype experimental qui aboutit a un mini-dialogue homme-machine, il permet deja d'avoir d'autres applications en perspective telles que l'indexation intelligente, le filtrage et l'extraction d'information. Cette possibilite d'extension est rendue possible grace a une base fondamentale commune a toutes ces demarches:la comprehension du texte suite a la perception de l'ossature phrastique a partir des formules preetablies autour d'un verbe.L'originalite de ce modele reside surtout dans sa capacite d'exprimer des aspects complexes et multiples de concepts abstraits, par 1'introduction de la notion du quintuple. Cette forme d'expression composee de cinq aspects (dynamique, statique, valeur, attribut, effet) est censee etre suffisante pour presenter les caracteristiques de tous les concepts abstraits. Ainsi, la classification traditionnelle des categories grammaticales en noms, verbes, adjectifs, etc. est remplacee par une classification plutot semantique et pragmatique dont le systeme de referentiel en facilite la perception par des programmes d'ordinateur.Au niveau de la phrase, ce modele, aiguille par des preoccupations d'automatisation, n'a plus recours a des analyses syntaxiques mais se tourne vers une analyse plutot semantique. A partir des formules preetablies d'un verbe et des contraintes de decision operationnelles, qui permettent de verifier la formule convenant a la situation, les autres syntagmes gravitant autour de ce verbe pourraient ainsi etre percus. De plus, apres les analyses, les phrases vont se transformer en une autre forme d'expression que la machine pourra reconnaitre, grace a un systeme de signes dont on aura convenu par avance.Comme tout modele de dialogue homme-machine, ce travail integre aussi deux etapes fondamentales:le traitement de la question et la production de la reponse. Dans une approche identique a celle du traitement textuel, l'analyse de question debouche sur une expression compatible avec celle du texte analyse et permet donc d'envisager une association d'information au sein meme du texte cible. Il faut noter que cette association ne se limite pas a retrouver les occurrences d'un meme terme, mais s'avere capable de calculer la distance semantique de facon approximative, tout en demontrant l'efficacite du reseau semantique.La production de reponse n'est pas objet le plus important de cette recherche. Une fois qu'elle aura pris sens par rapport a la question posee, cette reponse sera jugee acceptable, sans se soucier de problemes stylistiques. Autrement dit, les exigences et tournures de langue d'un niveau plus el eve (figures de style, niveaux du langage, etc.) ne sont pas jusque la prises en consideration.Cependant, on ne peut negliger en aucune facon les problemes cruciaux du traitement de la langue tels que les phenomenes d'anaphore, le systeme d'annotation, la segmentation discursive et phrastique, la desambiguisation, etc. Bien que d'importance secondaire par rapport aux autres taches repertoriees, ils seront tout de meme presentes et developpes dans ce travail. Tout en passant en revue les procedes actuels les plus courants, nous mettrons en lumiere la methodologie a laquelle nous aurons recours dans ce modele.En conclusion, ce travail de these n'est qu'un prototype experimental dont l'objectif est de proposer une piste pour traitement automatique du texte francais. Nous ne pretendons pas, loin de la, presenter des procedes immediatement utilisables pour le traitement automatique des langues, mais seulement decrire et expliquer les demarches suivies dans ce travail de these en esperant qu'il pourra etre utile a d'autres chercheurs.A partir d'un travail personnel, nous ne pouvons aborder que les systemes ayant un objectif precis, un lexique restreint, des types de phrases simplifies. Mais dans un travail de groupe, l'application et l'extension de ce modele tels que:la fouille intelligente d'informations, le filtrage d'informations sensibles et le systeme didactique a distance, etc., pourraient etre envisagees. Car la programmation technique, la construction d'un lexique ouvert sont des travaux couteux qui necessitent une collaboration professionnelle.
Keywords/Search Tags:HNC, réseau sémantique, primitive, classement de phrases, dialogue homme-machine en francais
PDF Full Text Request
Related items