Apprentissage automatique d'une distance d'edition dediee a la reconnaissance de l'ecriture manuscrite

icon

6

pages

icon

Français

icon

Documents

Écrit par

Publié par

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
icon

6

pages

icon

Français

icon

Documents

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Niveau: Secondaire, Lycée
Apprentissage automatique d'une distance d'edition dediee a la reconnaissance de l'ecriture manuscrite Sabine Carbonnel – Eric Anquetil IRISA, INSA Rennes Campus universitaire de Beaulieu Avenue de General Leclerc F-35 042 Rennes cedex fsabine.carbonnel, Resume : Ce travail s'inscrit dans le cadre d'un post- traitement lexical base a la fois sur une organisation struc- turee de dictionnaire (a partir de caracteristiques glo- bales des mots) et sur un algorithme d'appariement de mots specifique a l'ecriture manuscrite en-ligne (distance d'edition). L'objectif est de compenser les erreurs de re- connaissance et de segmentation en s'appuyant sur les in- formations lexicales extraites d'un dictionnaire. Pour cela nous avons adapte une distance d'edition a l'ecriture ma- nuscrite pour le post-traitement lexical en reconnaissance en-ligne de mots. Cet article presente une methode d'appren- tissage automatique de la distance d'edition. L'objectif est de pouvoir automatiquement specialiser la distance d'edition en fonction des proprietes du reconnaisseur. Les resultats experimentaux obtenus montrent que l'approche proposee pour adapter automatiquement la distance d'edition obtient d'aussi bons resultats qu'une distance d'edition calibree em- piriquement a la main de fac¸on longue et fastidieuse. Mots-cles : Reconnaissance d'ecriture manuscrite en- ligne, post-traitement lexical, apprentissage de la distance d'edition.

  • telephones mobiles des systemes de reconnaissance de lettres et de mots manuscrits

  • operations

  • post- traitement lexical

  • reconnaissance de l'ecriture manuscrite

  • hypotheses de reconnaissance

  • distance d'edition


Voir icon arrow

Publié par

Nombre de lectures

53

Langue

Français

Apprentissageautomatiqued'unedistanced'´editionde´die´ea`la reconnaissancedel'´ecrituremanuscrite ´ Sabine Carbonnel – Eric Anquetil
IRISA, INSA Rennes Campus universitaire de Beaulieu AvenuedeG´ene´ralLeclerc F-35 042 Rennes cedex { } sabine.carbonnel, eric.anquetil @irisa.fr Re´sum´e:Ce travail s'inscrit dans le cadre d'un post-nrse´etrisnaonececnaslesprobl`emess´pceiuqseercnno traitement lexical base´ a` la fois sur une organisation struc-imruxuee´siopse´'derutirceadap,desonsotaticne´tnode´la´tre tur´eededictionnaire(a`partirdecaracte´ristiquesglo-les prendre en compte. Les re´sultats obtenus sont meilleurs bales des mots) et sur un algorithme d'appariement detsetuaflisiamp´soleesuttoerimidit'de´oisnretalesssibonpo motsspe´cique`al'´ecrituremanuscriteen-ligne(distanceR0CAe[qu.3]leelamunipirtemeˆtulteusrscoec¸ondefa d'´edition).L'objectifestdecompenserleserreursdere-lcitraterpsuon,escanDoheduaotamituqe´esentonsunem´et connaissance et de segmentation en s'appuyant sur les in-n-rl'essuenniaerocseuddritrpseirpo´te´r´ouabetr`liarapp formations lexicales extraites d'un dictionnaire. Pour celascleueiqnsaiontiide´'dsnoitare´pdesombleseelrusˆotuqsiu nousavonsadapte´unedistanced'´edition`al'´ecriturema-sont associe´s. nuscrite pour le post-traitement lexical en reconnaissancese´eonntnontprussehpaviurapeargancciDuacnssslntmete en-lignedemots.Cetarticlepr´esenteunem´ethoded'appren-dere`emeaissconnERISnaecteudMFtolepicnirpstsysudse tissage automatique de la distance d' e´dition. L'objectif est dessoci´e.Nousintrdoiuossnstpora-temittlencixeuqlaiuliatse pouvoirautomatiquementspe´cialiserladistanced'´editiondans le paragraphe 3 la notion de distance d'´edition avant enfonctiondesproprie´t´esdureconnaisseur.Lesre´sultatsde proposer, dans le paragraphe 4 une me´thode d'apprentis-expe´rimentauxobtenusmontrentquel'approchepropos´eesage automatique de distance d'´edition. Dans le dernier pa-pouradapterautomatiquementladistanced'´editionobtientsenoetpxrgaarhpntettapermnemixuatxestre´pesr´taul´eosessl d'aussibonsr´esultatsqu'unedistanced'e´ditioncalibre´eem-de comparer la distance d'´edition re´sultant de l'apprentissage piriquementa`lamaindefa¸conlongueetfastidieuse.´esent´eavecunedatumotaqieurpeln´orabed´eeatsidecnde´'oiti fac¸on empirique. Mots-cle´s: Reconnaissance d'´ecriture manuscrite en-ligne, post-traitement lexical, apprentissage de la distance d'´edition.ntat´ese´en´iong2rPsudelareeme`tsy de reconnaissance et du post-traite-1 Introduction ment La communication par l'´ecrit et le geste graphique joue un roˆlepre´pond´erantdanslesnouvellestechnologiesassocie´es 2.1 Lesyste`me de reconnaissance de mots `al'informatiquemobile.Lesassistantspersonnels(PDA),les isole´s RESIFMot ordinateurstablettes(tablettePC)ouencoreleste´l´ephones mobiles de nouvelle ge´ne´ration (smartphones) axent leurs Le syste`me de reconnaissance de mots manuscrits en-ligne interfaceshommemachinesurdesmodalit´esd'interactions RESIFMot est base´ sur une approche analytique ou` les orient´eesstylet:l'utilisateurinteragitetcommuniqueavec motssontsegment´essuivantdiffe´renteshypoth`esesd'allo-1 la machine en e´crivant directement sur son e´cran. La qua-graphesdelettres[ANQ96,ANQ97b].Leshypoth`eses lit´edessyst`emesdereconnaissanced'´ecritureestun´ele´mentd'allographessontorganis´eesdansungraphedesegmen-cle´dansl'ergonomieassoci´ee`acetyped'interactions.Nous tationstructur´erepre´sentantl'ensembledessegmentations collaborons depuis plusieurs anne´es avec des industriels possibles (Figure 1). and'embarquersurdest´ele´phonesmobilesdessyst`emes Apre`s l'´etape de segmentation, une version adapte´e de de reconnaissance de lettres et de mots manuscrits isole´s RESIFCarestutilis´eepouridentierchaquehypoth`esed'al-(RESIFCar [ANQ 02] et RESIFMot [ANQ 97b]). lographe. Cette approche analytique engendre plusieurs hy-Dans cet article, nous nous focalisons sur l'´etude de poth`esesdereconnaissance(se´quencesd'allographesde l'int´egration de connaissances lexicales au syste`me lettres)quisontassoci´ees`adeuxtypesdeproble`mes:les RESIFMot (reconnaissance de mots manuscrits cursifs ambiguı¨t´esdesegmentationetlesconfusionsinter-lettresin-lie´s) [ANQ97b] ;plus particulie`rement sur la distance duites par la phase d'identification des allographes. d'´editionutilis´eelorsdupost-traitementlexical.Unedis-1 tance d'´edition classique ne permettant pas de re´soudrevariantes de styles dans une meˆme classe de lettre
Voir icon more
Alternate Text