Lingüística Computacional

July 9, 2018 | Author: AlfonsoGarcía | Category: Translations, Computer Science, Linguistics, Epistemology, Semiotics
Share Embed Donate


Short Description

Descripción: Una introducción....

Description

LINGÜÍSTICA COMPUTACIONAL

TRABAJO REALIZADO POR:

IRENE CASCALES ABELLÁN FRANCISCA GIL MORENO ISABEL GÓMEZ MARTÍNEZ JOSE MANUEL LUCAS CABALLERO CRISTINA SAMPEDRO YAÑEZ

INDICE ¿QUÉ ES LA LINGÜÍSTICA COMPUTACIONAL?....................................................... ANTECEDENTES !ISTÓRICOS"""""""""""""...............""...""# LINGÜÍSTICA TEÓRICA Y LINGÜÍSTICA COMPUTACIONAL"".................."$ TRATAMIENTO DEL LENGUAJE GENERACIONAL E INTERPRETACIONAL..% APLICACIONES"""""""""""""""""""..............""...".""& BIBLIOGRAFIA"""""""""""""""""""..............""...""....'(

1

'.

¿QUÉ ES LA LINGÜÍSTICA COMPUTACIONAL?

En primer lugar, antes de profundizar en el tema, se a!e indispensa"le determinar el o"#eto $ el %m"ito de estudio del mismo& De esta forma, podemos se'alar (ue la ling)*sti!a !omputa!ional se !entra en el estudio de las lenguas naturales en su apli!a!i+n al mundo de la inform%ti!a& na de las primeras defini!iones so"re ling)*sti!a !omputa!ional -L./ se la de"emos a 0risman: 1es el estudio de los sistemas de !omputa!i+n utilizados para la !omprensi+n $ la genera!i+n de lenguas naturales2& Por otro lado, Allen nos propor!iona una defini!i+n de pro!esamiento del lengua#e natural -PL3/ e(ui4alente a la defini!i+n de 0risman al afirmar (ue 1el o"#eti4o de esta in4estiga!i+n es !rear modelos !omputa!ionales del lengua#e lo sufi!ientemente detallados (ue  permitan es!ri"ir programas inform%ti!os (ue reali!en las diferentes tareas donde inter4iene el lengua#e natural2& Por lo tanto, seg5n 6oreno 7ando4al 1la L. $ PL3 tratan del desarrollo de  programas de ordenador (ue simulan la !apa!idad ling)*sti!a umana2& 7eg5n 0+mez 0uino4art 1la ling)*sti!a !omputa!ional suele ser !onsiderada !omo una su"dis!iplina de la inteligen!ia artifi!ial, $ 8sta, por su parte, es una su"dis!iplina de la inform%ti!a (ue se o!upa de la !omprensi+n de la inteligen!ia $ del dise'o de m%(uinas inteligentes, es de!ir, de m%(uinas (ue presentan !ara!ter*sti!as aso!iadas !on el entendimiento umano, !omo el ra!io!inio, la !omprensi+n del lengua#e a"lado $ es!rito, el aprendiza#e o la toma de de!isiones, entre otras& Desde el punto de 4ista de su 4in!ula!i+n a la ling)*sti!a, la ling)*sti!a !omputa!ional es una su"dis!iplina de la ling)*sti!a te+ri!a en el sentido de (ue uno de sus o"#eti4os es la ela"ora!i+n de modelos formales del lengua#e umano&2 Es por ello (ue la L. se plantea entre otras apli!a!iones, permitir el uso oral de la lengua materna !omo medio de !omuni!a!i+n entre los ordenadores $ los indi4iduos& Es de!ir, se pretende !onseguir (ue las personas puedan a!!eder a todas las fa!ilidades ofre!idas por los ordenadores mediante +rdenes 4o!ales e9presadas espont%neamente !on el 4o!a"ulario $ la sinta9is de su propia lengua $, al mismo tiempo, (ue los ordenadores presenten los resultados de sus apli!a!iones en ese mismo idioma de manera natural e inmediatamente !omprensi"le& Por !onsiguiente, se persigue in!orporar a la te!nolog*a !omputa!ional di4ersas a"ilidades, !omo las de a"lar, reda!tar, resumir  o tradu!ir& Asimismo, !omo dis!iplina e9perimental orientada a la ela"ora!i+n de produ!tos !omer!iales $ de in4estiga!i+n, la ling)*sti!a !omputa!ional forma parte de las denominadas industrias de la lengua, un se!tor industrial !ada 4ez m%s amplio (ue propor!iona datos $ programas inform%ti!os apli!ados al tratamiento del lengua#e tales !omo: di!!ionarios ele!tr+ni!os e impresos,  "an!os de datos terminol+gi!os $ tesauros, as* !omo programas de sistemas de tradu!!i+n autom%ti!a, interfa!es de !onsulta a "ases de datos en lengua#e natural o !orre!tores ortogr%fi!os $ estil*sti!os& Esta misma a!ti4idad, !u$os resultados se plasman en las apli!a!iones ling)*sti!as de la inform%ti!a, 4in!ula la ling)*sti!a !omputa!ional !on la ling)*sti!a apli!ada, una rama de la ling)*sti!a dedi!ada a apli!ar los resultados $ m8todos de la in4estiga!i+n ling)*sti!a a di4ersos !ampos !omo la ense'anza de idiomas, la tradu!!i+n e interpreta!i+n, o la logopedia& 2

7iendo la ling)*sti!a !omputa!ional una dis!iplina tan re!iente, $ a"ar!ando o"#eti4os tan 4ariados, resulta "astante !omprensi"le la gran 4a!ila!i+n terminol+gi!a (ue impera en su dominio& na tentati4a de delimita!i+n del !ampo de estudio de la misma, e9ige el re!ono!imiento de un m*nimo de tres 4ertientes& Estas tres grandes l*neas de tra"a#o ordenadas de la m%s 4in!ulada a la ling)*sti!a a la m%s 4in!ulada a la inform%ti!a son: a&

La inform%ti!a apli!ada a la in4estiga!i+n ling)*sti!a

 "&

La implementa!i+n de teor*as ling)*sti!as

!&

Las apli!a!iones ling)*sti!as de la inform%ti!a&

.

ANTECEDENTES DE LA LINGÜÍSTICA COMPUTACIONAL

La ling)*sti!a !omputa!ional surgi+ en los Estados nidos en la d8!ada de ; !on el fin de o"tener !omputadoras (ue fueran !apa!es de tradu!ir autom%ti!amente te9tos de lenguas e9tran#eras al ingl8s, parti!ularmente de re4istas !ient*fi!as rusas& .omo los ordenadores pueden a!er !%l!ulos aritm8ti!os !on ma$or rapidez $ pre!isi+n (ue los seres umanos, se !re$+ (ue solo era !uesti+n de tiempo (ue tu4ieran la misma !apa!idad para pro!esar el lengua#e& 7urgi+ !omo resultado de las ase4era!iones de ?arren ?ea4er, (uien 4e*a en la tradu!!i+n una forma de des!ifrado& 3o o"stante, no tardaron en per!atarse de (ue el tratamiento autom%ti!o de las lenguas era mu!o m%s !omple#o de lo (ue ini!ialmente pensa"an, puesto (ue la tradu!!i+n autom%ti!a no logr+ produ!ir tradu!!iones pre!isas& Para tradu!ir de un lengua#e a otro, se o"ser4+ (ue era ne!esario !omprender la sinta9is de am"os lengua#es, al menos en el ni4el morfol+gi!o $ en las frases enteras, $ a su 4ez, para entender  la sinta9is, a$ (ue entender la sem%nti!a del 4o!a"ulario $ la pragm%ti!a del lengua#e& De esta forma, lo (ue empez+ !omo un esfuerzo para tradu!ir te9tos, pronto, se !on4irti+ en una dis!iplina en!argada de entender !+mo representar $ pro!esar el lengua#e natural indi4idual usando ordenadores& .uando la inteligen!ia artifi!ial apare!i+ en la d8!ada de ;, la ling)*sti!a !omputa!ional se !on4irti+ en una rama de 8sta -la inteligen!ia artifi!ial/ en una su"di4isi+n, tratando !on el ni4el de !omprensi+n umano $ la produ!!i+n de los lengua#es naturales& En la a!tualidad la in4estiga!i+n en el %m"ito de la ling)*sti!a !omputa!ional se lle4a a !a"o en los departamentos de ling)*sti!a !omputa!ional, la"oratorios, departamentos de inform%ti!a $ departamentos de ling)*sti!a&

#.

LINGÜÍSTICA TEÓRICA Y LINGÜÍSTICA COMPUTACIONAL

A pesardeque elobj et i vode ambasdi sci pl i nasseaelde l acompr ensi ón l i ngüí st i ca, ambasmat er i ast i enenmét odosypunt osdevi st adi f er ent es. 3

La l i ngüí st i ca comput aci onaldesar r ol l a pr ocedi mi ent os par a elt r at ami ent o de un subconj unt o de l enguasnat ur al es.Esun campo mul t i di sci pl i narde l al i ngüí st i ca yl a i nf or mát i caqueut i l i zal ai nf or mát i capar aest udi aryt r at arell enguaj ehumano,model ando def or mal ógi caell enguaj enat ur aldesdeunpunt odevi st acomput aci onal . Laexi genci adeconst r ui rsi st emas compl et osquef unci onenl eshal l evadoabuscarun ent endi mi ent odelpr ocesot ot aldel agener aci ónycompr ensi óndell enguaj e.Esdeci r ,no secent r aen un campoenpar t i cul ar ,si noqueengl obavar i osenl osquepar t i ci par án l i ngüi st as,i nf or mát i cos,psi cól ogosyexper t osenl ógi ca. Mi ent r as,l al i ngüí st i ca t eór i ca se ha cent r ado pr i nci pal ment e en un aspect o de l a act uaci ónl i ngüí st i ca,l acompet enci agr amat i cal ,queesl acapaci dadqueper mi t eal os habl ant es acept ar al gunas or aci ones como gr amat i cal es y r echazar ot r as como agr amat i cal es. Sehanocupadodel osuni ver sal esdell enguaj e,esdeci r ,l ospr i nci pi osapl i cabl esat odas l asl enguas;ydeldescubr i mi ent odel at eor í agr amat i calmássi mpl eymásr est r i ngi da comput aci onal ment equeseacapazdedarcuent adel asl enguasnat ur al es. Así ,esper anaver i guarl osmecani smosi nnat osdell enguaj equeper mi t enal oshabl ant es apr enderyut i l i zarsul enguat anf áci l ment e. De est e modo, han de anal i zar or aci ones pecul i ar es que par al os l i ngüi st as comput aci onal esser í anpat ol ógi cas. Apesardeest o,l al i ngüí st i cat eór i capuedeof r eceral acomput aci onalal goquesuel eser i gnor ado:l ascuest i onesdegr amat i cal i dad.Ést assoni mpor t ant espor quecomoseha demost r ado,una r est r i cci ón gr amat i calque en un caso det er mi na siuna or aci ón es acept abl eono,puede sernecesar i aen ot r oscasospar adeci di rcuál esde l osvar i os anál i si sposi bl esdeunaor aci ónconcr et asoncor r ect osono. Lasr el aci onesqueseest abl ecenent r econj unt osdeor aci onessonesenci al espar al os pr ocedi mi ent osdeanál i si sdell enguaj epor queper mi t enr educi runaampl i avar i edadde or aci onesaunnúmer or el at i vament epequeñodeest r uct ur as.

4

De t odosmodos,ycomo concl usi ón,cabe deci rque una sol uci ón en un ár ea de l a l i ngüí st i ca t eór i ca no sol uci ona el pr obl ema cor r espondi ent e en l a l i ngüí st i ca comput aci onal . Losdesar r ol l osdet eor í assi mpl esnosi empr epr opor ci onanpr ocedi mi ent osdeanál i si s eficaces.Ser equi er eesf uer zopar apasardeunat eor í af or malaunat eor í acomput abl e. $.

TRATAMIENTO DEL LENGUAJE GENERACIONAL E INTERPRETACIONAL

La ling)*sti!a !omputa!ional a"orda el tratamiento del lengua#e en aten!i+n a la genera!i+n o la interpreta!i+n del mismo& De esta forma, los pro!esos !omputa!ionales de an%lisis o de genera!i+n ling)*sti!a 4ar*an ampliamente en fun!i+n de lo (ue se pretenda& 3o o"stante, 1los  pro"lemas a los (ue se enfrenta el an%lisis en ling)*sti!a !omputa!ional son ma$ores a los (ue se enfrenta la genera!i+n& La raz+n es sen!illa& 3o es lo mismo tratar de e9presar nuestras inten!iones (ue tratar de !omprender las inten!iones de nuestro interlo!utor& La difi!ultad de la !omprensi+n es ilustrada, entre otros fen+menos ling)*sti!os, por la am"ig)edad2 -Tordera lles!as, >;;: C/& Es  por ello (ue la dis!iplina se !entrar% ampliamente en en an%lisis ling)*sti!o en detrimento de la genera!i+n& En !ual(uier !aso, tanto en el an%lisis !omo en la genera!i+n e interpreta!i+n de la ling)*sti!a !omputa!ional 1se emplean temas !la4es !omo son los del di!!ionario o le9i!+n !omputa!ional, gram%ti!as formales $ formalismos gramati!ales, t8!ni!as de eti(uetado sint%!ti!o -o tagging/ $ analizadores sint%!ti!os -o parsing/2, es de!ir, para el tratamiento inform%ti!o del lengua#e es pre!iso dotar al desarrollo !omputa!ional de un di!!ionario sem%nti!o (ue !ontenga los !on!eptos $ sus defini!iones, tam"i8n de un !on#unto de reglas e instru!!iones gramati!ales en fun!i+n de la lengua empleada, as* !omo de un sistema de interpreta!i+n $ an%lisis sint%!ti!o (ue tenga en !uenta las distintas fun!iones $ !om"ina!iones de los !on!eptos empleados !on el o"#eto de minimizar al m%9imo los m%rgenes de error, so"re todo !on el prop+sito de e4itar las am"ig)edades puesto (ue 1!omputa!ionalmente, aun(ue las ora!iones am"ig)as no !onlle4en ning5n pro"lema para la genera!i+n, en !am"io, di!as ora!iones s* impli!an serios pro"lemas para su !orre!to an%lisis2, puesto (ue 1desde el punto de 4ista de la re!ep!i+n, las am"ig)edades s* suponen un pro"lema, $a (ue el analizador sint%!ti!o no puede determinar (u8 reglas se an apli!ado&2 -Tordera lles!as, >;;: C@/ De esta forma el desarrollo $ perfe!!ionamiento de los m8todos de an%lisis sint%!ti!o se an !on4ertido en el prin!ipal !ampo de estudio de la ling)*sti!a !omputa!ional& Los m8todos (ue an ad(uirido una ma$or rele4an!ia en este sentido son el Tagging $ el Parsing: En !uanto al )*++,-+ ,-)/0),01, su prin!ipal o"#eti4o 1es eti(uetar las unidades ling)*sti!as de la !adena (ue se 4a a analizar, es de!ir, de lo (ue se en!arga es de asignar !ategor*as gramati!ales a las distintas pala"ras -o unidades l89i!as/ a partir de la informa!i+n !ategorial disponi"le en el di!!ionario o le9i!+n&2 -Jurafs$ $ 6art*n, >>>: F=G !itado por Tordera lles!as, >;;: H>/& Por  5

!onsiguiente el tagging supone un pro!eso !omple#o de"ido a la am"ig)edad !ategorial e9istente en las lenguas naturales: E#& La !anto tan "ien, (ue la 4ol4er*a a !antar una $ otra 4ez& Donde 1la2 puede ser un arti!ulo femenino o "ien un pronom"re %tono& 1!anto2 puede ser  sustanti4o o primera persona del plural del 4er"o !antar& 1"ien2 ad4er"io modal o sustanti4o& 1ue2 relati4o !ompleti4o o !omparati4o o !onse!uti4o& -Tordera lles!as, >;;: H;/& E9isten diferentes m8todos de tagging& As* tenemos el m8todo ling)*sti!o, el m8todo estad*sti!o $ el m8todo por aprendiza#e autom%ti!o: El m8todo ling)*sti!o 1se "asa en reglas por patrones, los !uales 1est%n formados por un di!!ionario, (ue asigna a !ada pala"ra al menos una de las posi"les eti(uetas -!ategor*as/ $ un !on#unto de reglas destinadas a determinar una 5ni!a eti(ueta ade!uada para las pala"ras am"ig)as dado el !onte9to sint%!ti!o en el (ue se insertan&2 El m8todo estad*sti!o 1#unto al m8todo de reglas por patrones es el m8todo m%s utilizado !omo t8!ni!a de tagging2& .omo su propio nom"re *ndi!a, se fundamenta en las pro"a"ilidades de apari!i+n de una fun!i+n dentro elemento sint%!ti!o en aten!i+n a las distintas 4aria"les $ reglas gramati!ales de uso& El m8todo de aprendiza#e autom%ti!o (ue persiguen (ue el sistema !omputa!ional sea !apaz de aprender a !ategorizar mediante 1reglas de indu!!i+n (ue parten de una eti(ueta por defe!to $ se a!epta siempre (ue sean re!azados el resto de !andidatos2 -Tordera lles!as, >;;: H;H@/& En lo respe!ti4o al 2*3,-+, se parte del !ono!imiento de (ue una gram%ti!a formal ofre!e un !on#unto de reglas, pero lo (ue no e9pli!ita la gram%ti!a es (u8 reglas se an de apli!ar ni tampo!o en (u8 orden& 1 este es el o"#eti4o de las t8!ni!as de parsing& Las t8!ni!as de parsing an de dar !uenta de las reglas apli!adas, el orden, e in!luso, de otras posi"les reglas (ue pudieran a"er  sido apli!adas& La 4aria"ilidad en el orden de apli!a!i+n de las reglas sele!!ionadas no es una  propiedad e9!lusi4a de las gram%ti!as sintagm%ti!as, sino (ue las gram%ti!as no sintagm%ti!as tam"i8n muestran esta propiedad $, por tanto, distintas formas de analizar una ora!i+n2, es de!ir, 1el orden en el (ue se apli!an las distintas reglas !ategoriales no es una !uesti+n (ue est8 determinada propiamente por la gram%ti!a !ategorial2 puesto (ue 1una gram%ti!a formal lo (ue no determina tampo!o es (u8 reglas se an de apli!ar para el !orre!to an%lisis, lo (ue supone un  pro"lema para las am"ig)edades sint%!ti!as&2 -Tordera lles!as, >;;: HH/&  E#& El ni'o 4io al poli!*a !on los prism%ti!os& Donde sin un !onte9to pragm%ti!o no se  puede determinar sin el ni'o 4io al poli!*a a tra48s de unos prism%ti!os o "ien si el ni'o 4io a un  poli!*a (ue porta"a unos prism%ti!os&

6

 As* pues, aun(ue una gram%ti!a formal pueda e9pli!itar las reglas, no puede determinar (u8 reglas se an de apli!ar ni en (u8 orden& 1El parsing es un algoritmo !omputa!ional !u$o o"#eti4o es dar !uenta, pre!isamente, de las reglas (ue se apli!an $ el orden en (ue estas se apli!an& esto es, (u8 se sa"e, los parsers -los analizadores sint%!ti!os/ forman parte de la informa!i+n pro!edimental  esto es, !+mo se apli!a di!o !ono!imiento2 -6oreno 7ando4al, ;>& 0risman, Ralp ;
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF