Planificacion Automatica

March 22, 2018 | Author: shelley Khloe | Category: Html, Cognitive Science, Psychology & Cognitive Science, Cognition, Technology
Share Embed Donate


Short Description

Descripción: Marco Teorico de Planificacion Automatica...

Description

UNIVERSIDAD NACIONAL DEL CALLAO ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS

CURSO: INTELIGENCIA ARTIFICIAL

PROFESOR: ALCANTARA RAMIREZ, MANUEL

TEMA: PLANIFICACIÓN AUTOMÁTICA Y EXTRACCIÓN DE LA INFORMACIÓN

ALUMNA: PARIHUAMAN ALMINAGORTA, SHELLEY RAQUEL

CODIGO: 1125220221

2015

Planificación Automática Donde veremos cómo un agente puede extraer ventaja del conocimiento de la estructura de un problema para construir complejos planes de acción.

I.

Agentes Planificadores

Desde principios de los ‘70, la comunidad de IA especializada en planificación se ha preocupado del problema de diseño de agentes artificiales capaces de actuar en un entorno. La planificación se puede ver como una forma de programación automática: el diseño de un curso de acción que satisfará un cierto objetivo. Dentro de la comunidad de la IA simbólica, se ha asumido desde hace tiempo que algún tipo de sistema planificador debe formar parte de los componentes centrales de cualquier agente artificial. La idea básica es dotar al agente planificador:  Representación del objetivo a alcanzar  Representación de las acciones que puede realizar  Representación del entorno  Capacidad de generar un plan para alcanzar el objetivo

II.

Planificación ¿Qué es un plan? Es una secuencia (lista) de acciones, que llevan de un estado inicial a un estado final. Llamaremos planificación al proceso de búsqueda y articulación de una secuencia de acciones que permitan alcanzar un objetivo.

III.

Ejemplos paradigmáticos de planificación Hay ejemplos que se repiten de forma reiterada en la literatura de Planificación  Torres de Hanoi  8-puzzle, 15-puzzle,….  Mundo de los bloques (Blocks World)

IV.

Aplicaciones:  Aplicaciones de la Planificación: en la vida diaria

Ejemplo de Han Yu (University of Central Florida)

 Aplicaciones de la Planificación: gestión de workflows

Ejemplo de Han Yu (University of Central Florida)  Aplicaciones de la Planificación: exploración espacial Mars Exploration Rovers; La planificación de las tareas a realizar durante un día marciano se realiza automáticamente por un programa a partir de los objetivos de exploración que fija el personal de misión en la Tierra.

V.

Arquitectura de un Sistema de Planificación Automática

VI.

Tipos de Planes  Planes parcialmente ordenados (Partial-order plan) - Compuesto por un conjunto de acciones ordenadas parcialmente. - Existen restricciones de secuencia en estas acciones. - Un algoritmo de generación de planes se puede usar para transformar un plan parcialmente ordenado en un plan totalmente ordenado  Planes totalmente ordenados (Total-order plan) - Compuesto por un conjunto de acciones totalmente ordenado.

VII.

Planificación Clásica Considera entornos que son: o Completamente observables: el planificador percibe perfectamente el estado del entorno y el efecto de sus acciones en el entorno. o Deterministas: se pueden predecir y predefinir los efectos de todas las acciones o Finitos: existe un conjunto finito de acciones y de estados o Estáticos: el entorno solo cambia cuando el agente planificador actúa sobre él. o Discretos: el entorno se puede describir de forma discreta… o Tiempo discreto (se suele medir en ciclos de ejecución) o Acciones discretas (las acciones suelen verse como unidades y necesitar un ciclo de ejecución) o Objetos discretos: las descripciones de los objetos son discretas o Efectos discretos: los efectos de las acciones suelen ser directamente observables una vez se ha ejecutado la acción.

 Planificación Clásica: teoría formal (I)  Ac = {α1, ... , αn}: un conjunto fijo de acciones.  < Pα, Dα, Aα> un descriptor para una acción  Pα es un conjunto de fórmulas en lógica de primer orden que caracterizan la precondición de la acción α  Dα es un conjunto de fórmulas en lógica de primer orden que caracterizan aquellos hechos que se vuelven falsos por la ejecución de α (‘delete list’)  Aα es un conjunto de fórmulas en lógica de primer orden que caracterizan aquellos hechos que se vuelven ciertos por la ejecución de α (‘add list’)  Un problema de planificación es una tripleta  Planificación Clásica: teoría formal (II)  π=(α1, ... , αn): un plan con respecto al problema de planificación determina una secuencia de n+1 modelos:  donde ∆0 = ∆ y  Un plan π es aceptable ssi ,para todo  Un plan π es correcto ssi  π es aceptable, y VIII.

Métodos de Planificación: 1. Planificación Lineal: STRIPS Objetivo: construcción de un sistema de control para el robot Shakey

Representación de operadores -Problema del marco: ¿qué ocurre con el contexto del mundo cuando se ejecuta una acción? -Solución (hipótesis strips): solo cambian las cosas que aparecen en las post-condiciones de cada operador -Búsqueda: Nodos: estado actual y pila de metas-operadores Nodo raíz: estado inicial y conjunción de metas

Heurística: seleccionar siempre alguno de los sucesores de cada nodo -Idea: Meter en la pila las metas por conseguir y los operadores que consiguen dichas metas. Sacar de la pila las metas que sean ciertas en el estado actual y los operadores que se ejecuten. Algoritmo de strips Repetir hasta que pila=0 OR no se puedan expandir más nodos - Si la cima de la pila del nodo es una conjunción de metas -Si la conjunción es cierta en el estado Entonces se elimina de la pila -Si no, generar como sucesores todas las posibles combinaciones de las metas Seleccionar una de ellas - Si la cima de la pila del nodo es una meta - Si la meta es cierta en el estado Entonces se elimina de la pila - Si no, Si hay bucle de meta Entonces retroceder -Si no, generar un sucesor por cada instanciación de operador que añade dicha meta Si hay sucesores Entonces elegir uno Si no, retroceder - Si la cima de la pila del nodo es un operador instanciado Si el operador instanciado se puede ejecutar Entonces ejecutar operador, quitarlo de la pila y añadirlo al plan Si no, se introducen sus precondiciones en la pila Representación de operadores QUITAR(x; y) Precondiciones: encima(x; y),libre(x),brazo-libre Añadidos: sujeto(x),libre(y) Borrados: encima(x; y),brazo-libre,libre(x) LEVANTAR(x) Precondiciones: en-mesa(x),libre(x),brazo-libre Añadidos: sujeto(x) Borrados: en-mesa(x),brazo-libre,libre(x) PONER(x; y) Precondiciones: sujeto(x),libre(y) Añadidos: encima(x; y),libre(x),brazo-libre Borrados: sujeto(x),libre(y) DEJAR(x) Precondiciones: sujeto(x) Añadidos: en-mesa(x),libre(x),brazo-libre Borrados: sujeto(x)

Ejemplo de strips

Problema: linealidad STRIPS asume independencia entre las metas, por lo que las trata linealmente: hasta que no encuentra un plan para obtener una meta, no pasa a las siguientes metas. No funciona cuando hay recursos limitados, por lo que es: Incompleta: existe solución, pero no la encuentra Problema del cohete chino

No optima: no encuentra la solución optima anomalía de sussman

2. Planificación No Lineal Consideración de varias metas al mismo tiempo. Pensar con un conjunto de metas: no es necesario generar completamente un plan de una meta para estudiar al mismo tiempo el resto

Expandir un grafo en el que las metas (y los operadores) son nodos y se pueden seleccionar las metas en cualquier orden

Según espacio de problemas: -Estados (strips, prodigy): nodos del _árbol representan estados -Planes (noah, tweak, ucpop, snlp, o-plan): nodos del 9árbol representan planes Según plan generado: -Orden total: secuencia _única de operadores -Orden parcial: múltiples secuencias posibles Según toma de decisiones: -Compromiso casual: toman decisiones continuamente -Mínimo compromiso: solo toman decisiones cuando se ven forzados  No hay una técnica mejor que otra IX.

Expresividad y extensiones

Extracción de Información Cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por la máquina. I.

Visión Panorámica

En la actualidad, la información constituye un elemento de gran importancia dentro de nuestras vidas. La tecnología moderna nos ha puesto delante volúmenes increíbles de información, mucha de la cual, por estar disponible en textos escritos en lenguaje natural sin restricciones, necesita de un procesamiento previo para poder ser usada y aplicada a la resolución de los problemas que tenemos que enfrentar. Debido al gran almacenamiento de información existente en textos, el tiempo que requiere su procesamiento manual para la extracción de aquella que resultante relevante es muy pequeño. Por eso se va haciendo imprescindible el uso de sistemas automáticos que ayuden a procesar o extraer el contenido conceptual encerrado en esos volúmenes. Un aspecto fundamental de este proceso de información tiene que ver con la cantidad de conocimiento que deberá ser aplicado para la extracción de información relevante a la solución del problema, el cual, por lo general, solo tienen los expertos en el problema y la necesidad, por tanto, de hacer asequible y manipulable este conocimiento para su resolución. Una de las estrategias más comúnmente adoptadas es la Recuperación de Información, pero la Extracción de Información - técnica de Inteligencia Artificial- es una estrategia diferente, ya que a partir de la primera se obtienen documentos con información significativa, mientras que un sistema de Extracción obtiene hechos de los documentos, son por tanto, complementarios. Los sistemas de Extracción de Información (SEI) operan en un contexto formado por un conjunto de textos en lenguaje natural para extraer determinados conceptos que son de nuestro interés para una aplicación específica. Estos textos, en unión de la información definida para ser extraída, conforman el dominio de trabajo de un SEI.

II.

¿En qué consiste?

La extracción de información consiste en obtener información de forma selectiva de un documento. Previamente se ha de haber determinado el tipo de información que interesa extraer para cada uno de los dominios que se van a tratar. Para ello se definen unas plantillas o esquemas correspondientes al dominio del problema que se desea tratar. El proceso de extracción consiste en procesar los documentos, detectar para cada uno de ellos el tipo (o los tipos) de plantillas a los que se ajusta y rellenar los campos de cada plantilla seleccionada con elementos extraídos del documento.

III. Patrones de extracción de la información Debido al enorme volumen de datos, que además se incrementan cada minuto, es muy complicado poder recuperar información relevante. Y se consideran relevantes las páginas que son capaces de satisfacer una necesidad de información del usuario. Para que los buscadores sean capaces de recuperar páginas con información relevante han de extraer la información clave. Por lo tanto la recuperación y la extracción de la información están relacionadas. No pudiéndose recuperar páginas relevantes de las que no se haya extraído antes los datos clave. Los criterios de extracción de los datos son: - Patrones Léxicos. Los patrones de tipo léxico son las palabras que utilizamos para la búsqueda de información. Estas palabras se analizan por si solas y de forma independiente al contexto. Incluso a nivel básico como es la palabra hay problemas para su correcto procesado. Los más comunes, y en algunos casos corregidos automáticamente por los buscadores son:  Puntuación: URSS vs U.R.S.S  Capitalización: Madrid vs MADRID  Espaciamiento: J.S. ELCANO vs J. S. ELCANO  Abreviaciones y acrónimos: "extracción de información" vs EI

   

Omisión de caracteres: Madness vs Madnes Adición de caracteres: Madness vs Maddness Substituciones: Day vs Dai Cambio de orden: daily vs dialy

Las formas de corregir estos errores son para la capitalización y la puntuación con el uso de normalización. Y para las abreviaciones y acrónimos se suelen utilizar tablas de traducción. Con los problemas de cambio de caracteres se utilizan algoritmos de cálculo de coste variable llamado "Distancia de cambiar de una unidad de información A a otra B" que queda de definida de la siguiente forma: D(A,B) = min [ S + I + B] Donde S es el número de caracteres sustituidos, I es el número de inserciones realizadas, y B se refiere al número de letras que han sido eliminadas. De esta forma se pueden utilizar patrones léxicos para la extracción y recuperación de palabras que aunque no se deletrean igual, léxicamente se refieren a la misma información. - Patrones Sintácticos. El patrón sintáctico más usado en la recuperación de la información es el llamado part-of-speech (POS) de una palabra, es decir, las partes del habla que son: sustantivo, verbo, artículo, adjetivo, etc. En la recuperación de información se realiza un marcaje de "POS" cuando se asignan estas categorías gramaticales a cada palabra dada, es decir, cuando se indica la función de cada palabra en el contexto específico de la oración. Este marcaje se hace considerando características morfológicas y sintácticas del lenguaje, esto es importante ya que los nombres generalmente designan personas, lugares, cosas, y otros conceptos físicos y abstractos, los verbos suelen utilizarse para designar acciones y procesos y los adjetivos describen propiedades y estados de los nombres. En este proceso de reconocimiento de patrones, lo que se obtiene al final es un etiquetado de la siguiente forma:

El resto según la categorización de DeRose (1988) [1]: AT=artículo, VB=verbo, RB=adverbio, VBD="past-tense-verb", PPO=pronombre personal y PP$=pronombre posesivo

Este etiquetado seguiría con cada unidad sintáctica, especialmente con el verbo, en el que se tendría que tener en cuenta las terminaciones verbales para saber a que modo, tiempo, persona y voz, corresponde una unidad de información. - Patrones Semánticos. Los patrones de tipo semántico se basan en los metadatos semánticos que se añaden a la web para describir el contenido, el significado y la relación de los datos. En la actualidad, la World Wide Web está basada principalmente en documentos escritos en HTML, un lenguaje de marcas que sirve para crear hipertexto en Internet. HTML es válido para adecuar el aspecto visual del documento e incluir objetos multimedia en el texto (imágenes, esquemas de diálogo, etc.). Pero da pocas posibilidades para categorizar los elementos que configuran el texto más allá de las típicas funciones estructurales, como sucede con otros lenguajes de maquetación (tipo LaTeX). HTML permite mediante una herramienta de visualización (como un navegador o un agente de usuario) mostrar por ejemplo un catálogo de objetos en venta. El código HTML de este catálogo puede explicitar aspectos como "el título del documento" es Ferretería Acme; pero no hay forma de precisar dentro del código HTML si el producto M270660 es una "batería Acme", con un "precio de venta al público" de 200 €, o si es otro tipo de producto de consumo (es decir, es una batería eléctrica y no un instrumento musical, o un puchero). Lo único que HTML permite es alinear el precio en la misma fila que el nombre del producto. No hay forma de indicar "esto es un catálogo", "batería Acme" es una batería eléctrica, o "200 €" es el precio. Tampoco hay forma de relacionar ambos datos para describir un elemento específico en oposición a otros similares en el mismo catálogo. La Web Semántica se ocupará de resolver estas deficiencias. Para ello dispone de tecnologías de descripción de los contenidos, como RDF y OWL, además de XML, el lenguaje de marcas diseñado para describir los datos. Estas tecnologías se combinan para aportar descripciones explícitas de los recursos de la Web (ya sean estos catálogos, formularios, mapas u otro tipo de objeto documental). De esta forma el contenido queda desvelado, como los datos de una base de datos accesibles por Web, o las etiquetas inmersas en el documento (normalmente en XHTML, o directamente en XML, y las instrucciones de visualización definidas en una hoja de estilos aparte). Estas etiquetas hacen posible a los gestores de contenidos interpretar los documentos y realizar procesos inteligentes de captura y tratamiento de información.

- Patrones de discurso. El uso de patrones de discurso para la extracción y recuperación de información, está referido a las características de unidades de información dentro de un marco de discurso, o dentro de un marco de escritura o de estilo. Un ejemplo muy simple sobre estos patrones de extracción es el llamado "discourse distance". En el proceso de extracción la distancia entre dos entidades de información es a menudo importante pues se asume que la distancia es inversamente proporcional con relación de significados. Los patrones de discurso más importantes, que como se puede ver están en relación con los semánticos son:  Atributos retóricos  Atributos temporales  Atributos de relaciones espaciales Los esquemas de usos de patrones de discurso usados más recientemente apuntan a describir el contenido temporal de las páginas Web para poder realizar inferencias sobre las mismas. IV. Arquitectura General Ésta arquitectura genérica es descrita como "una cascada de módulos que en cada paso agregan estructura al documento, y algunas veces, filtran información relevante por medio de aplicar reglas o patrones".

V.

El Problema

El problema consiste en la generación de un sistema de extracción de información sobre el dominio de las inscripciones de inmuebles o terrenos a expropiar por un municipio para realizar distintos tipos de obras. Se pretende obtener información relevante en base a estructuras de datos previamente definidas –plantillas de elementos- de los escribanos actuantes, los padrones catastrales involucrados en la operación, la ubicación de éstos, su registro (inscripción y fecha), el destino de la expropiación,

etc. Los elementos a ser extraídos se presentan en una plantilla en la Fase 3 de la Descripción del sistema. Descripción del sistema Fase 1: Tokenización: con la ayuda del tagger Freeling, etiquetar cada palabra de documento, así como signos de puntuación. Fase 2: Reconocimiento: i) Entidades con nombre: con la ayuda de diccionarios, habrá que identificar nombres de las personas (escribanos en este caso) actuantes en el acto de la inscripción. ii) Números: padrón, inscripción iii) Fechas iv) Direcciones Fase 3: Confección y llenado de una estructura de plantilla(XML) con la información extraída en el reconocimiento:

Recursos necesarios para el desarrollo Se piensa que el desarrollo del reconocedor puede estar escrito en Perl o Jlex (para encontrar los patrones que conforman las plantillas). Se utilizarán los siguientes recursos: -

Tagger Freeling Diccionario de nombres Corpus de escrituras de inscripciones sin formato

Referencias Bibliográficas y Webgráficas:  Grupo de Planificación y Aprendizaje (PLG) - Universidad Carlos III de Madrid  RUSSELL, S. J.: NORVlG, P. INTELIGENCIA ARTIFICIAI. UN ENFOQUE M0DERNO Segunda edición PEARSON EDUCACION. S.A., Madrid. 2004  file:///G:/Protected/UNAC/IA/4-PL1-IntroPlanificaci%C3%B3n.pdf  Julio. Gonzalo. Arroyo. y M. Felisa. Verdejo. Maíllo. - Tecnologías del Lenguaje (Recuperacion Y extracción del Lenguaje)  Referencia [1] DeRose, Stephen J. 1988. Grammatical category disambiguation by statistical optimization. Computational Linguistics 14.1: 31-39.  http://www.itl.nist.gov/iaui/894.02/related_projects/muc/index.html  http://recupera1patrones.50webs.com/  http://www.galeon.com/recuperacionpatrones/arquitectura.html

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF