Subproyectos

KRUA

Knowledge discovery and Representation in Human Language Technology. IP: Patricio Martínez (UA)

  • Desarrollo de técnicas basadas en conocimiento aplicadas a HLT mono y multilingüe.
  • Estudio y aplicación de mecanismos de inferencia de conocimiento e implicación de conocimiento (text entailment) en sistemas Búsqueda de Respuestas mono y multilingüe.
  • Mecanismos de adaptación automática de dominios generales a dominios específicos.
  • Estudio de la aplicación de técnicas comunes en el proceso de la Búsqueda de Respuestas en textos estructurados y/o textos con imágenes.
  • Estudio de la interactividad en Búsqueda de Respuestas, Extracción de Información y Recuperación de Información.

INES

Intelligent exploration and synthesis of search results. IP: Julio Gonzalo (UNED)

  • Desarrollo de sistemas inteligentes de organización, visualización, exploración y síntesis de resultados de búsqueda.
  • Estudio de los aspectos translingües de la búsqueda sobre colecciones multimedia (imágenes, transcripciones de audio/video)
  • Desarrollo de metodologías de evaluación para sistemas de minería de textos, y organización de campañas internacionales de evaluación competitiva de acuerdo con estas tecnologías.

TIMOM

Tratamiento de Información multiMOdal y Multilingüe. IP: Alfonso Ureña (UJA)

  • Estudio y mejora del sistema de RI multilingüe para que sea más robusto.
  • Desarrollo de un modelo multimodal (texto + imágenes) que combine mediante utilizando varias técnicas los resultados parciales.
  • Tratamiento semántico de la información.
  • Aplicación de técnicas de clasificación.

MiDEs

Métodos de Aprendizaje para Minería de Textos en Dominios Específicos. IP: Ferran Pla (UPV)

  • Desarrollo de técnicas basadas en modelos estadísticos para tareas de extracción de información; en particular, detección y clasificación de entidades y sus relaciones.
  • Adaptación de las técnicas de Extracción de Información desarrolladas para la localización de información en un dominio específico como el biomédico, y su combinación con técnicas de clasificación, para la construcción y actualización de bases de datos sobre dicho dominio.
  • Aprendizaje automático de patrones para búsqueda de respuestas utilizando recursos web.

SAMiT

Sistemas Adaptativos de Minería de Textos. IP: Alicia Ageno (UPC)

  • Adaptive Named-Entity Recognition and Classification: Aplicación de técnicas de aprendizaje automático al reconocimiento y clasificación de entidades nombradas, haciendo énfasis especial en la clasificación en taxonomías de granularidad fina (EXTENDED NAMED ENTITIES), a los enlaces multilingües entre entidades nombradas y a la adaptación a diferentes medios (transcripciones orales o texto escrito) y dominios.
  • Desarrollo de metodologías de búsqueda de respuesta (Question Answering) para ciertas problemáticas: la búsqueda de respuesta incremental, la búsqueda de respuesta definicional y la búsqueda de respuesta en transcripciones orales.
  • Adaptive Information Extraction: desarrollo de técnicas basadas en aprendizaje automático (supervisado y no supervisado) para la inducción de patrones para la extracción de información. Se trabajará tanto sobre dominios no restringidos (OPEN DOMAIN) como en la adaptabilidad de estas técnicas a dominios concretos o a diferentes medios (oral -transcripciones orales- y escrito)
  • Generación de paráfrasis: desarrollo y aplicación de técnicas diversas para el aprendizaje automático de paráfrasis, tanto a nivel léxico como oracional.

Lang2World

Discovering world knowledge coded into language. IP: Toni Martí (UB)

  • Avance y mejora de herramientas y recursos de PLN a nivel sintáctico y semántico basado en conocimiento aplicado a las tareas HLT.
  • Desarrollo de metodologías basadas en el conocimiento lingüístico aplicadas a la identificación de las entidades relevantes en el marco de la minería de textos (text mining), en concreto reconocimiento y clasificación de extended named entities y extracción de terminología de dominios específicos.
  • Identification and formalization of the linguistic knowledge necessary for pattern extraction and paraphrase machine learning tasks and the detection of given and new information.
  • Desarrollo de corpus etiquetados a diferentes niveles de análisis fundamentados lingüísticamente para la aplicación de técnicas de aprendizaje automático de sistemas supervisados de las diferentes tareas del proyecto.
subproyectos.txt · Última modificación: 2009/07/15 15:10 por admin
CC Attribution-Noncommercial-Share Alike 3.0 Unported www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0