miércoles, 10 de octubre de 2007

Tercer artículo (Parte I)

El artículo del que se escribe el resumen en "On Relevance, Probabilistic Indexing and Information Retrieval" de M. E Maron y J. L. Kuhns.

Dado que es algo más amplio haré varios resumenes sobre dicho artículo. En esta primera parte únicamente se comenta el contenido del abstract.

El articulo introduce una nueva técnica basada en la noción de relevancia. Este concepto es tomado como clave en la teoría de recuperación de información. Para la comparación se usa un concepto de relevancia explicado en términos probabilísticos.

La técnica de "Indexado Probabilístico" devuelve para una consulta dada y cada documento una medida (relevancia) probabilistica que indica la probabilidad de que el documento satisfaga la consulta.

El articulo continua citando que en los sistemas convencionales las referencias cruzadas ("see") solamente responde al parecido semántico. Por contra, en los sistemas de "parecido" entre términos de manera estadística la máquina puede modificar la propia consulta para incrementar la probabilidad de obtener documentos relevantes.

No hay comentarios: