Extracción y organización del conocimiento de etiquetados. Aplicación a etiquetados en repositorios digitales sobre arte

Gonzalo A. Aranda Corral

Departamento de Tecnologías de la Información, Universidad de Huelva (España)
garanda@us.es

Joaquín Borrego Díaz

Departamento de Ciencias de la Computación e Inteligencia Artificial, Universidad de Sevilla (España)
jborrego@us.es

Juan Galán Páez

Departamento de Ciencias de la Computación e Inteligencia Artificial, Universidad de Sevilla (España)
juangalan@us.es
Janus. Anexo 1 (2014)
Fecha de publicación: 11/04/2014
[Cómo citar]
<URL: http://www.janusdigital.es/anexos/contribucion.htm?id=9>
Descargar PDF
Resumen

El análisis formal de conceptos (FCA) es una rama de la matemática aplicada cuyo objetivo es el descubrimiento, extracción y organización de conocimiento a partir de datos cualitativos. La teoría provee técnicas para poder razonar con el conocimiento extraído. Es decir, FCA es una aproximación a la minería de datos con una componente semántica (conceptos formales) y una componente lógico-computacional (reglas de asociación y razonamiento automático).
El objetivo de este trabajo es comprobar la aplicabilidad de FCA para tratar conocimiento a partir de repositorios digitales que mantienen la información etiquetada. Desde el punto de vista de FCA, se pretende estudiar la estructura de los conceptos que subyacen en repositorios digitales de arte. La idea es detectar patrones en la estructura conceptual de este tipo de etiquetados, con el objetivo a largo plazo de establecer medidas que estimen la calidad de éstos.
Entre otros, analizaremos etiquetados como los de Baroque Art del laboratorio CulturePlex (<http://baroqueart.cultureplex.ca/>) y el Visual Archive of Gothic Architecture and Sculpture in Ireland (<http://www.gothicpast.com/>). Compararemos su estructura con la conceptualización asociada a subconjuntos notables de WordNet (<http://wordnet.princeton.edu/>).
Bajo la denominada hipótesis de la conceptualización libre de escala (Aranda Corral et al., 2012a), se estima la potencia de los etiquetados. También se presentarán técnicas automatizadas para enriquecer el etiquetado mediante sugerencias basadas en razonamiento automático adaptación de las utilizadas en Delicious (Aranda Corral et al., 2012b).

Palabras clave: Repositorios digitales, semántica emergente, análisis formal de conceptos, etiquetación de contenidos, humanidades digitales


Abstract

Formal Concept Analysis (FCA) is a branch of Applied Mathematics whose aim is to discover, extract and organize knowledge from data. FCA provides techniques and tools to reason with such knowledge.
The aim of this paper is to analyse the applicability of FCA to cultural digital repositories that use tagging. It is possible to study the structure of concepts implicit in the tags by means of FCA, in such way that it is possible to detect some patterns allowing the estimation of the soundness of these tag set.
Among other examples, we apply results from (Aranda Corral et al., 2012a) to analyse two repositories about art: Baroque Art from CulturePlex Lab (http://baroqueart.cultureplex.ca/) and the Visual Archive of Gothic Architecture and Sculpture in Ireland (http://www.gothicpast.com/). The conceptual structure extracted from both repositories is compared with the one from WordNet (http://wordnet.princeton.edu/), which is an example of successful semantic representation.
Under the called Scale-Free Conceptualization hypothesis (SFCH) (Aranda Corral et al., 2012a), the soundness of tagging sets (folksonomies) is estimated.

Keywords: Digital Repositories, Emergent Semantics, Formal Concept Analysis, Content tagging, Digital Humanities