El canon literario hispanoamericano en la era digital

Carolina Ferrer

Université du Québec à Montréal (Canada)
ferrer.carolina@uqam.ca
Janus. Anexo 1 (2014)
Fecha de publicación: 11/04/2014
[Cómo citar]
<URL: http://www.janusdigital.es/anexos/contribucion.htm?id=17>
Descargar PDF
Resumen

En este artículo, propongo un método alternativo al tradicional para la constitución del canon literario. En vez de basar la determinación del canon en diferentes valores y criterios, extraigo de la base de datos Modern Language Association International Bibliography los autores y las obras con el mayor número de referencias. Específicamente, mi objeto de estudio es la literatura hispanoamericana. A través de la minería de datos, obtengo una muestra de más de 75.000 referencias que nos permite observar la bibliografía crítica de las diecinueve literaturas nacionales de Hispanoamérica. Este método cuantitativo arroja un corpus de 451 obras y 717 autores que son citados más de 100 veces en la base de datos analizada. Consecuentemente, esta bibliografía no es el resultado de criterios subjetivos de selección, sino que se basa en la ley de los grandes números. Asimismo, este estudio es una demostración de la pertinencia de utilizar métodos cuantitativos para analizar las bases de datos bibliográficas digitales con el propósito de profundizar nuestros conocimientos del campo literario.

Palabras clave: Canon literario, literatura hispanoamericana, minería de datos, bibliometría, métodos cuantitativos


Abstract

In this article, I propose an alternative technique to the traditional method of constitution of the literary canon. Instead of basing the determination of the canon on different values and criteria, I scrutinize the Modern Language Association International Bibliography database in order to determine the most cited authors and literary works. Specifically, I study Spanish American literature. Thus, through the process of data mining, I obtain a sample of over 75,000 references that allows us to observe the critical bibliography about the nineteen national literatures of the subcontinent. This quantitative technique yields a corpus of 451 titles and 717 writers that are cited more than 100 times in the database. Consequently, this bibliography is not the result of subjective selection criteria, but is based on the law of large numbers. Furthermore, this study shows that the quantitative analysis of bibliographic digital databases is an effective way to bring new light to the field of literary studies.

Keywords: Literary canon, Spanish American literature, data mining, bibliometrics, big data