Las redes sociales como corpus de estudio para el Análisis del discurso mediado por ordenador

Ana Mancera Rueda

Universidad de Sevilla (España)
anamancera@us.es

Ana Pano Alamán

Università di Bologna (Italia)
ana.pano@unibo.it
Janus. Anexo 1 (2014)
Fecha de publicación: 11/04/2014
[Cómo citar]
<URL: http://www.janusdigital.es/anexos/contribucion.htm?id=28>
Descargar PDF
Resumen

El propósito de este artículo es demostrar cómo las interacciones que tienen lugar en las redes sociales pueden aportar multitud de datos lingüísticos y de discursos heterogéneos que presentan una gran variedad de registros y de estilos. Todo ello convierte a este tipo de textos en un corpus ideal para su estudio desde la metodología del Análisis del discurso mediado por ordenador, una disciplina cuyo principal objetivo es la investigación de las propiedades lingüísticas y pragmáticas de los productos discursivos de impronta digital. Además, en este trabajo nos hemos propuesto realizar una revisión de los postulados centrales de la Lingüística de corpus, haciendo especial hincapié en las ventajas de establecer un corpus para estudiar documentos extraídos de la Red, pero sin dejar de lado los problemas que ello puede conllevar, como la selección del método más adecuado para la recolección de datos, la necesidad de que estos sean lo suficientemente representativos, y la importancia del respeto a la privacidad de los usuarios. Teniendo en cuenta estas cuestiones hemos constituido un corpus de mensajes extraídos de las redes sociales Facebook, Twitter y Tuenti, que nos permitirán analizar cómo se manifiesta en ellos la variación lingüística y, en concreto, la modalidad de uso coloquial, por medio de una serie de recursos ortográficos y de una peculiar selección léxica. En definitiva, en esta investigación pretendemos ofrecer una panorámica que recoja los principales desafíos a los que debe hacer frente el Análisis del discurso mediado por ordenador y sus métodos de investigación, en el contexto de las Humanidades digitales.

Palabras clave: Análisis del discurso mediado por ordenador, Lingüística de corpus, redes sociales, variación lingüística, español coloquial


Abstract

The aim of this paper is to show how the interactions that take place in social networks can provide plenty of linguistic data and heterogeneous discourses presenting a variety of registers and styles. This type of texts can constitute a useful corpus for the research, using the methodology of Computer-Mediated Discourse Analysis, a discipline whose main objective is the study of linguistic and pragmatic properties of digital discursive products. Moreover, in this study we aimed to make a review of the main theories of Corpus Linguistics, with particular emphasis on the advantages of establishing a corpus to study documents extracted from the Internet, but without neglecting the problems this can lead, such as selecting the most appropriate method for data collection, the need for these data to be sufficiently representative, and the importance of respecting the privacy of users. According to these issues we have created a corpus of messages extracted from three social networks: Facebook, Twitter and Tuenti. It will allow us to explore in them the linguistic variation and, in particular, the samples of colloquial use, by a number of resources of a peculiar spelling and lexical selection. In conclusion, in this research we want to give an overview to the most important challenges that must face the Computer-Mediated Discourse Analysis and its research methods in the context of Digital Humanities.

Keywords: Computer-Mediated Discourse Analysis, Corpus Linguistics, Social Networks, Linguistic Variation, colloquial Spanish