Algunos datos sobre corpus orales y proyectos de investigación en lingüística de corpus. En principio, el acceso a los corpus que detallo más abajo es limitado. Los he agregado a los enlaces útiles-corpus.

El Corpus (oral) de Referencia de la Lengua Española Contemporánea es un proyecto del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid, con dirección de Francisco Marcos Marín. El corpus oral de lengua hablada consta de 1,1 millones de palabras transliteradas en soporte informático. Pueden consultarse ejemplos de transliteraciones en el mismo portal. También se brinda información metodológica muy completa

El Corpus de Conversación Coloquial es un proyecto del Grupo Val.Es.Co. (Universidad de Valencia). Se trata de la trascripción de 341 horas de grabación de conversaciones informales. Pueden descargarse muestras en un archivo PDF de transcripciones del corpus o muestras en un archivo de audio (25,5 megas).

PRESEEA (Proyecto para el estudio sociolingüístico del español de España y de América) es un proyecto coordinado por el Departamento de Filología de la Universidad de Alcalá de Henares que agrupa a más de 30 equipos de investigación sociolingüística de Iberoamérica. Su objetivo es crear un corpus de de lengua española hablada representativo del mundo hispánico en su variedad geográfica y social. El portal del grupo brinda también interesantes recursos y enlaces útiles. Fuente: blog de Joaquim Llisterri.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s