8/19/2006

¿Cómo puede ayudar la lingüística de corpus al desarrollo de la enseñanza/ aprendizaje del español con fines específicos?

La lingüística de corpus emplea una metodología de un carácter empírico: sus investigaciones se basan en colecciones extensas de textos naturales, llamadas corpora (un ejemplo en http://www.deli.deusto.es/VHosts/Deli/Directory/edp/lib/lib). Este corpus de se somete al análisis informatizado.
Previamente, los textos son anotados y preanalizados mediante procesos de lematización (es decir, clasificación en categorías de las formas idénticas o relacionadas de una palabra bajo una entrada) y etiquetados (operación de marcado de la categoría de palabra y rasgos sintácticos significativos). Se implementan procedimientos y criterios rigurosos para el diseño, recolección, tamaño y organización de los corpus, buscando que sean fiables y adecuados para el tipo de investigación desarrollada (Cfr.: http://www.educ.ar/educar/lingueistica_de_corpus.php.htm).
En la actualidad, los corpora contienen más de cien millones de palabras. Además, suelen distinguirse los corpora generales de los corpus especializados, es decir, aquellos que se diseñan para proyectos de investigación particulares.
El análisis de los corpora permite verificar cómo estructuras aparentemente similares aparecen en distintos contextos y desempeñan distintas funciones; o por qué las lenguas tienen múltiples estructuras que son muy similares tanto en significado como en función gramatical; o para qué se emplea determinado recurso lingüístico, etc.
El “análisis factorial” pretende identificar conjuntos de variables que están distribuidas de manera similar. Cada conjunto de rasgos coocurrentes es denominado una “dimensión” de variación. Se trata de grupos de rasgos lingüísticos que coocurren con una alta frecuencia en los textos y que se interpretan funcionalmente, en términos de las funciones situacionales, sociales y cognitivas que son más ampliamente compartidas por los rasgos lingüísticos.
Centrando más específicamente la aplicación de la lingüística de corpus al español con fines específicos, la compilación de corpora referidas a un determinado campo temático específico (ejemplos: el lenguaje jurídico; el lenguaje de los biólogos), puede permitir deducir cuáles son las estructuras, familias léxicas, variantes respecto al uso ordinario de la lengua, etc., más frecuentes. La aplicación del análisis factorial puede ser un factor coadyuvante para el profesor de ELE que, sin haber tenido una experiencia concreta en dicho campo social o profesional, puede tener una información objetiva que le ayude a identificar las palabras y campos semánticos, expresiones y formulaciones de uso más frecuente, de rango más funcional para el hablante en dicha situación. En cierto sentido, facilita el acercamiento del profesor, hace más accesible la programación de objetivos y contenidos.
Pero hay un segundo nivel de ayuda de la lingüística de corpus al desarrollo de la enseñanza/aprendizaje del español con fines específicos que, siquiera de forma incipiente, comienza a desarrollarse (al menos especialmente en el caso de la inglesa, siendo menores las experiencias en español): me refiero al desarrollo, a partir de las conclusiones de la automatización de las corpora, de programas informáticos de entrenamiento en lengua extrajera para propósitos específicos, programas informáticos de redacción asistida en segundas lenguas, programas que analizan y detectan errores –e implementan subrutinas de ejercicios e información que ayudan a su superación-, programas que verifican el nivel de habla o redacción escrita en un campo de propósito específico, etcétera.
Para el alumno que estudia ELE, los resultados de lingüística de corpus ha proporcionado herramientas auxiliares, entre las cuales podríamos citar, a modo de ejemplo, algunas disponibles on-line:
- Conjugador verbal del Grupo de Estructuras de Datos y Lingüística Computacional, en http://gedlc.ulpgc.es/investigacion/scogeme02/flexver.htm
- Flexionadores de adjetivos, en
http://gedlc.ulpgc.es/investigacion/scogeme02/flexadj.htm
- Flexionadotes de nombres, en
http://gedlc.ulpgc.es/investigacion/scogeme02/flexsus.htm).

Bibliografía consultada:
• Conrad, S. y D. Biber (eds.) (2001) Variation in English: Multi-dimensional studies. Londres: Longman.
• Biber, D., S. Conrad y R. Reppen (1998) Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press.
• Kennedy, Graeme (1998) An Introduction of Corpus Linguistics. Londres: Longman.
• Mc Carthy, M. (1998) Spoken Language & Applied Linguistics. Cambridge: Cambridge University Press.
• Stubbs, M. (1996) Text and Corpus Analysis. Computer assisted Studies of Language and Culture. Oxford: Blackwell Publishers.