• Ei tuloksia

Dado que nuestro propósito es presentar una descripción diacrónica de los diferentes usos de la preposición de a lo largo de la historia del castellano, hemos elaborado un corpus diacrónico que consiste en un total de casi 16.500 ejemplos. Estos ejemplos provienen de 17 textos que abarcan desde el Cantar de Mio Cid, que data del siglo XII (o principios del XIII) hasta una novela contemporánea, Veinticuatro horas, publicada hacia finales del siglo XX, de manera que nuestro corpus cubre prácticamente toda la historia documentada

del idioma. Una lista y algunos datos importantes acerca de las obras analizadas se recogen en la Tabla 1.

Obra Abreviatura Año Siglo No de

de

Cantar de Mío Cid Cid 1140–

1200? XIII 871

Gonzalo de Berceo, Milagros de

Nuestra Señora Milagros ~1250 XIII 724

Libro del Cavallero Zifar Zifar ~1305 XIV 952

Don Juan Manuel, El Conde

Lucanor Lucanor 1340 XIV 778

Pero López de Ayala, Rimado de

Palacio Rimado ~1385 XIV 707

Alfonso Martínez de Toledo,

Arcipreste de Talavera o Corbacho Corbacho 1438 XV 970 Fernando de Rojas, La Celestina Celestina 1499 XV 832

Lazarillo de Tormes Lazarillo 1554 XVI 937

Miguel de Cervantes, El ingenioso hidalgo don Quijote de la Mancha

Quijote 1605 XVII

1161 María de Zayas y Sotomayor,

Desengaños amorosos Desengaños 1647 XVII 907

Benito Jerónimo Feijoo, Teatro

crítico universal Teatro 1726 XVIII 1325

José Francisco de Isla, Fray

Gerundio de Campazas Campazas 1758 XVIII 1291

Leandro Fernández de

Moratín, El sí de las Niñas Niñas 1806 XIX 877

Pedro de Alarcón, El sombrero

de tres picos Sombrero 1875 XIX 1187

Miguel de Unamuno, Niebla Niebla 1914 XX 1095

Camilo José Cela, La Colmena Colmena 1951 XX 884 Carolina-Dafne Alonso-Cortés,

Veinticuatro horas 24 1982 XX 863

TOTAL 16 360

Tabla 1. Las obras del corpus diacrónico y el número de ejemplos extraídos.

En la elaboración del corpus, nos hemos guiado por los siguientes criterios. En primer lugar, se ha limitado la extensión geográfica de los textos de modo que solo se incluyen textos peninsulares. En segundo lugar, se trata, principalmente, de textos en prosa, con algunas excepciones de la época medieval, el Cantar de Mío Cid, los Milagros de Nuestra Señora y el Rimado de Palacio. En tercer lugar, para facilitar el manejo automático de los ejemplos, se

ha limitado la oferta de obras a aquellas que se encuentran disponibles en versión electrónica en Internet, ya sea en las páginas del Instituto Cervantes (www.cervantesvirtual.com) o en el portal de www.bibliotheka.org. En cuarto lugar, en la medida en que ha sido posible, hemos intentado recurrir a obras que presenten un uso de la lengua que se acerca lo más posible a la oralidad, o que, al menos, incluyan representaciones de la lengua hablada1. En quinto lugar, cabe destacar que, de cada obra analizada, se ha seleccionado una muestra de 20.000 palabras, de manera que el corpus total contiene 340.000 palabras2, entre las que destacan 16.360 casos de de.

Somos conscientes de que con un corpus que solo incluye una muestra muy parcial de toda la historia escrita del español no será posible alcanzar resultados concluyentes en el nivel de las expresiones lingüísticas concretas.

Sin embargo, tratándose de un elemento gramatical como la preposición de, tan necesario y tan frecuente en la lengua, tal reducción del material analizado se impone como una necesidad. Es sencillamente poco factible intentar manejar un corpus mucho más amplio del que hemos recogido—analizar y describir la totalidad de usos de una preposición como de es una tarea que linda en lo imposible, al menos para una vida humana. Al mismo tiempo, teniendo en cuenta el número y tipo de diferentes ejemplos que manejamos, resulta difícil creer que una ampliación del corpus nos provea de casos que alternen significativamente el panorama general del uso de la preposición. En la Figura 1 se muestran los resultados de la comparación del número total de usos de la preposición de que se realizó entre nuestro corpus y el Corpus del Español (CdE, Davies 2002-). Esta comparación revela que el corpus que manejamos sigue unas líneas generales muy parecidas a las que arroja el CdE, que contiene un total de 100 millones de palabras, lo cual se revela también por un valor del 0,84 del coeficiente de correlación.

1 Al menos algunas de las obras se caracterizan por presentar rasgos de la lengua hablada, como revelan las siguientes citas de Javier Herrero: ―textos que reproducen la conversación urbana como El sí de las niñas‖ Herrero (2005: 77) y ―es con La Celestina —aunque tenga precedentes como el Corbacho— cuando nos encontramos por primera vez ante una reproducción bastante fiel y extensa del habla de la época‖ Herrero (1999: 296).

2 En realidad, en nuestro recuento, El sí de las niñas solo contiene 19.383 palabras en total, así que el verdadero número total de palabras del corpos es de 339.383.

0 % 1 % 2 % 3 % 4 % 5 % 6 % 7 % 8 %

XIII XIV XV XVI XVII XVIII XIX XX

AG CdE

Figura 1. Frecuencia global de de por siglos en nuestro corpus (AG) y el CdE.

Es más, en el diccionario de frecuencias del mismo profesor Davies (2006: 12), la preposición de aparece como la segunda palabra más frecuente detrás del artículo definifo el/la. Aparte de su alta frecuencia de uso en términos absolutos, es quizá todavía más significativo el que sus campos de uso no se limiten a un determinado género textual (lengua literaria, no literaria, hablada). Así pues, hay motivos para creer que en la medida en que lo que se pretende es describir la situación global del uso de la preposición de, un promedio de unos 1.000 ejemplos de cada 50 años nos posibilitará formar una imagen aproximada que nos permita determinar los rasgos más destacados tanto de la combinatoria sintáctica como de la estructura semántica que se revelan en el uso contextual.

A la hora de elaborar el corpus, es decir, en el momento de decidir qué obras deberían incluirse así como con qué extensión, se nos presentaban dos opciones: uno, incluir una gran variedad de obras en el corpus, escogiendo un número reducido de ejemplos de cada obra (por ejemplo 20 obras por siglo de las que se extraerían 200 usos de de de cada una) hasta alcanzar un número razonable de ejemplos procedentes de cada siglo; o, dos, lo que acabamos haciendo, escoger un número limitado de obras de las que se extrae un número relativamente elevado de usos de de (alrededor de 1000 de cada una).

El motivo por el cual nos decantamos por la segunda opción es, fundamentalmente, práctico. Es decir, ha sido relativamente fácil encontrar y acceder a este número de obras en formato electrónico y, así, relativamente fáciles de manejar. Creemos que, en el fondo, el corpus final, recogido de una u otra forma, no presentaría diferencias cualitativamente significativas.

Por otro lado, es probable que nuestro corpus sea insuficiente para dar cuenta de los procesos de formación de las construcciones sintácticas particulares. Ello, sin embargo, no significa que no sean de nuestro interés.

Para suplir las posibles insuficiencias de nuestro corpus, en algunos casos concretos tendremos ocasión de recurrir a los amplios corpus diacrónicos existentes en Internet, como el ya citado CdE (www.corpusdelespanol.org).

Este corpus es idóneo para la investigación de determinadas construcciones concretas3. Tenemos en mente casos como las perífrasis verbales del tipo començar de/a, tener de/que, ser de y otras estructuras claramente identificables como construcciones con una forma lineal determinada, por ejemplo, el contraste entre distinto a/de y diferente a/de así como la frecuencia de la combinación lleno de.

En este punto hay que dejar constancia explícita también del hecho de que nuestro corpus está recogido teniendo como centro de atención la preposición de. Más concretamente, esto significa que el corpus en que se basa nuestro análisis consiste en más de 16.000 ejemplos en los que figura de. Sin embargo, un corpus de estas características implica que no estamos en una posición como para contrastar el uso de de con el de otras preposiciones. El análisis que sigue es, pues, una descripción de los usos de de, mientras que contrastar su uso con otras preposiciones es un tema que, si bien reconocemos que podría ser de gran interés tanto para la sintaxis histórica en general como para el estudio del sistema prepositivo español, queda fuera de los objetivos de este trabajo.

Finalmente, hay que hacer notar que, dado que todas las obras incluidas en el corpus están disponibles en la red, no hemos considerado necesario incluir la referencia exacta a la página o el verso donde se encuentran los ejemplos que citamos. De hecho, dado que hemos tratado nuestro corpus en formato electrónico, en el caso de las obras en prosa los ejemplos sencillamente no disponen de una determinada página. En cambio, cuando ha sido posible, se ha incluido la referencia al capítulo o al párrafo donde se encuentra el ejemplo, como en (Colmena, 1) o (Teatro, Amor §4). Pero, en el caso del Cid y de los Milagros de Nuestra Señora, generalmente no se especifica el verso. En todo caso, dado que todas las obras realmente están disponibles en internet, es posible encontrar la referencia exacta, así como ampliar el contexto, mediante una búsqueda en un buscador como www.google.com.

3 De hecho, en la actualidad, al contrario de lo que era el caso en 2008 cuando empezamos la recopilación de nuestro corpus, este corpus permite recoger ejemplos de de arbitrariamente escogidos y repartidos por siglos, lo que posibilitaría establecer un corpus paralelo al nuestro, con, por ejemplo, 1000 ejemplos de cada siglo. Sin embargo, también este corpus necesitaría ser clasificado manualmente según los criterios de nuestra clasificación, lo que es una labor muy costosa en términos de tiempo. En todo caso, a modo de comparación hemos realizado unas comparaciones a nivel más general entre nuestro corpus y los datos del CdE, las cuales se presentan en el Apéndice A3.

4. Metodología

Dado el carácter bipartito del estudio, es decir, por un lado la descripción diacrónica de los distintos usos de la preposición de, por otro, la descripción de su estructura semántica, también hemos recurrido a dos acercamientos metodológicos diferentes. La primera parte (parte II del trabajo), es un análisis de corte tradicional en el que se contrastarán los diferentes tipos de ejemplos desde una perspectiva principalmente histórico-comparativa. Al lado del análisis detenido de las construcciones concretas, anclaremos los resultados en datos numéricos del corpus. Sin embargo, hay que recordar que el estudio es sobre todo descriptivo, por lo que los datos cuantitativos solo servirán de apoyo al análisis funcional.

Con respecto al análisis semántico (que se presenta en la parte III), partiremos de la idea de que la preposición de forma una categoría polisémica caracterizable como una estructura de semejanza de familia (véase la parte I, apartado 2.3, para más detalles), con lo cual uno de los objetivos fundamentales es intentar identificar y delimitar los diferentes significados que aparecen en los contextos analizados. De esta forma, la descripción semántica se basa fundamentalmente en los ejemplos concretos del análisis. Como es bien sabido, la preposición de ha asumido las funciones de varios otros elementos lingüísticos, lo cual no deja de reflejarse en su multiplicidad de usos.

Además, como veremos en la parte del análisis, los usos contextuales son cada vez más variados conforme avanza el tiempo. Por lo tanto, es una tarea bastante delicada intentar determinar, en un plano general y ya no diacrónico, cuáles son los significados que expresa de.

En este sentido, cabe recordar la distinción tradicional en usos espaciales, temporales y nocionales de las preposiciones (cf. Pottier 1962, 1968), una distinción que, al menos hasta cierto punto, sigue manteniéndose dentro de la Lingüística Cognitiva, donde las preposiciones muchas veces reciben la denominación de elementos/entidades/expresiones espaciales (cf.

Herskovits 1986, 1988; Zelinsky-Wibbelt 1993, Aurnague 2007, etc.). Sin embargo, en los últimos años ha surgido un número considerable de estudios que ponen en tela de juicio el supuesto carácter básico de las relaciones espaciales sobre las temporales y nocionales o abstractas, especialmente desde una perspectiva sincrónica (cf. Guarddon Anelo 2005, Sandra & Rice 1995).

Sobre la base de estos estudios, parece que el tiempo no se concibe como una extensión metafórica del espacio, sino que constituye un dominio conceptual propio. Esto habla en contra de la idea de que sea posible derivar todos los significados de un significado básico subyacente; y a favor de la idea de que el procesamiento de los datos lingüísticos por parte del cerebro se realiza muchas veces paralelamente y en serie, lo que, en el plano concretamente

lingüístico, se refleja en una predominancia del nivel (superficial) de las expresiones sobre la abstracción de una idea general y esquemática. Así pues, desde este punto de vista carece de sentido intentar reconstruir un valor básico (etimológico y original) de la preposición de. En cambio, parece más importante intentar ver cuáles son las variaciones de significado y de qué manera esta variación, o vaguedad, (cf. Geeraerts 1993, Raukko 2003) semántica evoluciona en el tiempo.

A modo de comprobar la veracidad y la realidad psicológica de las categorías y significados extraídos del corpus, hemos realizado algunas encuestas para intentar esclarecer de qué forma los hablantes del español

"conceptualizan" este elemento en la actualidad. Es decir, mediante las encuestas hemos querido averiguar hasta qué punto los usos de la preposición, que sobre la base del análisis del corpus parecen revelar significados diferentes, corresponden a las concepciones que de ellos tienen los hablantes (cf. los trabajos de Raukko 1999, 2000, 2002, 2003 y Vanhatalo 2002, 2003).

Con el uso de encuestas de índole psicolingüística se pretende contestar a las dudas presentadas por Sandra & Rice (1995), entre otros, sobre la aparente libertad completa del investigador a la hora de determinar lo que constituye significados distintos de un elemento polisémico, como, por ejemplo, la preposición over del inglés, que ha sido objeto de numerosos estudios semánticos con un número siempre variable de significados (cf. Brugman 1988[1981], Lakoff 1987, Taylor 2003[1989], Tyler & Evans 2003a, b).

Como es bien sabido, uno de los problemas más difíciles de los estudios de las preposiciones es la cuestión sobre qué constituyen significados propios de una preposición, especialmente cuando se pretende evitar la

―casuística‖ propia de los diccionarios (cf. Porto Dapena 1987: 624). Como constata Hottenroth (1993: 179)

One of the problems prepositional semantics has to cope with, is to disentangle and isolate the specific semantic content of the individual

preposition form the contextual factors influencing its various interpretations, and to make explicit in which way these factors interact with the prepositional meaning.

Para resolver este problema Tyler & Evans (2003a: 37ss.) proponen unos criterios generales, como un elemento de su llamada principled polysemy, o

―polisemia de principios‖, para determinar lo que constituyen significados diferentes de una preposición. En sus criterios se consideran varios niveles de análisis de las preposiciones: aparecen los casos obvios de la dimensión histórica y la estructura semántica, pero también el carácter de sistema, que se refiere a las variantes y los usos en expresiones lexicalizadas y/o como prefijos.

No obstante, aun contando con una batería de criterios explícitos como los que presentan Tyler & Evans (2003a), no existe un método específico

según el cual sea directamente posible determinar lo que son significados diferentes de una preposición y lo que no son más que casos de variación contextual. De hecho, para Tyler & Evans (2003a: 47), aparte de estas pruebas de carácter lingüístico, también son necesarias pruebas empíricas (cf. asimismo los comentarios de Cuyckens (2007) en su reseña del trabajo de Tyler & Evans 2003a). Precisamente por eso, hemos combinado el análisis de corpus con el uso de encuestas para llenar esta laguna, aunque sea de forma preliminar.

Otro procedimiento que se ha usado tradicionalmente como ayuda para la clasificación lingüística es la paráfrasis, de manera parecida a las clasificaciones de las diferentes acepciones de una palabra en los diccionarios.

Como ejemplo notable podemos señalar las acepciones 10, 24, 25 y 26 correspondientes a la preposición de en el DRAE, donde, como descripción del significado de la preposición, amén de un ejemplo, se presenta otra preposición, a saber, desde, con, para y por, respectivamente. En el presente trabajo solo usaremos la paráfrasis como apoyo descriptivo —en algunos casos una paráfrasis resulta muy ilustrativa cuando se trata de describir el representante prototípico de alguna categoría, por ejemplo, ‗a causa de‘ para la relación de causa— sin asignarle un papel teórico, puesto que creemos que su utilización conlleva varios problemas metodológicos: la paráfrasis siempre es, como mucho, aproximativa, ya que, en última instancia, la sinonimia no es sino una simplificación que solo es aceptable en un plano superficial (cf.

Vanhatalo 2002, 2003). Asimismo, tradicionalmente la paráfrasis se ha utilizado en el nivel del análisis sintáctico, donde el significado ha sido relegado a un segundo plano.

Finalmente, cabe destacar que debido a que uno de los objetivos centrales de la investigación es dar cuenta de la estructura semántica de la preposición de, el marco teórico en el que se inscribe nuestro análisis es la Lingüística Cognitiva. Como es bien sabido, y como veremos con más detalle en la parte teórica (parte I, capítulo 2), este acercamiento difiere de los acercamientos estructuralista y generativista justamente en colocar la semántica en el centro de atención del estudio de la lengua. Esto, por su parte, se debe a que la Lingüística Cognitiva considera que la tarea principal de la lengua es que permite transmitir, procesar y almacenar información, es decir, significado(s).

5. La realización de la investigación: terminología y