Nous mètodes per a la comparació de textos5 vora el mar (1967)–, a més de dos reculls de contes...

Nous mètodes per a la comparació de textos El cas d’”Aloma” de Mercè Rodoreda

Josep M. Domènech Gibert [email protected]

Novembre de 2016

Premi Fundació Mercè Rodoreda 2017

La Fundació Mercè Rodoreda, a proposta de la Comissió Tècnica, constituïda pels

il·lustríssims senyors Josep Massot, Joaquim Mallafrè i Damià Pons, acordà concedir el

Premi Fundació Mercè Rodoreda 2017 a Josep M. Domènech Gibert pel seu treball “Nous

mètodes per a la comparació de textos. El cas d’’Aloma’ de Mercè Rodoreda”.

El Premi Fundació Mercè Rodoreda s’atorga anualment al “millor treball d’investigació sobre l’obra de Mercè Rodoreda o sobre la novel·la i el conte des de la caiguda de Primo de Rivera fins a la fi del franquisme (1930-1975)”.

1

De tota novel·la, sempre en sobra la meitat.

JOAN FUSTER, Consells, proverbis i insolències.

2

Índex

1 Introducció ............................................................................................................................. ............ 4

2 Obtenció i preparació de les dades ................................................................................................... 15

2.1 Els textos ............................................................................................................................ ..... 15

2.1.1 Origen dels textos codificats ..................................................................................... ..... 15

2.1.2 Adaptacions................................................................................................................ ..... 16

2.2 Dades sobre la freqüència dels mots en la llengua ................................................................. 17

2.3 Eines desenvolupades .................................................................................................... ......... 22

2.3.1 Alineació dels dos textos ................................................................................................ 22

2.3.2 Creació d’un sistema de consultes ................................................................................. 24

3 Les dues versions d’Aloma, en xifres. Cap a la simplicitat ................................................................ 29

3.1 Dades generals ................................................................................................................... ..... 29

3.2 Mots que apareixen un sol cop a cada versió ......................................................................... 36

3.3 Dades de categories gramaticals ........................................................................................ .... 37

4 Dades sobre la freqüència dels mots en la llengua. Cap a la senzillesa .......................................... 48

5 Índex de valoració del lèxic .......................................................................................................... ..... 62

5.1 Concepte ................................................................................................. ................................ 62

5.2 El model matemàtic ............................................................................................................ ..... 62

5.3 Un exemple real .................................................................................................................. ..... 64

5.4 El cas de les dues versions d’Aloma ....................................................................................... 66

5.5 Una possible objecció, una segona opció ........................................................................... .... 66

6 Més enllà d’Aloma, més enllà de Rodoreda ................................................................................. ..... 69

7 Quatre apunts sobre sintaxi ......................................................................................................... ..... 77

7.1 Les estructures de clivellament ........................................................................................... .... 78

7.2 La doble negació – Concordança negativa ......................................................................... .... 83

8 A tall de conclusió ........................................................................................................................ ..... 92

9 Bibliografia bàsica utilitzada ......................................................................................................... ..... 94

Annexos ............................................................................................................................. .................. 98

Versió 1 .................................................................................................................... ...................... 98

Noms – Alfabètic ..................................................................................................................... 99

Noms – Per freqüència .......................................................................... ................................. 112

Adjectius – Alfabètic ................................................................................................................ 125

Adjectius – Per freqüència ...................................................................................................... 132

Verbs – Alfabètic ..................................................................................................................... 139

Verbs – Per freqüència .......................................................................... .................................. 146

3

Adverbis – Alfabètic ............................................................................... .................................. 153

Adverbis – Per freqüència ....................................................................................................... 155

Noms propis – Alfabètic .......................................................................................................... 157

Noms propis – Per freqüència ................................................................................................. 158

Versió 2 ............................................................................................................................. ............. 159

Noms – Alfabètic ..................................................................................................................... 160

Noms – Per freqüència ................................................................................................. ........... 168

Adjectius – Alfabètic ..................................................................................................... ........... 176

Adjectius – Per freqüència ........................................................................................... ........... 180

Verbs – Alfabètic .......................................................................................................... ........... 184

Verbs – Per freqüència ............................................................................................................ 188

Adverbis – Alfabètic ...................................................................................................... ........... 192

Adverbis – Per freqüència ....................................................................................................... 193

Noms propis – Alfabètic ............................................................................................... ........... 194

Noms propis – Per freqüència ................................................................................................. 195

4

1. Introducció

This novel merited the Crexells Prize given by the Institució de les Lletres Catalanes in 1937 and

was extensively revised for publication in 1968. What was the nature of these changes, and can

they tell us anything about how changed the author?1

Quan, a meitat de la dècada dels seixanta del segle passat, Mercè Rodoreda va decidir

reescriure Aloma, la novel·la que havia escrit trenta anys abans, segurament no era conscient

que estava dotant els estudiosos posteriors de la seva obra d’una eina bàsica. Disposar de dues

versions d’una mateixa novel·la –escrites, la primera, durant el període de formació de l’autora, i

la segona, en plena maduresa literària i personal– ens hauria de permetre entendre quina era la

seva visió de la literatura, quin va ser el seu aprenentatge i, sobretot, amb quins criteris estètics,

lingüístics i literaris s’enfrontava al full en blanc. Quan Sadurní Martí, l’any 1993, es preguntava

“Quines són les línies de força que regnen en aquesta transformació? A quins elements

afecta?”,2 es referia justament a aquest desig i a aquesta realitat: treure l’entrellat de les

diferències entre les dues versions significarà conèixer de veritat el motor literari de Mercè

Rodoreda des de tots els punts de vista. És molt clara la conclusió de Pere Gamisans en aquest

sentit:

Mais la présence de deux versions de "Aloma" donne à ce texte en tant qu'objet d'étude, un

avantage sur les autres, en effet elle place devant nos yeux le travail de réécriture auquel s'est

livré l'auteur. Nous sommes en présence d'éléments concrets que nous pouvons comparer, et

donc nous avons la possibilité d'étudier plus facilement l'écriture puisque nous sommes à la fois

en présence de ce qu'elle affirme et de ce qu'elle refuse [...].3

Parlàvem de període d’aprenentatge i ho fèiem, també, de maduresa. En el moment en què

Rodoreda va escriure la primera versió d’Aloma, era una escriptora en formació –una dona que

volia ser escriptora, en realitat–, tot i que la seva producció, ni que sigui des del punt de vista

quantitatiu, no era gens menyspreable.4 Trenta anys més tard, Rodoreda ja havia publicat tres de

les seves grans novel·les –La plaça del Diamant (1962), El carrer de les Camèlies (1966) i Jardí

1 Pope (1994), pàg. 135. 2 Martí (1993), pàg. 65: “Es tracta de dos textos que comparteixen una trama, però que presenten unes diferències formals, d’escriptura, tan notables que els converteix en textos pràcticament diferents. Quines són les línies de força que regnen en aquesta transformació? A quins elements afecta?” 3 Gamisans (1988), pàg. 6. Agraïm a Marta Viñuales, de la Fundació Mercè Rodoreda, i al personal de l’Arxiu Mercè Rodoreda les facilitats donades per a la consulta d’aquesta tesi doctoral. 4 A més d’un llibre d’assaig (Polèmica, 1934, escrit en col·laboració amb Delfí Dalmau) i d’una pila de contes a diaris i revistes, Rodoreda havia publicat quatre novel·les: Sóc una dona honrada? (1932), Del que hom no pot fugir (1934), Un dia en la vida d’un home (1934) i Crim (1936).

5

vora el mar (1967)–, a més de dos reculls de contes –Vint-i-dos contes (1958) i La meva Cristina

i altres contes (1967)–, i treballava des de feia temps en el seu magne Mirall trencat. Maduresa

literària, doncs, tota. Però això no és tot. En aquells trenta anys, Rodoreda havia viscut dues

guerres, havia marxat a l’exili i havia residit a diverses ciutats europees, en la misèria més

absoluta, primer, i en una posició més confortable, més endavant. Maduresa personal, per tant,

també tota. Aquesta maduresa, aquest “fer-se escriptora”, els resumeix Giuseppe Grilli en aquest

paràgraf:

La novel·la és del 1938, però Rodoreda és definitivament un escriptor de llengua catalana entre

el 1958 i el 1962. Aquesta dada il·lumina amb una llum peculiar l’obra de revisió del text que

l’autora va acomplir l’any 1968 sobre un original datat el 1936.5

Ho explicava, també, la mateixa Rodoreda, amb aquestes paraules a Baltasar Porcel, en la

coneguda entrevista de l’any 1966 a “Serra d’Or”:

[...] salvo només, dels meus llibres d’abans de la guerra, Aloma, i amb moltíssimes correccions, i

potser mitja dotzena de contes. Quan vaig publicar els meus primers llibres era molt jove i molt

innocent. Tenia unes ganes fabuloses d’escriure… i no gaire cosa més.6

I, és clar, no podem oblidar els més de vint anys de convivència amb Armand Obiols –alter ego

de Joan Prat–, escriptor i crític literari que, sigui en la mesura que sigui, va exercir una forta

influència en l’autora i, per descomptat, en la seva obra. Tot i que no disposem, encara, d’un

estudi exhaustiu que l’analitzi a fons, hem de pensar que, segurament, no és tan insignificant

com pretenen uns ni tan definitiva com insinuen altres.7 La mateixa Rodoreda ho comentava a

Josep M. Castellet a Ginebra amb paraules com aquestes:

Mai no he escrit per al públic. Jo escrivia només per a l’Obiols, i ara ja no hi és.

5 Grilli (1987), pàg. 145. 6 Porcel (1966), pàg. 40. 7 En parla, per exemple, Montserrat Casals (1991, pàg. 291-292), quan comenta la intervenció d’Obiols en la revisió d’Aloma: “Fins a tal punt la molestava la reescriptura –fer els “adobs”, deia ella– d’Aloma que, finalment, se’n va ocupar Armand Obiols [...]. No queden pistes de quins són els canvis realitzats sota la ploma de Rodoreda i quins són els aplicats per l’Obiols. Caldria un minuciós treball que aportaria nous coneixements sobre la manera d’escriure de l’una i de l’altre. Però, veient com s’establia habitualment la col·laboració entre Rodoreda i l’Obiols, sembla raonable creure que les qüestions més purament gramaticals i les d’eliminar una excessiva retòrica, present a la primera versió, van ser resoltes per l’Obiols. De fet, per a ell això era feina fàcil: era un magnífic editor del treball creatiu dels altres.” William Viestenz (2011, pàg. 104-105), parlant de la inacabable escriptura de La mort i la primavera, afirma que “Without Obiols, it is possible that Rodoreda could do nothing other than unproductively donar voltes.”, tot i que “Without Obiols’s watchful eye, Rodoreda indeed discovered a different writing routine and finally completed and published her most ambitious novel, Mirall trencat, in 1974.” Castellet (1988, pàg. 43) tanca el tema quan sentencia: “Tanmateix, si es llegeix Aloma, o alguna de les obres rebutjades, ningú no podrà negar que el món de la Rodoreda existia abans de la seva vida amb Obiols. I qui hagi llegit els llibres publicats després de la mort d’ell comprendrà que la Mercè era capaç d’escriure sola, malgrat saber, també, com és d’útil, per a tot escriptor, que alguna persona intel·ligent li llegeixi els llibres abans de publicar-los.”

6

Tanmateix, amb mi vivia un escriptor català que llegia el que jo escrivia, que m’ho comentava

llargament i que em feia totes les observacions que pot fer un lector intel·ligent.

I quan venia li llegia el que havia escrit: tenia un esperit terriblement crític i així m’enriquia. De tan

crític com era –més amb ell mateix que amb els altres– va acabar no escrivint res. M’han explicat

que algú ha dit que era ell qui m’escrivia els llibres: una bestiesa, com pots comprendre, perquè

els meus llibres són llibres de dona, i els homes no en saben res, del món de les dones.8

En la revisió d’Aloma, Rodoreda fa canvis de tota mena, des dels estrictament literaris als

purament lingüístics, si és que els uns es poden separar dels altres. Pere Gamisans, un dels

autors que ha dedicat més temps i pàgines a analitzar les diferències lingüístiques entre una

versió i l’altra, comenta així l’oportunitat que ens ofereix el fet de disposar de dues versions de la

novel·la:

La comparació entre l’obra novel·lesca inicial –rebutjada per la mateixa autora– de Mercè

Rodoreda i la que se situa després del 1939 palesa la cura amb la qual ha anat remodelant i

transformant l’arsenal lingüístic que utilitzava abans de la guerra i permet d’analitzar i de

comprendre millor les característiques del discurs rodoredià. [...] Les dues versions d’Aloma són

un document de suma importància per a l’estudi de la llengua de Mercè Rodoreda en la mesura

que ensenyen les dues cares de l’elecció estilística de l’autora barcelonina: el que rebutja i el que

fa seu.9

No hi pot haver, doncs, millor manera de conèixer l’evolució de la narrativa de Mercè Rodoreda

que analitzant els canvis entre les dues versions d’Aloma.

La gènesi de la segona versió

A través de la lectura de la correspondència amb Joan Sales10 (el seu editor), Joaquim Molas11

(editor de les Obres completes) i Armand Obiols12 (el seu company i, sobretot, crític literari

personal), sabem que la revisió d’Aloma no va ser una tasca ni ràpida ni senzilla. Segons

aquesta correspondència, en va començar a parlar amb Joaquim Molas13 (qui acabaria editant la

8 Castellet (1988), pàg. 41-42. 9 Gamisans (1991), pàg. 353-354. 10 Correspondència recollida a Rodoreda (2008). 11 Correspondència recollida a Arnau (2010). 12 Correspondència recollida a Obiols (2010). 13 Deia Rodoreda, el 2 d’agost de 1965: “M’hauria de dir, més o menys, la data en què pensa publicar Aloma. Tot i que no crec gaire en les revisions d’una obra de joventut, perquè molt sovint en comptes de millorar-la l’esguerren, hi ha trossos d’Aloma que fan angúnia de llegir.” Arnau (2010), pàg. 236.

7

segona versió) durant l’estiu de 1965, i no li va lliurar l’original fins a la primavera de 1969, quan

comunica al mateix Molas que “Per correu a part us envio Aloma”,14 amb el convenciment que

“Aloma és un llibre nou. No he fet simplement una revisió [...].”15

Ara per ara, però, no podem saber amb quina intensitat va treballar en l’obra durant aquests

gairebé quatre anys. Només en tenim alguna informació que, de vegades, és contradictòria. A

començaments de l’any 1967, Rodoreda diu a Joan Sales que hi està treba llant:

El que em destorba –i faig amb certa mala gana– és l’adob d’Aloma.16

[...] em cal acabar Aloma. Em fa nosa i em destorba.17

I Obiols fa un comentari similar a Rodoreda durant els primers mesos de 1968:

Ahir a la nit vaig reprendre la revisió d’Aloma.18

Tinc realment ganes d’enllestir la revisió.19

Quan en parla amb Joaquim Molas, però, un mes abans d’enviar-li la novel·la, Rodoreda redueix

el temps que ha dedicat a aquesta feina:

Us vaig dir que us donaria Aloma el mes de gener o de febrer d’aquest any. No m’hi vaig poder

posar a treballar fins a mig mes de febrer. I Aloma, tot i que està molt avançada, em dóna més

feina que si fes una novel·la nova. Hi ha tantes ruqueries, l’estil és tan abominable, que, per

arreglar tants nyaps, suo tinta xina. Quan un paràgraf em queda decent, l’altre se m’espatlla.

Aloma és un una mitja que s’escorre per tot arreu (sic). Però em penso que quedarà molt bé. He

procurat conservar tot el que hi havia, però ja veureu, quan tindreu ocasió de llegir-la, que l’he

millorada molt. Ha perdut, és clar, la santa innocència i la gran espontaneïtat. Però, tal com era,

francament, no es podia publicar.20

Sigui com sigui, i més enllà de les mitges veritats que Rodoreda pogués dir als seus editors, és

evident que la revisió d’Aloma va ser una tasca feixuga, un malson inacabable. I tant les seves

paraules com les de l’Obiols així ho corroboren. El que havien de ser quatre canvis per a netejar-

la i fer-la més presentable –una simple revisió– es va convertir en una autèntica reescriptura de

14 Carta del 8 d’abril de 1969. Arnau (2010), pàg. 242. 15 Carta del 17 de maig de 1969. Arnau (2010), pàg. 242. 16 Carta del 26 de gener de 1967. Rodoreda (2008), pàg. 322. 17 Carta del 6 de febrer de 1967. Rodoreda (2008), pàg. 329. 18 Carta del 13 de febrer de 1968. Obiols (2010), pàg. 376. 19 Carta del 21 de febrer de 1968. Obiols (2010), pàg. 379. 20 Carta del 17 de març de 1969. Arnau (2010), pàg. 241.

8

la novel·la i, amb això, en una obra més en el conjunt de la seva producció i en un regal per als

estudiosos.

La importància de l’estudi de la llengua de Rodoreda

Diversos estudis i ressenyes ens han proporcionat moltes interpretacions i anàlisis minucioses de

la producció literària d’una de les autores més importants del nostre segle. Amb tot, s’hi pot

evidenciar una mancança: la llengua de les obres rodoredianes hi ha estat insuficientment

contemplada.21

Efectivament, des que l’any 1979 Carme Arnau va publicar22 la tesi doctoral que havia presentat

dos anys abans a la Universitat de Barcelona, l’obra de Mercè Rodoreda ha estat analitzada des

de tots –o gairebé tots– els punts de vista. En són una bona demostració el recull bibliogràfic de

Maria Isidra Mencos23 i la posterior ampliació de Kathleen McNerney,24 que comenten centenars

de monografies i articles de revistes d’arreu del món sobre tota mena d’aspectes de l’obra

rodorediana. De tota manera, resseguint aquests dos reculls, ens adonem del baixíssim nombre

d’estudis dedicats a la seva llengua, més enllà de la tesi doctoral de Pere Gamisans –que ja hem

esmentat i que comentarem més endavant–, d’alguns articles sobre alguna qüestió concreta i

d’alguna referència en textos d’abast més general. No hauríem d’obl idar que la llengua era un

potent motiu de reflexió per a l’autora a l’hora d’escriure (vegeu, si no, els debats que ella i el seu

editor, Joan Sales, mantenen sobre qüestions lingüístiques en la seva correspondència). Imma

Contrí i Carles Cortés es feien ressò, l’any 1999, d’aquestes mancances i de la necessitat

d’abordar ja un estudi aprofundit sobre la llengua de Mercè Rodoreda:

Com veiem, Rodoreda era conscient de la importància que té la llengua en el producte literari. No

és gratuït, per tant, plantejar una anàlisi dels elements lingüístics de la seva obra.25

Cal, doncs, un estudi seriós i complet de la llengua de Mercè Rodoreda, tant pel que fa a

cadascuna de les seves obres analitzada individualment com en conjunt, de manera que puguem

conèixer-ne l’evolució al llarg dels anys.

21 Contrí (1999), pàg. 284 22 Arnau (1979). 23 Mencos (2004), 24 McNerney (2015). 25 Contrí (1999), pàg. 286.

9

I, és clar, si estudiem la llengua de Rodoreda, caldrà analitzar-ne molt especialment el lèxic,

l’element lingüístic més visible per al lector i el que, juntament amb la sintaxi, permet a l’autora

anar desenvolupant i modificant el seu estil, el seu codi. Ho explica molt bé Josep-Miquel Sobré

en aquest paràgraf:

El lèxic és l’element més vistós del llenguatge i ofereix més variació optativa que no pas la

morfologia o la sintaxi, sempre dins del reialme de la correcció. És en el vocabulari sobretot on

un autor manifesta el tipus de llengua que creu més convenient per als seus propòsits estilístics.

La mena de llenguatge que apareix en una obra literària és una cadena d’eleccions que obeeixen

al desig de l’autor de trobar la forma, el “codi” amb què podrà desenvolupar millor els efectes que

busca.26

Sobre la senzillesa de la segona versió d’Aloma. El treball de Pere Gamisans

De la lecture des premières pages des deux versions se dégage l'impression qu'une distance

sépare les deux textes du point de vue de la langue utilisée: la version de 1968 présente un

lexique mais aussi une morphologie et une syntaxe plus courants. Mais qu'entend-on par

"courant"? Que signifie écrire dans une langue plus courante? En quoi cela consiste-t-il?

Pourquoi avoir écrit ainsi? Quels effets de sens s'en dégagent?27

Sempre que es parla del lèxic de Mercè Rodoreda –i molt especialment del de la segona versió

d’Aloma en comparació amb la primera–, es fa amb adjectius que n’evoquen la senzillesa: planer

i senzill,28 col·loquial,29 natural i fluid,30 o corrent,31 per esmentar alguns exemples. I és així. Si

llegim les dues novel·les en paral·lel, ens adonem de seguida del caràcter planer, senzill,

col·loquial, natural, fluid i, en definitiva, corrent –per dir-ho amb les mateixes paraules que han

utilitzat els crítics– del lèxic i del conjunt del llenguatge de la segona versió. Vegeu, si no,

aquests fragments del capítol VII:

26 Sobré (1973), pàg. 228-229. 27 Gamisans (1988), pàg. 7. 28 “Em sembla que és prou palès que l’estil de La plaça del Diamant és més popular que no pas erudit, més planer que no pas ampul·lós, més senzill que no pas feixuc, més col·loquial que no pas fredament científic.” Sobré (1973), pàg. 231. 29 “[...] pel que fa al lèxic s’eliminen les paraules literàries, substituïdes per altres de més col·loquials [...].” Arnau (2006), pàg. 38. 30 “El llenguatge artificiós, rebuscat i estrafet de la 1ª edició és substituït per un altre de més natural i fluid, menys afectat.” Bernal (1992), pàg. 346. 31 “Elles présentent des différences importantes dans leur lexique, différences qui mettent en évidence l'opposition non courant/courant [...].” Gamisans (1988), pàg. 33.

10

Aloma 1 Aloma 2

Un cop la feina enllestida té tràfecs a proveir-

se de tinter i ploma. Paper i sobres. Ha de

fugir del nen, que és l'únic a adonar-se de les

seves angúnies.32

+++++

Dintre de la seva cambra comença, quan és

sola i li sembla que tots dormen, la seva

correspondència a ningú.

Escriu damunt d'un llibre amb les cames

arronçades sobre el llit, i l'ampolla de tinta

ficada dins d'un gerro xato que s'aguanta

perfectament si ella no es belluga.33

+++++

No sé escriure. Si ho sabia dir bé... Esquinça

el paper, comença de bell nou i continua:34

Va saltar del llit i es va posar a fer la feina de

pressa. Quan va haver acabat va baixar a

buscar sobres i paper. Dani la va veure.35

+++++

Després de rentar els plats amb Anna van

pujar juntes a dalt. Quan ja feia una estona

que no sentia gens de soroll es va asseure al

llit i es va posar a escriure. Tenia el paper

damunt d'una capsa i l'ampolla de la tinta a la

tauleta de nit.36

+++++

No sabia escriure, és clar... Va tornar a

esquinçar el paper i va començar altra

vegada:37

Malauradament, aquesta mena d’afirmacions s’han hagut de fer sempre des d’un punt de vista

subjectiu –si més no, fins a la presentació de la tesi de Pere Gamisans–. S’han donat molts

exemples d’aquesta suposada senzillesa però no s’ha trobat la manera de fer una valoració

general i objectiva dels dos textos. És a dir, es diu que hi ha unes determinades paraules de la

primera versió que desapareixen a la segona però no es pot –o no s’ha pogut– fer un llistat

complet d’aquestes paraules ni es pot dir a partir de quins criteris s’afirma que un conjunt lèxic és

més senzill o més complex que un altre. De fet, quan donem exemples a favor d’una

determinada tesi, segur que en podríem donar de la contrària. Més enllà d’això, sobre quines

bases podem dir que una paraula és més senzilla que una altra? Com podem demostrar-ho?

Ho va intentar Pere Gamisans en la seva tesi doctoral i cal dir que, tenint en compte l’absència

de mitjans tecnològics en aquell moment, el resultat del seu treball és digne d’esment. La feina

que hi ha al darrere és immensa; el conjunt de dades que n’extreu, espectacular. A partir del

buidatge exhaustiu de bona part de la novel·la38 –de les dues versions de la novel·la, per ser

32 Rodoreda (1938), pàg. 91. 33 Rodoreda (1938), pàg. 92-93. 34 Rodoreda (1938), pàg. 95. 35 Rodoreda (1969), pàg. 57. 36 Rodoreda (1969), pàg. 58. 37 Rodoreda (1969), pàg. 59. 38 L’autor explica així les parts de la novel·la amb què treballa de manera exhaustiva: “Pour ce faire nous avons menè une étude comparative qui s'est volue exhastive sur plus de la moitié du texte: de la page 217 (‘De tant en tant

11

exactes–, Gamisans és capaç d’oferir-nos llistes de paraules que apareixen o desapareixen i

d’analitzar-les per demostrar el caràcter “courant” del llenguatge de la segona versió per oposició

al “non courant” de la primera. Aquests són, segons Gamisans, els canvis que Rodoreda aplica

en la reescriptura d’Aloma, des del punt de vista del lèxic:

1. La version de 1936 est marquée par le caractére synthétique et littéraire d'un certain nombre de ses termes, qui en 1968 sont substyitués par des associations syntaxiques de mots courants (analystisme).

2. La polysémie, la généralité caractérisent la deuxième version.

3. Des variantes dialectales et techniques y disparaissent.

4. Le castillan n'est plus un repoussoir dans la deuxième version.

5. Les termes disparus dans la deuxième version n'ont pas cours dans le discours oral.

6. Substitution de termes qui apparaissent dans des acceptions non courantes.

7. Disparition de nombreuses variantes littéraires.

8. Disparition des adverbes en "ment".

9. Forte réduction du lexique abstrait.

10. Substitution d'éléments lexicaux par des éléments formes.

11. La variété dans la dénomination fait place à la récurrence du même terme.

12. Régularité des substitutions.

13. Présence de quelques contre-exemples.39

És evident que, amb la tecnologia que tenim avui, aquesta mena d’anàlisi es pot fer de manera

molt més senzilla i, alhora, amb un major grau d’objectivitat i exhaustivitat. Francesc Vallverdú,

en el seu llibre L’escriptor català i el problema de la llengua, afirmava, referint-se al lèxic de

Mercè Rodoreda:

Lèxic: Remarquem pocs cultismes o mots no usuals en la llengua parlada; vorera, quadre,

furient, església, empènyer, cloure, etc. Rodoreda evita els arcaismes.

En contrast, tampoc no abusa dels mots secundaris corrents en la llengua parlada. Entre els més

remarcables hem trobat: buscar, quedar, rotllo, sortidor, etc.

ella es veu...’) à 234 de la version de 1936, et des pages 157 à 166 de la version de 1968 (obres completes) soit une partie du chapitre XIX et le chapitre XX en entier, et de la page 9 à 112 de la version de 1936 et 49 à 103 de la version de 1968, soit des chapitres I à IX inclus. Notre étude exhaustive concerne donc plus de 10 chapitres sur 20, 123 pages sur 234 (version de 1936), et 65 pages sur 118 (version de 1968). La plupart des phénomènes lexicaux, syntaxiques, morphologiques on été examinés sur cette éntendue, pour certains le pourcentage du texte scruté a été moindre, quan l'extension étudiée exhaustivement nous semblait suffisante à établir une caractéristique. Quant aux chapitres restants X à XVIII nous y avons relevé aussi de nombreux éléments qui n'ont pas de valeur statistique puisque l'étude, n'a pas été exhaustive, mais ils nous fournissent souvent des indications et des exemples intéressants, qui confirment généralement les tendances observées dans les chapitres I à IX et XIX et XX.” Gamisans (1988), pàg. 7. 39 Gamisans (1988), pàg. 33.

12

Són abundants els vulgarismes genuïns o ja assimilats per una llarga tradició: dematí (subs.),

pellingos, maco, resar, enrecordar, entornar-se’n, etc.

No són gaire abundants, en canvi, els vulgarismes no genuïns: cuidar-se (per tenir cura), direcció

(per adreça), atropellar (per aixafar), gastar (per despendre), puro, etc.40

Segurament, aquestes característiques del lèxic rodoredià són certes. Gràcies a la informàtica,

però, podem anar molt més enllà. Podem, per exemple, buscar aquests mots –referits tots a La

plaça del Diamant– en altres novel·les de la mateixa autora per mirar de detectar diferències en

la seva produció de diverses èpoques. Si busquem els exemples que Vallverdú esmenta com a

“cultismes o mots no usuals en la llengua parlada” en les dues versions d’Aloma, per centrar-nos

en un cas, trobem aquests resultats:

Mot Ocurrències

Aloma 1 Ocurrències

Aloma 2

església n. 5 4

quadre n. 1 0

vorera n. 6 2

furient adj. 0 0

cloure v. 9 0

empènyer v. 10 3 Taula 1

Segons aquest quadre, veiem que, a la primera versió d’Aloma, Rodoreda utilitza cinc dels sis

exemples que Vallverdú donava per a La plaça del Diamant. D’aquests cinc casos, dos

desapareixen a la segona versió; els altres tres casos veuen reduït el seu nombre d’aparicions.

En els dos mots que podríem considerar més cultes –‘empènyer’ i ‘cloure’–, veiem que la

disminució és molt important en el primer cas i total en el segon.41

Tot i que només es tracta d’un exemple, ja hi detectem clarament la tendència de Mercè

Rodoreda a anar reduint la presència de cultismes en les seves obres.

40 Vallverdú (1968), pàg. 153. 41 Anant una mica més enllà i revisant els textos, veiem com dos dels casos de ‘cloure’ –“cloure la boca” (al capítol IV) i “cloent el puny” (al capítol XIII)– són substituïts a la segona versió per “aguantar el malhumor” i “estrenyent el puny”. En els altres set casos –“cloure les parpelles”, “els ulls” (cinc cops) o “una etapa”–, Rodoreda canvia la redacció del paràgraf i el verb desapareix. Per exemple, al capítol XX, el paràgraf:

“Els carrers són quiets. D'una paret penja un roser sense roses. Enllà hi ha el brogit de la ciutat, de totes les ciutats del món on hi ha noies que es planten de cara a la vida sense que els calgui cloure els ulls: que no necessiten fer somnis.” Rodoreda (1938), pàg. 234.

és substituït per aquest: “Es va agafar fort les mans perquè no li tremolessin tant. Els carrers eren quiets. D'una paret penjava un roser sense roses. Lluny, hi havia la remor sorda de la ciutat; noies que plantaven cara a la vida, sense somnis.” Rodoreda (1969), pàg. 141.

13

Objectius

Hem parlat, a les pàgines precedents, de la gènesi de la segona versió d’Aloma, de les

possibilitats que la reescriptura de la novel·la ens ofereix per a l’estudi de l’evolució de la

narrativa rodorediana i d’alguns intents que s’han fet d’aproximació a l’anàlisi de la seva llengua

–i, més concretament, del seu lèxic–. Hem comentat, també, la insuficiència d’aquests estudis

sobre la llengua i la necessitat de fer-ne un de seriós i exhaustiu.

Ara mateix, en ple segle XXI, disposem de mitjans que ens permeten l’anàlisi de grans quantitats

de dades de manera ràpida i, encara millor, objectiva. Alhora, el desenvolupament de corpus

lingüístics –i dels treballs que se’n deriven– per a la llengua catalana, que permeten ser utilitzats

per a tota mena d’estudis, posa al nostre abast unes eines que no fa pas gaires anys eren

inimaginables.

I doncs, què pretenem, en aquestes pàgines?

Aquest treball vol ser una mena de conjunció dels tres ítems que acabem d’esmentar:

i. Aprofitament de l’existència d’una segona versió d’Aloma –escrita trenta anys més tard–

per a l’anàlisi de l’evolució de la llengua en la narrativa rodorediana.

ii. Necessitat de l’estudi de la llengua de Mercè Rodoreda: cal conèixer el model lingüístic

de cadascuna de les seves obres i cal veure’n l’evolució al llarg dels anys.

iii. Aprofitament de les possibilitats que ens aporten els mitjans computacionals, també per

a l’estudi de la llengua i la literatura.

Això no vol dir, en cap cas, que el que farem aquí sigui una anàlisi exhaustiva de la llengua de

les dues versions d’Aloma per tal de comparar-les. L’objectiu d’aquestes pàgines és molt menys

ambiciós. De fet, vist de manera estricta, aquest no és un treball sobre la llengua de Mercè

Rodoreda, en general, ni sobre la d’Aloma, en particular. O, potser, no és només això.

El que pretenem –basant-nos en l’exemple d’Aloma– és oferir als investigadors nous mitjans de

recerca que algun dia puguin donar resultats, aquests sí, més ambiciosos. Amb l’ajuda de la

informàtica i de les matemàtiques, oferirem una colla de dades sobre el lèxic i n’extraurem unes

primeres conclusions. I treballarem amb les dues versions d’Aloma perquè ens serviran per

demostrar de manera indiscutible la utilitat dels sistemes d’anàlisi que mostrarem.

Concretament, el contingut del treball és aquest:

14

Anàlisi de l’extensió dels textos, nombre de paraules i nombre de paraules diferents.

Anàlisi del grau de dificultat dels elements lèxics dels textos.

L’Índex de valoració del lèxic: un intent d’assignar un valor numèric exacte al conjunt del

lèxic d’un text a partir de la seva major o menor freqüència en la llengua corrent.

Tots tres punts seran treballats a partir de les dues versions d’Aloma. En un altre apartat, però,

treballarem aquestes mateixes dades per a un conjunt representatiu de les obres de Mercè

Rodoreda per veure’n l’evolució i en una obra de Salvador Espriu, que ens permetrà de fer una

primera comparació del lèxic de tots dos autors.

A més, tot i que, bàsicament, treballarem sobre el lèxic, en un apartat específic comentarem

alguns canvis sintàctics entre les dues versions d’Aloma.

Finalment, per tal de mostrar les possibilitats de l’aprofitament dels corpus lingüístics per a

l’anàlisi de la llengua literària, oferirem, en un annex, diversos llistats del lèxic de les dues

versions d’Aloma, que poden obrir la porta a estudis posteriors.

15

2. Obtenció i preparació de les dades

2.1. Els textos

2.1.1. Origen dels textos codificats

Per a l’elaboració d’aquest treball, necessitàvem disposar d’informació en format electrònic de

diversos textos. En alguns casos, hem pogut aprofitar els resultats de projectes anteriors; en

algun altre, hem hagut de preparar el text de manera expressa.

Concretament, els textos utilitzats en aquest treball són els següents:

Les dues versions d’Aloma:

Aloma (primera versió). Primera edició. Barcelona: Institució de les Lletres Catalanes,

1938.

Aloma (segona versió). Primera edició. El Balancí, 59. Barcelona: Edicions 62, juny de

1969.42

Altres obres de Mercè Rodoreda:

La plaça del Diamant. Primera edició. Club dels Novel·listes, 22. Barcelona: Club Editor,

març de 1962.

Mirall trencat. Primera edició. Club dels Novel·listes, 81. Barcelona: Club Editor,

desembre de 1974.

Quanta, quanta guerra... Primera edició. Club dels Novel·listes, 85. Barcelona: Club

Editor, desembre de 1980.

Obres d’altres autors:

SALVADOR ESPRIU: Les roques i el mar, el blau. Primera edició. El Cangur, 74. Barcelona:

Edicions 62, 1984.

Per a totes les obres, excepte la segona versió d’Aloma, hem pogut aprofitar la feina feta en el

marc del projecte de recerca del Corpus Textual Informatitzat de la Llengua Catalana (CTILC) de

42 Concretament, hem treballat amb la quaranta-dosena edició a la col·lecció El Cangur d’Edicions 62 (Barcelona, setembre de 1995).

16

l’Institut d’Estudis Catalans, durant la gestació del qual van ser digitalitzades i lematitzades.43 En

tots aquests casos, hem treballat amb els resultats de la lematització dels textos.44

Tenint en compte que el CTILC recull la primera versió d’Aloma però no pas la segona, aquesta

ha hagut de ser escanejada, sotmesa a un sistema de reconeixement òptic de caràcters,

revisada i lematitzada especialment per a aquest treball. Per tal de poder comparar els textos

amb les màximes garanties, això sí, tot el procés s’ha fet seguint els mateixos criteris utilitzats en

el marc dels treballs de constitució del corpus de l’IEC.

Pel que fa al cas concret de la lematització de la segona versió, tot i que els avenços tecnològics

i la recerca dels últims anys haurien permès realitzar el procés de manera gairebé automàtica, la

tasca s’ha fet manualment per tal de poder treballar de manera exhaustiva amb els criteris

seguits en els altres textos, lematitzats, com hem dit, com a part del projecte del CTILC.

2.1.2. Adaptacions

Per tal de simplificar les dades resultants de la lematització dels textos, hem reduït el sistema de

categorització gramatical utilitzat en el moment de la constitució del corpus de l’IEC.

Concretament, hem reduït les nou categories verbals, les set nominals i les nou adjectivals45 a

una de sola per a cada cas. Així, per exemple, en el cas dels verbs, hem ajuntat les dades

corresponents a ‘haver’ com a verb transitiu amb les de l’intransitiu i pronominal; pel que fa als

adjectius, podem esmentar el cas de ‘granat’, que pot ser de quatre terminacions (“Color vermell

fosc”) o de dues (“Que té el gra ben format”); en el cas dels noms, ‘artista’, que pot ser un mot de

gènere masculí o un de gènere femení, o ‘mar’, mot que accepta els dos gèneres . Amb aquesta

43 La lematització és el procés a partir del qual s’assigna un lema a cadascun dels mots que apareixen en un text. En paraules de Joaquim Rafel, "a través de la lematització, s'aconsegueixen, doncs, dos objectius particulars, que són, de fet, un conseqüència de l'altre: cada una de les ocurrències de cada mot gràfic (és a dir, cada una de les seves aparicions al llarg del text) és categoritzada gramaticalment i associada a una forma de referència anomenada lema (que es correspon aproximadament amb allò que podem considerar una entrada de diccionari) [...]. Així, per una banda es desambigüen gramaticalment les formes homògrafes, i per una altra s'agrupen sota un mateix lema els diferents components d'una mateixa sèrie inflectiva [...]". Vegeu Rafel (1994), pàg. 223. 44 Agraïm a l’Institut d’Estudis Catalans i al doctor Joaquim Rafel, director del CTILC, la cessió d’aquestes dades. 45 Categories verbals del CTILC: V (verb transitiu i intransitiu, o, simplement, verb, quan aquest no apareix al Diccionari de la llengua catalana de Pompeu Fabra ni al Diccionari de la llengua catalana d’Enciclopèdia Catalana), VA (infinitiu hipotètic de les formes usades en el perfet perifràstic), VI (verb intransitiu), VIA (verb intransitiu i auxiliar), VIP (verb intransitiu i pronominal), VP (verb pronominal), VT (verb transitiu), VTP (verb transitiu i pronominal) i VVP (verb transitiu, intransitiu i pronominal); categories nominals: M (nom masculí), MF (nom usat amb gènere masculí i amb gènere femení), MP (nom masculí plural), MS (nom masculí singular), F (nom femení), FP (nom femení plural) i FS (nom femení singular); categories adjectivals: A (adjectiu variable), AF (adjectiu usat només en femení), AI (adjectiu invariable pel que fa al gènere), AII (adjectiu invariable pel que fa al gènere i al nombre), AIP (adjectiu invariable pel que fa al gènere, usat només en plural), AM (adjectiu usat només en masculí), AMP (adjectiu usat només en masculí plural), AN (adjectiu numeral) i AP (adjectiu plural). Vegeu Rafel (1996), volum 1, pàg. XXXVI.

17

simplificació, s’ha passat de 72698 noms a 71868; de 44724 adjectius, a 44699; i de 12845

verbs, a 12773.

2.2. Dades sobre la freqüència dels mots en la llengua

Per a la valoració d’un text des del punt de vista de la major o menor especificitat dels mots que

en formen part, es fa imprescindible disposar de dades sobre la freqüència del conjunt de les

unitats lèxiques de la llengua en el seu ús real. Com afirma Joaquim Rafel, és obvi que no tots

els mots d’una llengua tenen la mateixa probabilitat d’aparèixer o no en un text; n’hi ha que els

trobem a tots –o gairebé tots– els textos i d’altres que s’utlitzen molt rarament:

L’anàlisi del vocabulari d’una llengua des del punt de vista de l’ús que se’n fa en la pràctica

comunicativa ens mostra que no tots els mots que podem trobar en un diccionari tenen la

mateixa probabilitat d’aparèixer en un text qualsevol: hi ha mots que se solen repetir d’una

manera més o mens reiterada i, en canvi, n’hi ha d’altres que apareixen més rarament; d’acord

amb això, podem pensar en una classificació de les unitats lèxiques basada en criteris

quantitatius, és a dir, en la major o menor possibilitat d’aparició de cada una d’aquestes unitats.46

L’any 1968, Josep Llobera, amb la pretensió de proporcionar una eina als ensenyants i als

aprenents de la llengua catalana, va publicar un volum –El català bàsic– en què proposava una

llista de les mil paraules més utilitzades en català (el que anomenava “Vocabulari bàsic de primer

grau”); sumant-n’hi mil més, formalitzava el seu “Vocabulari bàsic de segon grau”.47 Tot i que va

ser una tasca ingent i que el recull va ser molt útil en el seu moment, el fet d’haver de fer la

selecció dels mots a partir d’un corpus molt reduït no permet assegurar-ne la fiabilitat dels

resultats.48

46 Rafel (1996), volum 1, pàg. VIII. 47 Llobera explica així la iniciativa d’aquest treball: “El fet de conèixer l’existència del “Basic English” i del “Français fondamental”, unit a la nostra experiència personal d’estudis i d’ensenyament, ens va fer veure la necessitat urgentíssima d’obtenir per a la llengua catalana una eina de treball semblant a aquelles citades per a les llengües anglesa i francesa; una eina de treball tan senzilla que (portada a la seva aplicació pràctica) es pogués posar fins i tot a les mans dels qui comencen a estudiar la nostra parla (tant si es tracta de persones de llengua catalana que no la coneixen més que parlada, com si es tracta de no catalans que la volen aprendre).” Llobera (1968), pàg. 7. 48 La metodologia utilitzada en l’establiment del “Català bàsic”, segons Llobera, és aquesta:

“1. Recollir converses de viva veu a fi de poder determinar els mots més freqüents al llenguatge parlat. 2. A les paraules trobades a l’apartat anterior, afegir-hi les paraules ideològicament interessants (o sia,

segons l’expressió del ‘Français fondamental’, les paraules ‘disponibles’) per a poder expressar de manera ben simple les diverses idees que puguin sorgir en una conversa normal o en un escrit senzill.

(Amb aquests dos primers apartats ja tindríem el Vocabulari Bàsic de Primer Grau.) 3. Establir quines normes gramaticals són més senzilles, eliminant aquelles innecessàries. 4. Admetre algunes variants, tant de vocabulari com de gramàtica, a fi de donar entrada a mots i normes

molt usuals en alguns dialectes.

18

En el nostre treball, si tenim la pretensió de l’objectivitat, és importantíssim que les dades amb

què treballem s’hagin extret d’un corpus textual prou representatiu i que estiguin organitzades

adequadament.

Afortunadament, gràcies als avenços tecnològics de les últimes dècades, en el cas de la llengua

catalana disposem d’una eina que ens pot resultar molt útil a l’hora d’analitzar la major o menor

senzillesa del lèxic dels textos: es tracta del Diccionari de freqüències (d’ara endavant, DF),

basat en el Corpus Textual Informatitzat de la Llengua Catalana de l’Institut d’Estudis Catalans i

publicat pel mateix IEC entre els anys 1996 i 1998.49 En aquesta obra es recullen en diversos

llistats el conjunt de lemes resultants de la lematització del corpus compilat per l’IEC, amb

informacions diverses sobre la seva freqüència absoluta (nombre total de vegades que el mot

apareix al corpus), freqüència relativa (raó entre aquest valor i l’extensió del corpus), etc.50

No sembla massa agosarat pensar que els resultats obtinguts a partir de l’anàlisi d’un corpus de

més de 50 milions de paraules seran més fiables que els extrets d’un recull de dimensions molt

reduïdes. Com a mostra, els mots “guaitar v.”, “puny n.” i “calçar v.”, que Llobera inclou en el seu

“Vocabulari bàsic de primer grau” (els mil mots més utilitzats), segons la freqüència absoluta en

el CTILC se situarien en els llocs 1902, 2566 i 8040, respectivament. És per això que una eina

com el DF era imprescindible per a aquest treball.

Una de les informacions més interessants que ens ofereix el DF és el que s’hi anomena ús. Tot i

que no farem aquí una explicació exhaustiva del concepte ni del model matemàtic utilitzat per a

calcular-lo, sí que caldrà donar-ne una idea per tal de poder entendre el que significa i la utilitat

que tindrà per a la quëstió que volem analitzar.51

Si, com hem dit més amunt, entenem per freqüència absoluta el nombre total de vegades que un

mot apareix en el corpus, l’ús representa una modificació a la baixa d’aquesta freqüència segons

(Amb aquests quatre apartats ja tindríem el Català Bàsic de Primer Grau.) 5. Comprovar la bondat pràctica del Català Bàsic de Primer Grau obtingut. 6. Establir el Segon Grau de manera semblant al Primer, i com a continuació d’aquest.” Llobera (1968),

pàg. 9. 49 Per a l’explicació detallada de la gestació del Corpus, vegeu la Introducció de l’obra: Rafel (1996), volum 1, pàg. XXIX-XXXV. 50 “Entenem per FREQÜÈNCIA d’una unitat lèxica el nombre de vegades que apareix en un text, en un conjunt de textos qualssevol o en un corpus organitzat més o menys extens [...]. [...] dir que un mot té una freqüència igual a 250 té un valor diferent si l’extensió del text en què s’ha determinat és de 25.000 mots que si és de 250.000; en el primer cas, apareix una vegada cada 100 mots i en el segon, una vegada cada 1.000: el que és realment indicatiu, per tant, no és el que anomenem FREQÜÈNCIA ABSOLUTA (en aquest cas 250), sinó la raó entre aquest valor i l’extensió del text, que anomenem FREQÜÈNCIA RELATIVA (0,01 en el primer cas i 0,001 en el segon, o bé, en termes percentuals, l’1 % en el primer cas i el 0,1 en el segon)”. Rafel (1996), volum 1 pàg. VIII. 51 Trobareu tota la informació sobre aquest concepte a Rafel (1996), volum 1, pàg, XLV-XLIX.

19

el millor o pitjor repartiment de les seves ocurrències en els diferents gèneres –en el cas del

subcorpus literari– o en els diferents grups temàtics –en el cas del subcorpus no literari– en què

es divideix el corpus, tenint en compte, és clar, el diferent volum de cada gènere o cada grup en

el corpus. El resultat s’acostarà a la freqüència original si les ocurrències del mot es troben ben

repartides en els diferents grups que formen el corpus, i se n’allunyarà si estan agrupades en un

sol grup o en un conjunt reduït de grups.

Per adonar-nos de la importància del concepte i de les diferències que implica treballar amb un o

altre valor, bastarà veure l’exemple de dos lemes als quals, tot i que en el subcorpus no literari

tenen la mateixa freqüència absoluta (487), els correspon un ús força diferent:

conferir v. 416,29 atleta m. 192,88

Segons aquestes dades, veiem com el lema ‘conferir v.’ té un ús molt més alt i més proper a la

freqüència absoluta que el lema ‘atleta m.’. Això ens indica que les ocurrències del primer cas es

troben molt ben repartides entre els diferents grups temàtics en què s’organitza el subcorpus no

literari, mentre que les del segon apareixen majoritàriament en uns grups molt determinats.

Concretament, el repartiment és el que es pot veure a la taula 2, on es pot comprovar com les

ocurrències del lema ‘atleta m.’ es concentren, majoritàriament, en el grup “Arts, jocs i esport”.

Atès que en el CTILC el volum de mots varia molt d’un grup a l’altre, afegim a la taula una fila en

què veurem el nombre d’ocurrències que, proporcionalment segons el percentatge que cada

grup temàtic representa sobre el total del subcorpus no literari, aquests mots haurien de tenir.52

Filosofia Religió Ciències

socials Premsa

Ciències

pures i naturals

Ciències

aplicades

Arts,

jocs i esport

Llengua i

literatura

Història i

geografia Corresp.

Ocurrències esperables

29,22 49,6 93,01 59,9 37,01 74,51 46,75 37,01 58,44 2,43

conferir v. 40 83 130 24 19 59 43 27 62 0

atleta m. 15 34 5 50 8 48 302 14 11 0 Taula 2

Considerem, doncs, que per a aquest treball serà molt més interessant la utilització de les dades

de l’ús que les de la freqüència, ja que sembla clar que reflecteix molt millor el grau d’utilització

real del mot en la llengua. Tot i això, en algun punt, haurem de referir-nos, també, a la freqüència

absoluta.

52 En el cas de ‘conferir v.’, les diferències de freqüència tan grans entre els grups reflecteixen aquest diferent volum de mots de cadascun en el corpus. Concretament, el repartiment dels mots entre els diferents grups del corpus no literari és aquest: Filosofia, 6 % dels mots; Religió, 10,2 %; Ciències socials, 19,1 %; Premsa, 12,3 %; Ciències naturals, 7,6 %; Ciències aplicades, 15,3 %; Arts, jocs i esport, 9,6 %; llengua i literatura, 7,6 %; Història, 12 %; i Correspondència, 0,5 %.

20

De tota manera, abans d’entrar en matèria, haurem de fer, encara, alguna altra adaptació de les

dades del DF. D’entrada, val a dir que treballarem sempre amb la suma dels dos usos, el

corresponent al subcorpus literari i el que es refereix al subcorpus no literari. Tot i que el DF

presenta separades les dues dades, sembla que, sumant-les, podrem treballar amb una

informació més propera a l’ús general de la llengua, sense patir desviacions a causa de les

especificitats del lèxic utilitzat en els textos literaris o en els no literaris. A la taula 3 podem veure

alguns resultats d’aquesta operació.

Lema Ús (corpus literari) Ús (corpus no literari) Suma d’usos

despertar v. 62,52 62,03 124,55

graduable adj. 0,46 6,84 7,3

hàbilment adv. 47,04 85,99 133,03

hegemonia n. 68,45 266,44 334,89 Taula 3

En alguns casos, la gran diferència entre l’ús en el corpus literari i en el no literari justifica encara

més la necessitat de treballar amb la suma de les dues dades. Si no ho féssim així, els resultats

podrien ser molt diferents segons si treballéssim amb les dades d’un o altre subcorpus. En són

una bona mostra els lemes que apareixen a la taula 4.53

Lema Ús (corpus literari) Ús (corpus no literari)

ull n. 22387,72 5592,77

mirar v. 25165,27 4968,9

forma n. 3881,2 22476,12

sistema n. 518,1 9576,24

conjunt n. 529,58 6439,93 Taula 4

Fet això, ordenem la llista resultant de manera decreixent segons la suma d’usos i assignem un

número d’ordre a cada lema, començant pel 0.54 Aquest número d’ordre, que anomenarem

Rang, serà el valor que donarem a cadascun dels lemes. A la taula 5 podem veure els primers

lemes de la llista.

Lema Suma d’usos Rang

el ar. 4993290,50 0

de prep. 3157141,68 1

i conj. 1657865,85 2

ell pron. 1405726,89 3

a prep. 1187478,42 4 Taula 5

53 Per adonar-se de la magnitud d’aquestes diferències, cal tenir present que el nombre de paraules del subcorpus literari i el del no literari són molt similars; concretament, un 44 % de les paraules del CTILC pertanyen al subcorpus literari i un 56 %, al no literari. 54 Més endavant, veurem per què comencem pel 0 i no pas per l’1.

21

En el cas que hi hagi més d’un lema amb la mateixa suma d’usos, els assignarem el mateix

número d’ordre (i, per tant, el mateix Rang). En mostrem un exemple a la taula 6.

Lema Suma d’usos Rang

parador n.

65,17 14357 avingut adj.

constatat adj. Taula 6

El resultat és una taula de 136474 lemes repartits en un rang que va del 0 al 22604.

Un cop assignat un valor a cadascun dels lemes, els agruparem de manera que puguem saber

quants n’hi ha entre el rang 0 i el 500, quants entre el 501 i el 1000, quants en tre el 1001 i el

1500, etc. El repartiment és el que es mostra a la taula 7. Com podem comprovar, la majoria dels

lemes s’agrupen en els rangs més alts, que corresponen als usos més baixos en el corpus.55

Rang Lemes Rang Lemes

0-500 501 11501-12000 604

501-1000 500 12001-12500 629

1001-1500 501 12501-13000 650

1501-2000 505 13001-13500 669

2001-2500 502 13501-14000 679

2501-3000 511 14001-14500 748

3001-3500 506 14501-15000 736

3501-4000 508 15001-15500 732

4001-4500 513 15501-16000 792

4501-5000 514 16001-16500 854

5001-5500 513 16501-17000 972

5501-6000 513 17001-17500 1.019

6001-6500 518 17501-18000 1.040

6501-7000 521 18001-18500 1.147

7001-7500 530 18501-19000 1.307

7501-8000 523 19001-19500 1.476

8001-8500 542 19501-20000 1.767

8501-9000 565 20001-20500 2.028

9001-9500 553 20501-21000 2.777

9501-10000 567 21001-21500 4.038

10001-10500 582 21501-22000 7.121

10501-11000 603 22001-22500 25.861

11001-11500 577 22501-22604 66.660 Taula 7

55 Les dades que ens ofereix el DF ens mostren l’ús amb només dos decimals; és per això que hi ha una quantitat tan gran de lemes als quals hem hagut d’atribuir el mateix rang, especialment en els més alts. Vegeu, per exemple, com, en l’últim grup –el que recull els lemes situats entre els rangs 22501 i 22604–, n’hi ha 66660, gairebé la meitat del total. S’ha de tenir en compte que, dels 136474 lemes que conté el corpus, n’hi ha 46107 (un 33,78 %) que hi apareixen un sol cop.

22

Aquesta és la informació bàsica de referència que utilitzarem en els diversos sistemes de

valoració del lèxic del text que veurem en els apartats següents.

2.3. Eines desenvolupades

Hem vist, fins ara, l’origen de les dades amb què treballarem i les adaptacions que hi hem fet. De

tota manera, per poder enfrontar-nos a la comparació de dos textos com les dues versions

d'Aloma, ens caldrà disposar d’eines que ens facilitin la tasca. És cert que el sistema de

consultes al CTILC ens permet d’accedir als contextos de la primera versió d’Aloma a partir dels

criteris que ens calgui, però no podem fer el mateix amb els de la segona versió ni –per

descomptat– treballar amb tots dos alhora, l’un al costat de l’altre. És per això que hem

desenvolupat dues eines essencials a l’hora de fer un treball com el que pretenem: d’una banda,

l’alineació dels dos textos, que ens permetrà de fer-ne una lectura en paral·lel i localitzar les

equivalències entre les dues versions; i de l’altra, la creació d’un sistema informàtic de consultes

que ens faciliti l’acarament dels dos textos.

2.3.1. Alineació dels dos textos

Una manera ideal d’alinear dos textos seria fer-ho a nivell de paràgraf: és a dir, una operació tan

senzilla com numerar-los i dir que el paràgraf 1 de la primera versió correspon al paràgraf 1 de la

segona; el 2, al 2; i així successivament. La realitat, però, és molt més complexa i, molt sovint, un

paràgraf de la primera versió no es correspon exactament amb un altre de la segona, sinó que la

mateixa informació la trobem distribuïda en diversos paràgrafs contigus. També es produeix el

cas invers, és clar.

Per exemple, si ens fixem en el començament del capítol I, podem veure com els dos primers

paràgrafs poden alinear-se perfectament: els paràgrafs 1 i 2 de la primera versió es corresponen

exactament amb els paràgrafs 1 i 2 de la segona:

Paràgraf

Text Aloma 1

Paràgraf

Text Aloma 2

1 L'amor em fa fàstic! 1 -L'amor em fa fàstic!

2 Va dir-s'ho pensant en aquell pobre gat i tancà el reixat d'una revolada: aquest féu un gran soroll de frontisses rovellades. Al capdamunt, en un adornament de ferros cargolats, amb la pintura escrostonada i el rovell menjant-se'ls, hi havia una data: 1886.

2 Havia pensat tota la tarda en aquell pobre gat i, sense voler, va tancar el reixat d'una revolada. A dalt de tot, entre rodones i cargols de ferro despintat, mig decantada i coberta de rovell, es veia una data: 1886. Havien comprat el reixat feia uns quants

23

Aquesta no ens aclareix pas la de construcció de la casa, car el reixat havia estat adquirit en l'enderroc d'una finca expropiada per eixampla. Havia estat un esdeveniment l'adquisició, sobretot perquè, amb poca despesa, la torre, que no tenia torratxa com era costum en qualsevol que volgués lluir una mica, adquiria un aire més senyor. I el jardí també: fins llavors havia calgut entrar-hi per una porta menuda que obligava a ajupir-se en passar-la si, qui ho feia, no volia ésser rebatut enfora. Depenia de l'embranzida, és clar.56

anys, a preu de ferro vell, en l'enderroc d'una finca expropiada per eixampla. La casa de seguida va semblar més senyora. I el jardí. Abans tenia una porteta de fusta i si el qui hi entrava era massa alt s'havia d'ajupir una mica.57

La continuació del text, en canvi, ja no permet aquesta alineació: el paràgraf 3 de la segona

versió recull tota la informació dels paràgrafs 3 i 4 de la primera.

Paràgraf

Text Aloma 1

Paràgraf

Text Aloma 2

3

4

El reixat ample va deixar passar més aire i els arbres van adonar-se'n. El taronger, amb les taronges agres com fel, però ben florit quan n'era temps, tenia les fulles més verdes; els rosers, els brots més ferms. Llàstima que el carrer era un cul de sac i pocs foren els qui hagueren esment de la important millora. Malgrat això la remor sorda dels diumenges entrava per l'esvoranc i s'arraulia al jardí, vora el respir de les plantes.58

3 El reixat, més ample, va deixar passar més aire i els arbres va semblar que se n'adonessin. El taronger, amb les taronges agres com fel, tenia les fulles més verdes. Els rosers feien més roses. Era una pena que per aquell carrer no hi passés mai ningú. Acabava dos jardins més enllà amb una paret alta, el vent a penes movia les herbes que naixien ran de les pedres i hi havia una gran quietud com si cada dia fos diumenge.59

Per tal de solucionar aquest problema, el model que s’ha seguit és la divisió de tot el text en

grups de paràgrafs seguint aquests criteris:

Cada grup ha de contenir el mínim nombre de paràgrafs possible.

No ha de quedar cap paràgraf d’una versió sense estar assignat a un grup.

Si un paràgraf afegeix una informació inexistent a l’altra versió, cal incloure’l en el grup

del paràgraf anterior.

Com a mostra d’aquest últim criteri, podem veure aquest fragment del capítol II, en què la

segona versió elimina dues intervencions en un diàleg:

56 Rodoreda (1938), pàg. 9. 57 Rodoreda (1969), pàg. 7. 58 Rodoreda (1938), pàg. 10. 59 Rodoreda (1969), pàg. 7.

24

Grup Paràgraf

Text Aloma 1

Paràgraf

Text Aloma 2

22

32

-Què és goleta?

22

-Què és una goleta?

23

33

34

35

-Una nau de molta valentia. -I nau? -Vaixell.

23

-Una barca de molta valentia.

24 36 -Per què els pirates van en vaixell?60 24 -Per què van en barca els pirates?61

Tot i que la casuística és molt diversa, tots els casos s’han pogut solucionar seguint els criteris

establerts.

Com a resultat de l’aplicació d’aquests criteris, el primer capítol –per posar un exemple– s’ha

dividit en 69 grups de paràgrafs, que recullen els 127 de la primera versió i els 78 de la segona.

Per tal de facilitar les consultes posteriors, tota aquesta informació s’ha registrat en una base de

dades. Els primers registres –entre els quals s’inclouen els fragments del capítol I que hem vist–

quedarien codificats d’aquesta manera:

Capítol Grup Versió 1 Versió 2

1 1 1 1

1 2 2 2

1 3 3 3

1 4 5 4

1 5 7 7

1 6 8 8

En aquesta taula informatitzada, cada registre representa un grup de paràgrafs. Les columnes

“Versió 1” i “Versió 2” es refereixen al número del paràgraf en què comença el grup a cadascuna

de les dues versions.

2.3.2. Creació d’un sistema de consultes

La segona eina que hem desenvolupat és un sistema informàtic que, a partir de l’alineació que

hem explicat breument en el punt anterior i d’un algorisme de reconstrucció del text,62 ens permet

60 Rodoreda (1938), pàg. 35. 61 Rodoreda (1969), pàg. 22. 62 S’ha de tenir en compte que el text no es guarda com a tal en el suport informàtic sinó en una base de dades en què cada registre emmagatzema la informació referent a una localització (versió, capítol, número de paràgraf i posició del mot dins el paràgraf), juntament amb les dades de caràcter lèxic (forma gràfica, lema i categoria gramatical), contextual (signes de puntuació que estan en contacte amb el mot) o de caràcter gràfic (característiques tipogràfiques).

25

d'accedir a tots els contextos de qualsevol mot i, des d'allà, veure els que corresponen a l'altra

versió.63 Tot i que tant l’arquitectura com el disseny del sistema són originals, s’ha seguit

l’exemple de diversos sistemes de consulta de corpus lingüístics actualment en func ionament,

entre els quals hi ha, òbviament, el CTILC.

El funcionament és molt simple. Partim de la selecció del llistat de lemes que volem consultar.64

Per a cada versió, podem seleccionar aquests llistats:

Tots els lemes (ordenació alfabètica)

Tots els lemes (ordenació per freqüència)

Noms propis (ordenació alfabètica)

Noms propis (ordenació per freqüència)

Noms propis (ordenació alfabètica acompanyada de les localitzacions)

Noms propis exclusius (ordenació alfabètica)

Noms propis exclusius (ordenació per freqüència)

Noms (ordenació alfabètica)

Noms (ordenació per freqüència)

Noms (ordenació alfabètica acompanyada de les localitzacions)

Noms exclusius (ordenació alfabètica)

Noms exclusius (ordenació per freqüència)

Adjectius (ordenació alfabètica)

Adjectius (ordenació per freqüència)

Adjectius (ordenació alfabètica acompanyada de les localitzacions)

Adjectius exclusius (ordenació alfabètica)

Adjectius exclusius (ordenació per freqüència)

Verbs (ordenació alfabètica)

Verbs (ordenació per freqüència)

Verbs (ordenació alfabètica acompanyada de les localitzacions)

Verbs exclusius (ordenació alfabètica)

Verbs exclusius (ordenació per freqüència)

Adverbis (ordenació alfabètica)

Adverbis (ordenació per freqüència)

Adverbis (ordenació alfabètica acompanyada de les localitzacions)

Adverbis exclusius (ordenació alfabètica)

Adverbis exclusius (ordenació per freqüència)

A més, en el cas del lèxic compartit entre les dues versions, podem seleccionar aquests llistats:

63 Es tracta d’un conjunt de pàgines ASP (Active Server Pages) amb consultes SQL (Structured Query Language) que interroguen una base de dades MS Acces. 64 Tot i que no es poden considerar lemes, hem inclòs en el sistema la possibilitat de fer consultes per als noms propis.

26

Noms propis (ordenació alfabètica)

Noms propis (ordenació alfabètica acompanyada de les localitzacions)

Noms (ordenació alfabètica)

Noms (ordenació alfabètica acompanyada de les localitzacions)

Adjectius (ordenació alfabètica)

Adjectius (ordenació alfabètica acompanyada de les localitzacions)

Verbs (ordenació alfabètica)

Verbs (ordenació alfabètica acompanyada de les localitzacions)

Adverbis (ordenació alfabètica)

Adverbis (ordenació alfabètica acompanyada de les localitzacions)

El resultat és sempre un llistat de lemes (o de noms propis, si s’escau). La imatge 1 és la captura

de pantalla d’una d’aquestes possibilitats de consulta. Com es pot veure, al costat de cada lema

hi apareix la informació sobre el nombre de vegades que apareix a l’obra.

Imatge 1

A partir de la selecció d’un dels lemes, el sistema ens en construeix el llistat de concordances, és

a dir, per a cada ocurrència del lema, ens mostra una línia de context amb la paraula clau enmig

(imatge 2).

27

Imatge 2

Des d’aquesta pantalla,65 un clic del ratolí a qualsevol dels contextos ens portarà a la fitxa de la

localització, on consta tota la informació sobre l’ocurrència seleccionada, a més d’un context

format per la paraula clau, vint paraules al davant i vint al darrere (imatge 3). Aquesta mateixa

fitxa la podem veure, també, amb el paràgraf en què apareix la paraula clau sencer (imatge 4).

Imatge 3

65 Els contextos mostrats corresponen a Rodoreda (1938), pàg. 32, 41, 53, 114, 121, 155, 166, 215, 216, 233.

28

Imatge 4

Des de qualsevol d’aquestes dues fitxes, finalment, hi ha la possibilitat de veure el fragment

equivalent de l’altra versió. El que ens mostra el sistema és, concretament, el grup de paràgrafs

a què pertany el mot seleccionat, segons el que hem comentat en el punt anterior (imatge 5).66

Imatge 5

És evident que disposar d’aquestes dues eines facilita molt la feina i permet analitzar en

profunditat tots els canvis entre les dues versions. Més enllà d’aquest treball, el sistema podria

ser útil per a qualsevol estudi que es faci en aquesta direcció.

66 Rodoreda (1938), pàg. 53; i Rodoreda (1969), pàg. 35.

29

3. Les dues versions d’Aloma, en xifres. Cap a la simplicitat

3.1. Dades generals

Des del punt de vista numèric, la dada més evident que se’ns mostra quan ens enfrontem a la

comparació de les dues versions d’Aloma és la reducció, la disminució del nombre de paraules

utilitzades; Rodoreda s’adona que pot dir el mateix simplificant el text d’una manera important.

No només això: pot dir el mateix i, des del punt de vista de la qualitat literària, pot dir-ho millor

(ara per ara, aquesta és una afirmació que no discuteix ningú). Ho explica ella mateixa en el

“Pròleg” a Mirall trencat:

Escriure bé costa. Per escriure bé entenc dir amb la màxima simplicitat les coses essencials.

Donar relleu a cada paraula; les més anodines poden brillar encegadores si les col·loques en un

lloc adequat.67

A la gràfica 1, podem veure com les 51987 ocurrències68 de la primera versió passen a ser

41807 a la segona, un 19,5798 % menys; les ocurrències lematitzades69 passen de 51089 a

67 Rodoreda (1974), pàg. 14. 68 Entenem per ocurrència qualsevol cadena de caràcters, generalment delimitada per un espai en blanc, un apòstrof, un guionet o un signe de puntuació. 69 No són susceptibles de ser lematitzades (si més no, en el sistema utilitzat en el CTILC i en aquest treball) les ocurrències que representen xifres representades amb caràcters numèrics, noms propis, citacions d'altres obres, noms de diaris o revistes, mots en una llengua estrangera o qualsevol altra cadena de caràcters a la qual no es pugui assignar un lema. A la primera versió d'Aloma, aquesta restricció afecta 898 ocurrències (un 1,72 % del total); a la segona, tot i ser més breu, 1174 (un 2,80 %).

51987 51089

41808 40634

0

10000

20000

30000

40000

50000

60000

Ocurrències (incr.: -19,5798 %) Ocurrències lematitzades (incr.: -20,4642 %)

GRÀFICA 1. Nombre d'ocurrències

Aloma 1

Aloma 2

30

40633, amb una disminució gairebé idèntica a la de la dada anterior, com era esperable, un

20,4662 %.

L’evidència d’aquesta dada no li treu rellevància; al contrari, ens indica una primera intenció de

Rodoreda a l’hora de reescriure Aloma. Són diversos els autors que han fet referència a aquest

canvi en la segona versió de la novel·la. L’any 1992, M. Carme Bernal i C. Rubio ho comentaven

amb aquestes paraules:

Per altra part, els diàlegs són molt més reduïts en l’edició revisada, s’han eliminat frases

supèrflues i, en canvi, es guanya en densitat narrativa. [...] Sovint, un paràgraf llarg de la primera

edició és substituït en l’edició revisada per una sola frase engalzada en el context descriptiu.70

Efectivament, si ens mirem els dos textos, veurem com, molt sovint, un fragment de text és

substituït per un altre de significat similar –o idèntic– però molt més breu. Es tracta, en paraules

de Carme Arnau, d’eliminar “tot el que faci massa ‘olor’ de literatura”.71 Vegem-ne, per exemple,

aquest cas (capítol IV):

Aloma 1 Aloma 2

És quan Anna treu la plàtera de pastissos i

les ampolles de vi bo que tots s'apropen a la

taula i el nen esbatana els ulls, llaminers de

tot el que veuen.72

-Per què no vas a buscar els pastissos? -va

dir Joan.73

O aquest altre (capítol XVIII):

Aloma 1 Aloma 2

Però sorgeix bruscament el retrat d'aquella

dona, i tot mor. Per a prendre vida. El

problema es dreça viu. Ha passat sempre

titubejant i allò que cal són resolucions.

El pensament crida fort. Cal trobar camins.

Anar amb el corrent i, si cau, aixecar-se.

Acceptar el dolor sense témer-lo. És

necessari d'acumular molta valentia per a les

hores que vindran. El fill clourà una etapa de

Va veure aquell retrat com si encara

l'estigués mirant. "Té els ulls bonics -havia dit

Anna- però no és gaire maca." Hauria de ser

molt valenta. Ja començava a semblar-li que

tenia el fill al costat. Li hauria d'ensenyar de

mica en mica com era la vida. Perquè s'hi

avesés. Podria aprofitar la robeta de Dani;

gairebé era nova.75

70 Bernal (1992), pàg. 345. 71 Arnau (1979), pàg. 201. 72 Rodoreda (1938), pàg. 59-60. 73 Rodoreda (1969), pàg. 39. 75 Rodoreda (1969), pàg. 127.

31

la seva vida. Començarà sense temors i

sense dubtes. Ara sí que de debò no serà

una noia i troba nicis els anys viscuts

somniant. El fill, que tot just pren vida,

l'encara amb la realitat i potser li ensenyarà

d'estimar-la. Es farà gran i ella li haurà

explicat talment les coses de la vida, que ell

no la temerà. Sense mentides, tal com és.

Crua i nua. Amb tota l'aspror, però també

amb tot el goig, que bé deu haver-n'hi.

Fa projectes per a quan el fill serà gran.

Podrà aprofitar, quan neixi, la robeta de Dani.

És gairebé nova.74

Tot i que també podríem trobar paràgrafs amb el fenomen contrari, aquesta simplificació és la

norma general quan ens enfrontem a les dues versions de manera paral·lela. L’any 1979, Carme

Arnau insinuava ja les raons i els objectius d’aquest canvi quan afirmava que “A grans trets la

segona versió, menys retòrica, és més condensada que no pas la primera. Demostra així el

treball i l’esforç que costa d’arribar a la senzillesa i al despullament, els quals s’assoleixen, tan

sols, amb els anys, amb la plenitud creadora.”76

Si ens endinsem més en les dades, veiem que, a la segona versió, també es redueix el nombre

de lemes utilitzats (gràfica 2): passem de 4319 a 2479, un 42,6024 % menys. Si tenim en compte

que, en el cas de les ocurrències i de les ocurrències lematitzades, la disminució era d’un

19,5818 % i d’un 20,4662 %, respectivament, aquesta dada no deixa de ser transcendent i ens

mostra la voluntat –i potser, també, la capacitat– de l’autora de dir el mateix amb un conjunt lèxic

molt menor.

74 Rodoreda (1969), pàg. 206-207. 76 Arnau (1979), pàg. 200.

32

De tota manera, com que el nombre de lemes utilitzats pot estar molt condicionat per l’extensió

de l’obra, val la pena veure quantes vegades s’utilitza, de mitjana, cadascun d’aquests lemes

(gràfica 3).

Es tracta d’una diferència molt significativa entre les dues versions de la novel·la. Algunes raons

que podrien explicar aquest ús més freqüent de cada mot poden ser la utilització, a la segona

versió, d’elements perifràstics per substituir-ne de lèxics, la reducció dels casos de sinonímia i la

4319

2478

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

Lemes (increment: -42,6256 %)

GRÀFICA 2. Nombre de lemes

Aloma 1

Aloma 2

11,8288

16,3979

0

2

4

6

8

10

12

14

16

18

Ocurrències per lema (increment: 27,8326 %)

GRÀFICA 3. Mitjana d'ocurrències per lema

Aloma 1

Aloma 2

33

preferència de l’autora pels mots polisèmics. Pere Gamisans, en la seva tesi doctoral, esmenta,

per exemple, casos de substitució per elements perifràstics com aquests, en adjectius:77

“pantalons exigus” “pantalons tan petits” (capítol XIII)

“llavis ensangonats” “llavis bruts de sang” (capítol XVI)

“esguard encuriosit” “ulls plens de curiositat” (capítol XIX)

O aquests, en verbs:78

“encaixar amb Robert”79 “allargar la mà a Robert” (capítol IV)

“qui no peca” “els qui no feien cap pecat” (capítol XII)

Certament, en tots aquests exemples, Rodoreda substitueix un lema que només utilitzava en

aquests casos per una expressió perifràstica formada per lemes de freqüència generalment molt

alta. A la taula 8, podem veure els detalls de la freqüència, a les dues versions de la novel·la,

dels lemes substituïts i dels que els substitueixen.

Lema a Aloma 1 Freqüència a

Aloma 1 Freqüència a

Aloma 2 Lema a Aloma 2

Freqüència a Aloma 1

Freqüència a Aloma 2

exigu adj. 1 0 petit adj. 6 2

ensangonat adj. 1 0 brut adj. 9 11

sang n. 14 12

encuriosit adj. 1 0 ple adj. 47 38

curiositat n. 4 2

encaixar v. 2 0

allargar v. 5 3

donar v. 61 70

mà n. 132 98

pecar v. 1 0 fer v. 593 496

pecat n. 1 1 Taula 8

Cap dels lemes substituïts en aquests contextos esmentats per Gamisans no apareix a la segona

versió; els lemes que formen part de les expressions perifràstiques que els substitueixen, en

canvi, hi són molt freqüents (excepte el cas del substantiu 'mà', que hi apareix un sol cop).

Pel que fa a la polisèmia, Gamisans fa aquesta observació:

Le lexique de la deuxième version se caractérise par une plus grande polysémie. Le terme

substitut est plus polysémique (POL), soit qu’il puisse être employé avec le même sens dans un

77 Gamisans (1988), pàg. 36. 78 Gamisans (1988), pàg. 58. 79 En el mateix capítol IV, hi ha un altre cas d’”encaixar amb Robert”, substituït per “donar la mà a Robert”.

34

plus grand nombre de contextes, ce que nous pouvons appeler polysémie contextuelle, soit qu’il

ait plus de sens que celui qu’il substitue (polysémie inhérente).80

Hem vist, fins ara, diferències numèriques entre diversos conceptes (nombre d’ocurrències,

d’ocurrències lematitzades, de lemes i d’ocurrències per lema). Serà interessant, ara, de veure

de manera gràfica i conjunta quines diferències hi ha entre els increments en la segona versió

respecte a la primera, en cadascun d’aquests conceptes (gràfica 4).

Podem comprovar que, mentre que els tres primers paràmetres (ocurrències, ocurrències

lematitzades i nombre de lemes) disminueixen de manera molt significativa en la segona versió,

l’últim (ocurrències per lema) hi és clarament superior.

A la gràfica 5 podem veure la mitjana d’ocurrències per lema tenint en compte, exclusivament,

els lemes de les categories que tenen més pes en la narració (noms, adjectius, verbs i adverbis) i

desestimant, per tant, les categories menors (és evident que la presència d’articles, preposicions,

conjuncions o pronoms –generalment de freqüència molt alta– en els càlculs altera de manera

significativa la mitjana resultant).81 En tots els casos, la mitjana és superior en la segona versió

que en la primera, molt especialment pel que fa als verbs i els adverbis (si, en el cas dels noms i

els adjectius, l’increment és d’un 21,67 % i un 18,72 %, respectivament, el dels verbs és d’un

71,32 % i el dels adverbis, d’un 86,36 %).

80 Gamisans (1988), pàg. 65. 81 A la primera versió, per exemple, en què la mitjana és de 27,8336 ocurrències per lema, l’article el hi apareix 3885 cops; la preposició de, 2417 cops; la conjunció que, 1068 cops; i el pronom que, 772 cops. A la segona, els mateixos lemes hi tenen 3001, 1871, 788 i 495 ocurrències.

-20,4642 -19,5798

-42,6256

27,8326

-50

-40

-30

-20

-10

0

10

20

30

40

GRÀFICA 4. Percentatges d'increment entre les dues versions

Ocurrències

Ocurrències lematitzades

Lemes

Ocurrències per lema

35

En el mateix sentit que comentàvem, és cert que, en alguns casos, la presència de mots de

freqüència necessàriament molt alta pot pervertir-ne el resultat. És per això que, a la gràfica 6,

modifiquem les columnes dels verbs i dels adverbis. En el primer cas, eliminem dels càlculs els

verbs ‘haver’ (que apareix 1264 cops a la primera versió i 1184 a la segona), ‘ésser’ (amb 1113

aparicions a la primera i 551 a la segona), ‘anar’ (505 a la primera i 2167 a la segona)82 i ‘estar’

(133 a la primera i 314 a la segona); en el segon, l’adverbi ‘no’, el més utilitzat, amb diferència, a

qualsevol obra i, per descomptat, a les dues versions d’Aloma (1310 aparicions a la primera

versió i 875 a la segona). Fent-ho així, l’increment serà d’un 44,76 % en els verbs i d’un 87,54 %

en els adverbis.

82 En aquest cas, l’augment tan alt en la segona versió es deu al canvi del temps en la narració. Si la primera versió és narrada en present i la segona en passat, és obvi que en aquesta darrera s’hi ha d’incrementar de manera molt important l’ús del perfet perifràstic i, per tant, del verb ‘anar’, que inclou entre les seves formes les auxiliars d’aquest temps verbal. Ho comenten, per exemple, M. Carme Bernal i C. Rubio: “Pel que fa al llenguatge, el narrador passa d’una veu narrativa en present a la utilització de la forma del perfet perifràstic de manera que el narrador deixa d’estar present contínuament dins la història i desapareix del mig.” Bernal (1992), pàg. 346.

4,43 4,38

11,96

17,68

7,035,39 5,2

20,49

32,95

9,94

0

5

10

15

20

25

30

35

Noms Adjectius Verbs Adverbis Suma

GRÀFICA 5. Mitjana d'ocurrències per lema segons la categoria

Aloma1

Aloma 2

36

3.2. Mots que apareixen un sol cop a cada versió

Una

Nous mètodes per a la comparació de textos5 vora el mar (1967)–, a més de dos reculls de contes...

Documents

Transcript of Nous mètodes per a la comparació de textos5 vora el mar (1967)–, a més de dos reculls de contes...