Quantcast
Channel: Cathalaunia. La Catalunya abans de Catalunya
Viewing all 324 articles
Browse latest View live

Malcodificacions ibèriques i semblances amb l’euskera.

$
0
0

Aquest apunt és com un tutti frutti, d’entrada és una mena de continuació de dos apunts previs: Malcodificant l’ibèric nord-orientalEls caràcters de l’ibèric nord-oriental, i acaba demostrant estadísticament la proximitat de l’ibèric amb l’euskera.  En el primer apunt es comentava com la proposta de codificació de l’ibèric nord-oriental per a Unicode havia reduït els nombre de caràcters a poc més 50 (puntuacions incloses) quant en els originals es poden detectar més del doble de glifs diferents, i en el segon s’analitzaven quantitativament la co-presència de glifs al·lògrafs en una mateixa epigrafia i es postulava la necessitat de diferenciar no entre 50, sinó entre 85 i 96 signes diferents.

Ja fa uns mesos, que processant el darrer volum de la revista Paleohispànica (el de 2015), va cridar l’atenció un article dels mateixos autors que la proposta per a Unicode (el grup LITTERA de la UB): Ferrer i Jané, Joan + Moncunill, Noemi + Velaza Frias, Jesús Javier : 2015 : “Towards a systematisation of paleohispanic scripts in Unicode. Systhesising multiple transcription hypotheses into two consensus encodings” : Palaeohispánica – revista sobre lenguas y culturas de la Hispania antigua : 15 p.13-55. I unes setmanes més tard, es tenia accés a la proposta del mateix grup per les llengües preromanes del sud de la península ibèrica: Ferrer i Jané, Joan + Moncunill, Noemi + Velaza Frias, Jesús Javier : 2015 : “Preliminary proposal to encode the southern paleohispanic scripts for the UNICODE standard”.

La lectura d’aquests dos darrers treballs va despertar uns quants dubtes no pas menors:

  1. Es declara que en utilitzar els mateixos caràcters que l’ibèric nord-oriental, el celtibèric, no requereix de cap entrada pròpia en l’estàndard Unicode.
  2. Es diu que totes les llengües ‘hispàniques’ tenen un mateix origen.
  3. A semblança de l’ibèric nord-oriental, es codifiquen (conjuntament) el tartessi i l’ibèric sud-oriental en 48 entrades noves (code-points en terminologia codicològica).

Ja en la lectura del primer article vaig mirar de preguntar si havia realment entès bé aquests punts, i efectivament, la resposta va ser que sí. Posteriorment amb la lectura de la proposta de codificació del tartessi i del ibèric sud-oriental, vaig comprovar que efectivament, el mateix criteri reductor que s’havia aplicat a l’ibèric nord-oriental, s’aplicava també a aquelles escriptures conjuntament.

tartes-sud-est-1

Els 48 caràcters del tartessi i de l’ibèric sud-oriental en la proposta per a UNICODE.

No sabent pràcticament res en detall de les escriptures del sud de la península, vaig aprofitar les descripcions que es donen en la proposta per a Unicode, ja que són excel·lents per entendre la posició acadèmica actual. El problema és que quan més llegia menys entenia, i els dubtes, en comptes de disminuir s’incrementaven.

Al cap de poc temps, es va mirar de fer bona la proposta de codificació de l’ibèric nord-oriental i comprovar en el corpus d’epigrafia ibèrica de cathalaunia (l’únic actualment publicat, juntament amb el de na Carme Huertas i en David Folch, del qual deriva, que detalla quina variant de cada signe figura originalment en les inscripcions) si efectivament amb els 49 signes de la proposta es podia donar raó de la particularitat de totes les epigrafies. És a dir, si la teoria era correcta, mai (o casi mai) s’hauria de trobar dues variants d’un mateix signe de la proposta en una mateixa inscripció ja que això seria senyal que en origen es diferenciaven coses que en la nostra teoria actual  haurien de ser equivalents. Però ja tot just començar va quedar clar que això no era pas així, de manera que vaig tornar a demanar ajut als experts per veure si estava cometent algun error sistèmic que podés donar raó a la magnitud de la discrepància. Posteriorment, en acabar el recompte, els resultats, eren quantitativament, força similars al repertori de 95 signes definits per Untermann, de manera, que potser s’havia verificat  mecànicament, de manera aproximada , el que el filòleg germànic havia recopilat prèviament de forma manual. La discrepància amb la proposta per a Unicode estava servida.

Així que en aquest apunt parlarem dels tres dubtes anteriors, dels comentaris dels experts, i anirem una mica més enllà en la problemàtica de l’ibèric nord-oriental. Tot plegat, un totum revolutum al que mirarem de donar alguna il·lació que tingui sentit.

Lenguas hispánicas

Per començar, un apunt aïllat. En aquests dos articles esmentats del grup LITTERA, tot i que com hem dit, parlen del celtibèric (per negar-li cap especificitat que necessiti codificació), no s’esmenta, ni en la bibliografia, un treball previ del 2011, que ja havia estat citat en aquest bloc: Olcoz Yanguas, Serafin + Medrano Marqués, Manuel : 2011 : “Una propuesta de normalización de la escritura celtibérica” : Veleia – revista de prehistoria, historia antigua, arqueología y filología clásicas : 28 p.141-160. Entenent que els autors són experts en la matèria em resultà inexplicable (deixem-ho així) l’absència de tota referència a un precedent tan explícit.

celtiber-1

La proposta d’Olcoz i Medrano per l’ibèric incloent variants celtibèriques.

Però més enllà d’aquest detall, és evident que hi han signes que no es corresponen, variants si es vol d’un mateix só, però especificitats al cap i la fi, que la proposta de codificació esborra, tant per el que fa a l’adaptació celtibèrica com per els signaris meridionals. De tirar-se endavant, i em consta que no hi ha voluntat de canviar substancialment les propostes fetes, l’única opció de representar amb tecnologia informàtica estàndard els signes originals seria a base de fonts tipogràfiques alternatives. Com si per escriure amb majúscules, o amb accents en les llengües modernes, haguéssim d’emprar una font diferent per cada ‘variant’: una per majúscules, una altra per accents oberts, una més per tancats, i així anar fent. Oi que no té sentit? Doncs exactament per això Unicode no reconeix la ‘A’ majúscula com una variant de la ‘a’ minúscula (o viceversa), sinó que li atorga a cada glif un codi propi i els considera ‘caràcters’ diferents. En el cas de l’ibèric, no sabem a què responia aquella varietat sígnica, el que no sembla de cap manera raonable és esborra-la com si no existís! Però aquest punt ja el varem comentar en l’apunt sobre la codificació de l’ibèric nord-oriental, i a més, hi tornarem més endavant…

El que sí es detecta en la literatura filològica ibèrica, és una voluntat política uniformitzadora en la mirada al món ibèric, que no és en cap cas nova, ni tampoc innocent (potser inconscient en certs casos) però fàcil de detectar i de descriure. El cas del l’eliminació del celtibèric en la codificació seria un símptoma menor, un altra seria l’abandó de la nomenclatura original d’aquestes llengües, que les diferenciava per origen segons els clàssics (tartessi, ibèric, celtibèric, -l’ibèric meridional va ser detectat modernament-) per una denominació ‘ibèrica’ unificadora (nord/sud/oest),  també ho és la insistència en una localització estrictament peninsular (ignorant les evidències al nord del Pirineus!),  però potser on es mostra més clarament és en la temàtica dels orígens d’aquestes escriptures.

Comencem per l’anacronisme garrafal, i no per això menys repetit, de parlar de ‘llengües hispàniques’ per referir-se a realitats preromanes (com si Hispània no fos un terme romà!). Potser a mitjans del segle XX, quan es formà la teoria que considera el tartessi com l’escriptura mare de la resta d’escriptures preromanes peninsulars, en un context polític de dictadura franquista, es podria excusar que els erudits autors d’aquesta teoria, i que són els mateixos que fonamentaren el desxiframent actual, parlessin repetidament de ‘lenguas hispánicas’ i projectessin una unitat patriòtica espanyola ideal al passat més reculat en un pan-hispanisme/iberisme peninsular nascut en el sud-oest en el primer terç del primer mil·lenni abans de Crist. Eren els signes dels temps, certament. La teoria de l’origen africà del ibers també havia estat defensada entre altres per l’arqueòleg germànic Adolf Schulten (un enamorat de Tarragona, només cal llegir els seus treballs), i resultava plenament coincident amb els plantejaments d’un dels pares de la filologia ibèrica com Manuel Gómez-Moreno[1]. Però tal ideologia continua viva encara en els nostres dies, molt especialment en la forma del que avui en dia en diem nacionalisme banal, sols cal comprovar quanta gent, amb estudis, no pas analfabets, confonen el sentit de: península ibèrica i Espanya. No és gratuït, és induït.

L’apropiació interessada de conceptes del passat per part de la política és gairebé una constant. En aquesta cas, es vol confondre el terme administratiu[2] Hispania aplicat a la península de l’extrem occidental d’Europa per els romans com el solar nadiu i ancestral d’una unitat política mai existent en la història coneguda[3] i s’ignora convenientment la descripció prèvia dels grecs que segles abans (s. VI aC) localitzaren els ibers en la costa a l’oest del Roine i que posteriorment, quan s’aprecià que l’occident europeu tenia forma de península, la qualificaren com ‘ibèrica’, en relació probablement al poble que amb el que hi tenien més tracte, els ibers, sense que per això es parlés de cap unitat amb la resta de pobles riberencs coneguts per ells: els turdetans o tartessis en la zona de l’estret i els celtes en les costes atlàntiques, com a mínim fins les illes britàniques.

Certament, hem de pensar que els filòlegs actuals són contraris a aquesta mena de manipulacions barroeres del passat, i que basen les seves conclusions en evidències científiques. El problema sembla ser que en el tractament dels aspectes històrics, fan aigües i sovint es defensen posicions metodològicament insostenibles. Un exemple concret: en una de les obres de referència on es defensa la filiació a partir del tartessi, es considera que l’ibèric meridional, amb clars punts de contacte tant amb el tartessi com amb l’ibèric nord-oriental, ha de ser anterior al nord-oriental. El petit detall que l’evidència no ho corrobora, és ignorat, i a l’hora de datar l’ibèric meridional, es fa servir l’evidència més reculada del nord-oriental per afirmar que és anterior a tal data! Un raonament plenament circular. Es parteix d’una suposada derivació del tartessi, i com que el nord-oriental és demostrablement anterior al sud-oriental, aquest ha de ser encara més reculat, sense cap evidència[4]! Quelcom semblant tenim en les lectures ahistòriques i essencialistes que miren de minimitzar el pes de les influències exteriors i afavorir per contra una mirada localista, autòctona. Un exemple palmari seria les malinterpretacions que en aquestes obres de referència sobre paleofilologia ibèrica es fan dels testimonis de l’origen dels ibers segons els clàssics, on s’arriba a escriure que en Varró digué que els ibers eren autòctons, quan de fet, diu el exactament el contrari, els esmenta com la ocupació mes reculada, seguida per els perses,  fenicis, celtes i púnics abans dels romans[5]. Sembla ben be allò de no deixar que els fets esguerrin una bonica teoria!

Si hom però obre el focus, i contempla el conjunt, tal hipòtesi unitària resulta, a més, completament espúria. Cap clàssic parla de cap unitat. Tartessos i Ibèria són dues realitats fàcilment discernibles en la mirada històrica (completada per una Cèltica en les llunyanes costes oceàniques), i la teoria d’una una suposada difusió per via terrestre de l’escriptura tartèssia, per donar lloc presumptament a l’ibèric sud-oriental i d’aquest al seu torn al nord-oriental, no té cap mena de lògica si recordem que els contactes marítims són la norma (més en contexts tan propers, tota vegada que viatjar per aigua és molt més eficaç que fer-ho per terra[6]). La realitat acostuma a tenir un grau superior de complexitat.

Ara, ho diuen en va doncs, això de la unitat de les escriptures preromanes? Doncs no, de cap manera, ho diuen bàsicament per raons filològiques. Mirem d’explicar la posició actualment difosa.

Tal i com es resumeix en les propostes de codificació Unicode, del tartessi, tenim un centenar d’inscripcions datades entre els segle VII-IV aC, de l’ibèric nord-oriental més de dos mil que oscil·len entre el segle VaC-IdC, de l’ibèric sud-oriental una setantena d’exemples entre els segle IV-I aC i del celtibèric dues-centes inscripcions fetes entre els segles IIIaC-IdC. L’escriptura més antiga és doncs la tartèssia, propera a la posterior i veïna sud-oriental, amb la que comparteix una dependència clara dels signaris semítics (hi ha un signari ‘intermedi[7]‘ que presenta grups de signes contigus en el mateix ordre que els signaris orientals (que són molt anteriors). En l’ibèric nord-oriental els signaris que s’han trobat, són molt diferents i no mostren aquesta dependència (tampoc és que mostrin un model alternatiu, ja que les evidències fins ara trobades, encara que sí comparteixen algunes seqüències  de signes[8], difereixen entre sí).

Si el tartessi i el nord-oriental són tant diferents però propers en el temps, perquè es diu que són derivats? Doncs perquè tots ells comparteixen un tret comú: el fet de ser semisil·làbics (per les labials, dentals i velars). Així, es suposa que fou l’adaptació d’un signari eminentment consonàntic com és el semític a una parla amb menys consonants la que generà aquests signes sil·làbics[9]. El problema d’aquesta hipòtesi és que en els signaris ibèrics, que no en el tartessi, es detecta que inicialment s’emprà un sistema semisil·làbic dual que diferenciava gràficament entre sons forts/dèbils (G/K,D/T) i que posteriorment es simplificà. O sigui que si disposem temporalment els fets, tindríem un signari semisil·làbic no dual al segle VII en zona tartèssia, un de dual dos segles més tard en les nostres terres, i quelcom semblant dos cents anys més tard en la part est de l’actual Andalusia (i és de remarcar, en el sentit de mostra de voluntat de diferenciació social, que sembla ser que tot i compartir l’existència de signes duals, la interpretació só fort/so dèbil, era inversa, i el que al nord indicava só fort al sud indicava só dèbil i viceversa[10]). Un altre element que complica, si més no aparentment, el panorama, és que els glifs d’aquests sons semisil·làbics són parcialment diferents entre l’ibèric nord-oriental i el tartessi (comparant les codificacions tenim que entre els signes identificats, difereixen: bi,ke,ki,te,ti,to, i coincideixen únicament: ka,ko,ta,tu), i per tant, mal es pot defensar un pas global d’una banda a una altra, de l’extrem sud de la península als Pirineus orientals, en qüestió de 200 anys (i amb la dificultat afegida que no es detecta una fase formativa en l’ibèric nord-oriental, que apareix ja de vell antuvi amb la seva màxima complexitat).

cod-iberic-dual

La proposta de codificació per a UNICODE de l’ibèric nord-oriental.

Però el que resulta més cridaner a un ignorant, potser sigui el poc paper que es dóna a la possibilitat d’una transmissió per l’altra gran grup cultural mediterrani preromà, el d’origen greco-minoic, especialment, si recordem que un dels fundadors de la teoria ‘pan-ibèrica’, en Gòmez-Moreno, bé que identificava el paral·lelisme amb aquelles escriptures. I especialment rellevant per el que aquí estem parlant, entre aquests glifs de sons sil·làbics que segons dèiem, la teoria actual vol que s’haguessin generat en una adaptació a Tartessos d’un signari semític consonàntic. Gràficament:

minoic-silab-1

De: Gómez-Moreno, Manuel : 1949 : “La escritura ibérica y su lenguaje” : Misceláneas. Historia, arte, arqueología, (dispersa, emendata, addita, inedita). Primera serie, La Antigüedad : p.257-281

Com es pot veure, casi tots els signes sil·làbics nord-orientals tenen paral·lels (tret dels  de ba, be i do/to) en signes qualificats l’any 1949 per en Gomez-Moreno de ‘minoics’.

No seria més senzilla una hipòtesi combinada? Una influencia ‘semita’ al sud, al segle VII i una altra ‘minoica’ al nord al segle V? No seria pas l’únic cas conegut d’escriptura semisil·làbica apareguda en aquest marc temporal, a Persia, per exemple, tenim al segle VI aC la creació d’una variant del cuneïforme. Les fonts del primer mil·lenni abans de Crist són molt limitades però no són nul·les, i per tant, no es pot ignorar l’aportació de la Història en aquests afers.

No cal multiplicar aquí les especulacions, el que es vol remarcar, es que cal obrir la mirada i tractar tant els temes històrics com els filològics amb el rigor necessari, fugint d’apriorismes i essencialismes. Segur que els amants de Clio cometem innumerables aberracions filològiques, però si no mirem de corregir-nos, mai no millorarem. Aquest és l’esperit darrera aquests comentaris.

Portem l’atreviment un pas més enllà, i encarem l’altra part d’aquest apunt tornant al tema de la variabilitat sígnica de l’ibèric nord-oriental.

Variants de l’ibèric nord-oriental.

En el resum del mes passat, ens preguntàvem com s’ho haurien pogut fer els autors de la proposta de codificació per a Unicode, per dir que havien triat els glifs més habituals per a cada so, per fer la proposta. Els únics corpus publicats amb aquesta informació són el de ibers.cat, i el de cathalaunia, derivat seu, aixi que calia confirmar si potser els autors disposaven d’un corpus similar no publicat. La resposta va ser que encara no, però que s’espera que el projecte Hesperia, incorpori aquesta informació en els anys vinents. Així doncs, l’estimació havia estat feta a partir de dades parcials. Resultava trivial recomptar els glifs en el corpus de cathalaunia, i comparar-ho amb els resultats de la proposta Unicode, i d’això parlarem tot seguit. Però cal primer fer una petita explicació sobre la variabilitat sígnica dels testimonis de l’ibèric nord-oriental.

Tot i que sí tenim alguns exemples d’epigrafia sumptuosa i de qualitat, la gran massa d’exemples epigràfics són marques fetes manualment, sovint de poca qualitat, i que en una mirada inexperta semblen més gargots que no pas lletres. Hi ha doncs una feina feta per els filòlegs i epigrafistes per agrupar tots aquest testimonis en uns conjunts de símbols més o menys coherents. Na Carme Huertas, els simplificava en cent trenta i pocs glifs, Untermann abans ho havia fet en 95. La diferència, a grosso modo s’explica perquè la barrera, la diferenciació, entre un glif i un altre és en part subjectiva; un exemple: un dels signes per la ‘u’ és una fletxa que apunta cap amunt; en alguns casos la barra vertical no arriba a tocar la punta, i donat que hi han altres signes en el quals el detecta quelcom semblant, es fa difícil discernir entre una variació intencionada o una de casual, i per tant, segons la voluntat de l’expert hi veurà un o dos signes.

Sabem que l’escriptura de l’ibèric presenta senyals d’una certa sistematització sígnica; els signes duals afegeixen una barra vertical al signe base. En aquest sentit, un altra senyal que no he trobat reflectida en la literatura és la diferenciació entre tenir o no un traç vertical llarg. El trobem entre molts signes: entre ‘a’s amb forma de P o D, entre ‘i’s i ‘n’s curtes o llarges (de fet les ‘i’s i les ‘n’s sols es diferencien estructuralment en què les primeres afegeixen un traç vertical petit en la  part superior), entre les ‘m’s en forma de V o Y, entre les ‘r’s amb forma de P i D especulars, i també entre glifs de sons diferents: entre ‘r’s i ‘gu’s amb forma de rombe/rodona, i especialment entre els sons ‘to’ i ‘ti’, que es diferencien únicament en tenir o no un traç vertical a sota (i en aquest cas, fins i tot es detectava la mateix distinció en les formes de tres puntes, entreamb  una base horitzontal o una puntual).

En la detecció de co-aparicions de glifs al·lògrafs que es va presentar en aquest bloc, es postulava una forquilla entre 85 i 96 glifs diferents. Veient que eren unes xifres properes a la de Untermann però molt diferents de la dels experts, es va demanar el seu parer, per si s’estava cometent algun error sistèmic que permetés explicar tal discrepància. Les respostes, que no puc sinó agraîr públicament, van ser variades, però la més interessant i detallada es podia resumir en una paraula: incredulitat.

Els filòlegs han re-construit penosament el só de l’escriptura ibèrica, el desxiframent que dèiem, i basen sobre aquest esquema sonor (sil·làbics dobles+consonants+vocals dobles[11]), la seva representació amb un únic glif per so. El problema com hem anat repetint, creiem que rau en què no han estat sistemàticament exposats a la variabilitat sígnica en tot aquest procés de desxiframent, i ara, el concepte que aquests 49 sons puguin tenir una representació amb un centenar de glifs, els resulta estrany, potser difícil de conceptualitzar[12]. Des de aquesta posició, és fàcil entendre els possibles errors sistèmics al recompte de co-aparicions que van enumerar. Els comentem un a un.

  1. En primer lloc, el fet que el corpus és el resultat de molts segles d’escriptura, i que per tant, no es podia analitzar conjuntament. La resposta és fàcil. Encara que és evident que les epigrafies s’estenen en un període de segles, les co-aparicions en un mateix text són per definició simultànies. Com a molt, es podria plantejar la creació d’un mapa cronològic de co-variants d’un glif, i cercar patrons d’ús (una tasca no pas fàcil, atesa la pobre fiabilitat de les datacions i localitzacions de moltes de les peces).
  2. La segona estaria en part lligada amb la primera, i vindria a dir que encara que és cert que si trobem A+A’ juntes, això indica que són signes diferents, si a part trobem A+ A”, això no indica que A” tingui que ser un tercer signe (podria ser una A’ que ha mutat de forma, per exemple). El problema amb aquest argument, és metodològic. Si dic que A+A’ indica diferència, a sant de què no puc dir que A+A” no ho fa? En altres paraules, viola la llei de l’explicació més simple. Es buida de valor? Tampoc, però caldria donar una raó a una tal violació del mètode en cada cas per poder-la acceptar, i en això tornaríem al mapa cronològic de co-aparicions que dèiem abans com a pas previ per poder plantejar la possibilitat que el signe A’ hagués mutat en el signe A” en un moment i context determinat. Sense això, si trobem A+A’ i A+A”, el més lògic és pensar que estem davant de tres signes: A, A’ i A”.
  3. El tercer ja era més tautològic. Els corpus tenia molts errors i per això es detectaven co-aparicions on no hi són. Afirmació que seria de gran valor si el que l’emet l’acompanyés del corpus ‘correcte’ i la seva comparativa corresponent. A falta de les proves, en ciència, evidentment no es pot tenir en consideració de cap mena de manera una tal afirmació. I és que sembla talment que l’evidència presentada no ha estat convenientment considerada. En un total aproximat de 3.000 epigrafies i – com veurem tot seguit – 24.000 símbols, es detectem a prop d’un miler de co-aparicions repartides en 381 epigrafies, amb desenes d’elles, presentant-ne no una ni dues, sinó entre cinc i quinze (només s’ha de repassar l’apèndix A de l’article)! Gràficament:
    geu-7

    Nombre de co-aparicions vs. nombre d’epigrafies.

    La probabilitat que una distribució tal es pugui deure a errors de transcripció més o menys aleatoris és ínfima, residual
    Altra cosa és que el tema de la correcció del corpus és certament de màxima importància. El gruix del contingut actual és hereu del corpus de ibers.cat com dèiem, i l’única manera d’evidenciar la seva correcció, crec que passa per incorporar en el màxim nombre d’entrades (a ser possible, totes) l’esquema o dibuix de les epigrafies originals (les fotos sovint resulten menys entenedores que els dibuixos). A tal fi, s’ha posat en marxa la recollida i preparació d’aquests nous continguts. De fet, crec que l’establiment d’un corpus reconegut entre els especialistes que contempli les variants hauria de ser un pas previ imprescindible en l’estudi de l’escriptura ibèrica. Que consti que la predisposició en aquest sentit és absolutament oberta per part de cathalaunia.

Tenint en compte aquestes consideracions doncs, per el moment, res obliga a replantejar sistèmicament el treball de detecció de co-aparicions[13] fet.  Potser els filòlegs tenen dificultats per explicar la pluralitat de glifs emprat conjuntament per un suposat mateix só, però això en cap cas hauria de dur a negar l’evidència i fer veure que no hi és. Sembla evident que actualment manca una explicació raonable per explicar la variabilitat sígnica de l’ibèric nord-oriental (una raó de fons, que sembla de pes, per apel·lar a la prudència abans de donar per bones les codificacions actuals per a Unicode).

Un cop vist el tema de la varietat formal de l’ibèric, passem al seu recompte, i en certa manera, a anar a l’inrevés, a agrupar més i més els signes.

Recomptes i comparacions

El corpus de cathalaunia en el moment de fer aquest apunt presenta 3.246 entrades (un mateix objecte pot tenir vàries entrades, com per exemple, un plom amb dues cares escrites) que conformen un conjunt d’uns 30.000 signes, format per un signari de 134 símbols. Total, que es redueix a 24.048 signes si ignorem espais, puntuacions i altres marques i es fixem només en els fonètics (terrible pensar que tot el que queda d’una escriptura que vam emprar durant mig mil·lenni és com a molt una dotzena de pàgines escrites!). Presentem gràficament les freqüències de cada glif:

codes-sort

Les freqüències del corpus ibèric de cathalaunia amb 3.246 entrades.

Els dos primers signes, els més freqüents, necessiten d’una mínima explicació. El primer, el de forma de quadrat, indica en la codificació de cathalaunia un glif il·legible i també codifica una discontinuïtat en el suport, per això és tant freqüent. El segon, una barra vertical, que sí és un signe ibèric, té un surplus d’aparicions ja que s’emprava numèricament per indicar unitats; un recompte aproximat en detecta uns 300 en aquesta modalitat, de forma que podem recomptar-ne aproximadament uns 1.200 en ús fonètic.

Si els promotors de la proposta Unicode haguessin triat les variants més freqüents, les hauríem de poder localitzar en la part alta del gràfic, però no és completament aixi, les marcarem en blau:

codes-sort-unicode

Els glifs de la proposta per a Unicode per el signari dual, marcats en blau.

Gràfic que també requereix d’algun comentari. En primer lloc, hi han signes que són poc freqüents, i que per tant no poden estar en cap cas en la part alta de la taula. En segon, cert és que en la proposta per a Unicode es marquen altres variants (per el signari no dual[14]) que cobreixen algunes de les manques principals, però el problema està en que no tenen codis diferenciats, i per tant no els podem marcar conjuntament amb els del dual en aquest recull. És exactament això el que volem posar de manifest, que la reducció a 49 signes és excessivament dràstica. Sense ser un expert en cap cas, sí que puc dir que després de la feina feta en el corpus del web aquests darrers anys, em resulta inimaginable reproduir les epigrafies ibèriques sense glifs tan bàsics, com el de forma de V per les ‘m’s, el que sembla una S per ‘s’s, el rombe per ‘r’s o el que sembla una R per certes ‘a’s.

Però com que els glifs s’agrupen per sons, podem veure’n també les seves freqüències (per simplificar ho fem emprant les agrupacions del signari simplificat de cathalaunia, que no diferencia entre els sil·làbics forts o febles i que agrupa les vocals en els cinc sons habituals).

simpfreqlist

Les freqüències dels sons segons les agrupacions del signari simplificat de cathalaunia.
I la reducció posterior a 5 vocals i 7 consonants.

I en la part dreta, tenim el recompte, reduint el conjunt a només dotze categories bàsiques (5 vocals i 7 consonants), com si haguéssim repassat les transcripcions a lletres llatines que usualment es fan i agrupéssim convenientment les consonants i vocals. Aquest total lògicament varia ja que els sil·làbics es compten dues vegades (per la vocal i la consonant que els formen).

  • A       4.893
  • I        3.995
  • E       3.317
  • D/T  2.985
  • C/G  2.790
  • R       2.565
  • S        2.393
  • N/M  2.311
  • B        2.184
  • U        1.701
  • O        1.466
  • L        1.339

Una distribució que certament necessitaria d’un filòleg per comentar-la. Peró arribats en aquest punt, va semblar que seria relativament fàcil comparar aquestes freqüències amb altres idiomes moderns, de manera que així s”ha fet, i el que començà com un divertimento, acabà sent inesperadament revelador…

El que es va fer va ser: agafar un mateix text (els primers cinc capítols del Gènesi) traduït en quatre idiomes diversos: català, castellà, euskera i llatí, i compara-ne les freqüències d’aquests mateixos 12 sons/lletres bàsics de cada una de les llengües amb la del corpus ibèric. Podem visualitzar la distribució de cada idioma en una gràfica, on a cada columna tenim una lletra que mesuri el percentatge que ocupa en el seu corpus (els text bíblic per aquests idiomes, i el corpus d’inscripcions en el cas de l’ibèric). Com que l’escriptura ibèrica nord-oriental és la base que estem estudiant, les columnes de la llista anterior, segueixen el seu ordenament de major (esquerra) a menor (dreta). El resultat dels cinc idiomes és:

geu-1

Les freqüències aproximades dels cinc idiomes.
L’eix vertical és el percentatge de cada lletra en el seu corpus,

I per visualitzar millor les diferències de cada lletra de cada idioma amb l’ibèric podem mostrar sols les diferències entre els percentatges (les columnes de l’ibèric estan lògicament a 0).

geu-2

Els percentatges de diferència de cada lletra de cada idioma respecte l’ibèric.
Valors positius indiquen escreix en ibèric.

I ja posats a fer, podem mesurar el grau de semblança entre aquestes distribucions. Una de les maneres més simples de comparar dos vectors, és amb l’error quadràtic mig. Que aplicat al nostre exemple, vol dir: per a cada idioma  i cada lletra, comparem la seva barra amb la barra de la lletra de la mateixa lletra en ibèric (el gràfic anterior), convertim aquesta diferència en un quadrat i en calculem la mitja de totes les lletres de l’idioma. El resultat, ordenant les llengües de més semblants (esquerra) a més diferents (dreta) a l’ibèric, és:

geu-6

Error quadràtic mig.

O el que ve a ser el mateix, si es prefereix, podem convertir aquest error quadràtic en lineal, fent-li l’arrel quadrada i així tenir una ‘diferencia percentual mitja‘ de cada llengua vs. l’ibèric:

geu-8

Error percentual mig.

Les semblances amb l’euskera (ben documentades en la literatura sobre l’escriptura de l’ibèric nord-oriental), semblen doncs existir també a nivell de freqüència d’utilització de les lletres en la seva escriptura. De mitjana te una diferència de poc més d’un 1.5% respecte l’ibèric, mentre que el català i el castellà, es situen entre el 2,5% i el 3%, amb una lleugera avantatja per el català, però el que sembla més curiós, és que la l’altra llengua antiga en aquesta comparativa, el llatí, es mostra força més allunyat de l’ibèric que els seus presumptes descendents peninsulars.

Però podem anar més enllà i emprar un estimador de correlació més complert, que tingui en compte també la covariànçia de les dades, com per exemple el coeficient de correlació de Pearson, i tindrem:

geu-3

Correlació de Pearson entre els % de cada lletra de cada idioma respecte les de l’ibèric.
1 = correlació perfecte, 0 = no correlació, -1 = correlació inversa perfecta.

I veurem que l’euskera arriba quasi bé al 0.9, seguit (a distància) per el català amb poc més d’un 0.6 i amb un castellà en la zona del 0.5 i el llatí per sota d’aquesta marca. Uns resultats clarament contraris a una distribució aleatòria en el cas de l’eusquera.

Certament és un experiment simple, una comparativa com cal hauria de basar-se possiblement en la distribució acurada dels sons de cada llengua i a partir de conjunts de dades més amplis. Però atès que en el cas de l’ibèric la relació glif-so es encara poc definida, i la mida del conjunt de dades disponible desafortunadament molt limitada, potser sí tingui la seva part de lògica el comparar, ni que sigui matusserament, les seves transcripcions.

Per això parlàvem inicialment de demostrar estadísticament la proximitat entre l’ibèric nord-oriental i l’euskera. Arribats aquí, no sembla pas impensable que en un atac estadístic, la comparació de l’ibèric nord-oriental amb l’euskera (fins i tot l’actual) pogués ajudar a definir components del primer, i potser així ajudar a entendre’n l’estructura aglutinant de la seva llengua.

Crec que només caldria finançament per fer la prova, les dades, les tenim…

Coda

A semblança del que va passar amb l’apunt sobre els caràcters de l’ibèric nord-oriental, la part final d’aquest apunt ha acabat produint un nou article: Vilaseca i Corbera, Joan : 2016 : “Una comparació entre l’ibèric nord-oriental, l’eusquera, el català, el castellà i el llatí”. Qui així ho vulgui, allà hi trobarà les dades i els detalls dels càlculs aquí comentats.


Notes



Bascoiberisme circular?

$
0
0

Tot just fa uns dies, en l’apunt anterior, es destacava que havent mesurat en un recent article les distribucions d’una reducció a 12 sons bàsics en una comparativa entre l’ibèric nord-oriental i altres llengües relacionades (tres d’actuals: eusquera, català i castellà i una antiga: el llatí), l’altíssima correlació entre l’eusquera i l’ibèric nord-oriental descartava una semblança ocasional o arbitrària.[1].  És el cas ara de tornar-hi, ja que tot fa pensar que certament la raó no és pas arbitrària, però que tampoc és la desitjada, tota vegada que lluny de poder emprar l’eusquera actual per apropar-se al ibèric nord-oriental, com s’albirava en la part final de l’apunt anterior, estem probablement davant d’un artifici induït per un error metodològic en el procés de desxiframent de l’ibèric nord-oriental. Expliquem el raonament que duu a aquesta conclusió.

L’experiment consistia en reduir les llengües a comparar a dotze sons bàsics: cinc vocals (A, E, I, O, U) i set sons consonàntics ( lateral, fricatiu, velar, nasal, dental, labial, sibilant = L, R, K, N, T, B, S). És a dir, agafar el corpus de l’ibèric nord-oriental per una banda, i un text existent en les altres llengües per l’altra (els primers 5 capítols del Gènesi) i reduir-los tots a aquestes 12 sonoritats, per el simple mètode d’agrupar convenientment els caràcters que formen l’abecedari d’aquests idiomes i recomptar-los. El que fa que pugui funcionar un procediment tan simple, és doble. Per una banda, tenim el fet que tots aquests idiomes comparteixen en gran mesura una mateixa translació lletra-so, i que per tant, un simple recompte ens acosta força a l’objectiu[2], i per l’altra, que en mesurar sols els percentatges de cada lletra/so en cada idioma, ni la diferència de contingut (Gènesi vs. texts ibèrics), ni la mida de cada corpus té un efecte especialment esbiaixant[3].

En un primer moment, l’objectiu era comparar l’ibèric amb aquestes parles, per veure quin grau de proximitat hi havia a un nivell tan bàsic com el de les freqüències relatives dels seus sons principals. Els resultats, van ser claríssims. En un estimador com el grau de correlació de Pearson (on 1 indica correlació total, 0 no correlació i -1 correlació inversa), la comparació entre l’ibèric i l’eusquera actual s’enfilava fins quasi el 0.9, mentre que amb la resta d’idiomes, baixava al 0.6 o menys.

geu-3

Grau de correlació entre l’ibèric nord-oriental i l’eusquera, el català, el castellà i el llatí.

Ara, el dubte que naixia era com valorar aquests resultats, ja que lògicament, la valoració d’un coeficient matemàtic depèn del domini que s’estigui mesurant. Si estem parlant d’objectes geomètrics o matemàtics, una correlació de 0.9 pot ser un grau baix si s’esperava identitat, per contra, en temes socials, un 0.8 usualment ja es pot considerar un valor alt, tota vegada que a priori el que s’està comparant té menys probabilitats de respondre a una relació geomètrica (que es el que de fet mesura el coeficient). En altres termes, era 0.9 un grau de correlació propi de… dialectes?  De llengües germanes? De…?

La dificultat semblava estar en trobar estudis filològics quantitatius que haguessin fet una mesura lo prou semblant com per establir algun criteri comparatiu fiable. Però la resposta estava més a prop del que s’esperava. Havent fet la comparativa d’aquestes quatre llengües amb l’ibèric nord-oriental, fer la mateixa comparativa entre totes ells, era gairebé trivial (la feina feixuga ja estava feta). De manera, que es completà la comparança, amb les parelles que no havien estat considerades en l’experiment inicial. Cinc llengües ens donen deu possibles parelles, les quatre de la gràfica anterior i sis més. Gràficament:

pearson10

Correlació de Pearson de les freqüències relatives entre l’ibèric nord-oriental, el català, l’eusquera, el castellà i el llatí reduïts a 12 sons bàsics.

Aquesta simple gràfica, d’aspecte aparentment anodí ha acabat obrint la caixa dels trons (metafòricament parlant).

Fixem-nos d’entrada tan sols en els dos valors més alts: la correlació entre ibèric-eusquera (~0.9) i entre català-castellà (~0.8). Que la correlació entre dues llengües contemporànies, veïnes i romàniques, o sigui, emparentades, sigui clarament inferior a la que hi ha entre una llengua desapareguda fa 2.000 anys i una d’actual com l’eusquera resulta pràcticament inexplicable. És que 2.000 anys han passat sense modificació per l’eusquera? Era llavors encara més semblant a l’ibèric (i en aquest cas estaríem pràcticament parlant de identitat) i sols s’han separat aquest 0.1? Sembla una casualitat astronòmica que comparant dues parles separades per dos mil·lennis (i una d’elles desapareguda des de llavors) la correlació sigui significativament  més alta que la que hi ha entre parles més properes, contemporànies, veïnes i emparentades com el català i el castellà. No té sentit.

Posem un exemple concret per mirar de visualitzar millor aquests coeficients aplicats al domini que estem tractant. Fem un experiment imaginari, suposem que el castellà fos la llengua desconeguda (escrita en glifs allunyats de les nostres lletres i sense espais entre paraules) i que en un procés de desxiframent n’hem arribat a confeccionar el seu mapa sonor (i que a més, és tal i com tots realment ho coneixem). Agafem un text curt com el del primer dia de la creació del Gènesi, i el reduïm als 12 sons bàsics de la metodologia de comparació; tindríem això:

ENELCONIENSOTETOTOTIOSKREOELKIELOILATIERRA:
LATIERRANOTENIAENTONKESBORNAALKUNATOTOERAUNNARBROBUNTOKUBIERTOTEOSKURITATIELESBIRITUTETIOSSENOBIASOBRELASAKUAS:
TIOSTIIOAIALUSIUBOLUS:
ALBERTIOSKUELALUSERABUENALASEBAROTELAOSKURITATILALLANOTIAIALAOSKURITATLALLANONOKE:
TEESTENOTOSEKONBLETOELBRINERTIA:[4]

És a dir, hauríem arribat a la conclusió que aquells signes sonaven més o menys així (recordem que representa que el castellà ens és desconegut). Algú es creu que s’hauria tardat gaire a llegir el seu contingut des del català (evidentment, ignorant que és un text de vell antuvi ben conegut per a nosaltres)? No són les semblances notòries? Doncs això es dóna entre llengües amb un coeficient de correlació de 0.8[5], quan més properes haurien de ser si fos de 0.9? Ja que això és el que es mesura entre l’ibèric nord-oriental i l’eusquera actual. És aquí que cercant l’explicació més simple,  neix una sospita ‘horribilis’.

I si aquesta proximitat excessiva és deguda a un esbiaix metodològic en el procés de desxiframent que ha primat innecessàriament els paral·lelismes amb l’eusquera?

Dit d’altra manera, la màquina, el recompte, ens dóna eusquera com a més proper a l’ibèric, per el simple fet que li hem ficat eusquera abans, en el procés de desxiframent. D’aquí el circular del títol de l’apunt, ja que estaríem davant del mateix fenomen del raonament circular on l’efecte es torna causa.  I anant al detall del cas, cal entendre que el procés de reducció a 12 sons bàsics elimina (ja que unifica) les disquisicions més modernes sobre l’escriptura ibèrica, com la diferenciació entre sil·làbics forts o fluixos, la duplicació de les vocals o el só d’alguna nasal. La semblança hauria de provenir de l’esquema bàsic, forjat – si no vaig errat – en la primera mitat del segle passat. El mapa que en Gòmez-Moreno el 1949 atribueix al sistema Delgado-Hübner, ja recull l’estructura bàsica que comporta aquest grau de correlació excessiu.

Però anem més enllà i tornem a la gràfica de la comparativa global. Si ens hi fixem, les correlacions entre les tres llengües modernes (el català, els castellà i l’eusquera) formen el gruix de la part alta de la gràfica, ja que ocupen el segon, tercer i quart lloc, mentre que les correlacions que inclouen parles antigues, el llatí o ibèric, formen les sis posicions inferiors de la gràfica. És a dir, tant el llatí com l’ibèric, difereixen més respecte les parles modernes (i entre sí), que no pas les modernes entre sí, fet que resulta lògic si pensem que el pas del temps hauria de tendir a evolucionar, i per tant, separar dels seus origen a les parles. Excepte però, en el cas de l’ibèric vs. l’eusquera actual, que no sols no està en la part baixa (com es podria esperar), sinó que és el màxim destacat de totes les correlacions possibles. Una anomalia en tota regla.

Podem mirar de plasmar-ho en un dibuix, prenent el complement de les correlacions (el que falta fins 1) com una ‘distància’ entre les llengües (al no formar una mètrica no es poden satisfer totes les longituds, de manera que no es més que una aproximació, caldrien quatre dimensions com a mínim per disposar-ho com cal).

langdist

Distància (1-correlació) entre llengües.

On veiem que el llatí està convenientment separat de les llengües modernes (en groc), però que l’ibèric, tot i estar a una distancia semblant a la del llatí respecte al català i el castellà, està però anòmalament  a prop de l’eusquera. Si pensem que la filiació ha de tendir a apropar i que la distància temporal tendeix a allunyar, podríem explicar perfectament la relació del llatí amb les altres llengües, però en el cas de l’ibèric falla en la proximitat amb l’eusquera, que faria creure més aviat que són contemporànies. I sent l’ibèric la única llengua de les cinc mesurades de la qual no coneixem de primera mà la seva sonoritat original,  no sembla difícil pensar, com dèiem, que l’anomalia neix degut a què la proposta actual ha estat modelada a partir de l’eusquera modern; el raonament circular que dèiem. Caldria confirmar si el bascoiberisme no sols ha procurat traduir l’ibèric, sinó que abans, n’ha estructurat preferencialment el seu desxiframent.

Vol dir això que el desxiframent actual està tot malament i que els nombrosos punts de contacte amb el basc són tots miratges? Doncs probablement no, però el problema més urgent, seria potser mirar d’entendre on es va torçar innecessàriament vers l’eusquera. Va ser en la definició del mapa sonor ibèric (inevitablement perdut en el temps, tret de pervivències en llengües actuals com el català o el propi eusquera)  i/o en la projecció d’aquest mapa sobre la seva variada representació sígnica?

Lamentant-ho molt, s’ha de deixar la qüestió oberta, aquí. No sabria pas dir si és que hi havien més  sons en origen (o diferents), o si es tracta sols de què la seva assignació als signes és defectuosa. El que sí potser podria ajudar a explicar aquesta anomalia estadística, és la raó del fracàs dels intents de comprensió de la llengua ibèrica a partir de la basca.

Si hi han noves s’aniran afegint al fons en forma d’actualitzacions…

 

 


Notes

  • [1] Vilaseca i Corbera, Joan : 2016 : “Una comparació entre l’ibèric nord-oriental, l’eusquera, el català, el castellà i el llatí”
  • [2] El fet de comptar lletres aïlladament sí introdueix una petita desviació en el cas de les Q, que sempre van seguides d’una U que no sempre es pronuncia, però que si es recompta. Però les quantitats són petites i es donen per igual entre les tres llengües comparades de base llatina.
  • [3] El mètode que processa un corpus textual reduint-lo a un recompte de les seves parts components, és ben conegut en estadística, encara que és més freqüent fer-ho amb paraules que no pas amb lletres (conegut usualment com bag of words). La teoria és ben simple. A mida que s va fent un recompte, les diferències en la distribució es van atenuant, de manera, que sense necessitat d’arribar a un recompte total, es pot estimar la distribució de les freqüències si s’ha arribat a un grau suficientment petit de variació. En el cas que ens ocupa, a mes, hi han límits prefixats molt clars: el corpus ibèric és el que és (uns 24.000 signes) i per tant tampoc té massa sentit exigir una correcció excessiva en el recompte de les llegues a comparar. En  aquest sentit, les traduccions dels cinc primers capítols del Gènesi varien entre els 11 i 16 mil caràcters, que per fer una estimació ha semblat suficient, ja que no serien d’esperar diferències significatives ampliant més la mostra.
  • [4]

    En el comienzo de todo, Dios creó el cielo y la tierra. La tierra no tenía entonces forma alguna; todo era un mar profundo cubierto de oscuridad, y el espíritu de Dios se movía sobre las aguas. Dios dijo:e “¡Haya luz!” Y hubo luz. Al ver Dios que la luz era buena, la separó de la oscuridad y la llamó “día”, y a la oscuridad la llamó “noche”. De este modo se completó el primer día.

    .

  • [5] De fet, la correlació entre aquest fragment i la seva versió en català és força més baixa, del 0.55 (cat=A=36,E=55,I=30,O=9,U=19,B=22,K=13,L=32,N=20,R=22,S=19,T=27 .cas=A=34,E=35,I=27,O=33,U=15,B=13,K=13,L=24,N=20,R=20,S=20,T=32).

2016-novembre a cathalaunia.org

$
0
0

Novembre ha estat un mes instructiu, molt. L’hiatus ibèric que s’obrí inesperadament farà un parell de mesos ha tornat a engolir tota l’activitat del mes. La bona nova és una millora substancial del recull d’epigrafia ibèrica en la part pública i un millor coneixement de la problemàtica de la llengua ibèrica en el vessant personal.

Aquest bloc ha tingut un parell d’entrades noves (la segona amb actualització inclosa) explicant la recerca feta sobre l’escriptura ibèrica. Si hem de resumir-ho, direm que en primer lloc es qüestionà la noció que amb 49 glifs es pogués reflectir la varietat estructural de l’escriptura ibèrica (emprant el mètode de consignar les co-aparicions de més d’una varietat dels glifs d’un mateix so en una mateixa epigrafia) tal i com es desprèn de la proposta de codificació Unicode per l’ibèric nordoriental. El resultat era que per mantenir formalment la varietat sígnica caldrien entre 85 i 96 signes diferents. Però en segon lloc, un cop aproximat el grau de variació dels signes, s’anà en sentit contrari, agrupant els sons en 12 sonoritats bàsiques (cinc vocals més set consonants) per tal d’obtenir un registre que fos compatible amb llengües properes (català, eusquera, castellà, llatí) i poder fer una comparació objectiva de les seves distribucions vers la del desxiframent actual de l’ibèric nord-oriental. Els resultats foren espatarrants i es concretaren en un nou article. En un primer moment, es constatà que la proximitat entre l’ibèric i l’eusquera s’enfila fins el 0.9 en un índex estadístic amb un màxim de 1 (el coeficient de correlació de Pearson, on 1=correlació perfecte, 0 = no correlació, -1=correlació inversa) i per tant, es podia pensar que hauria de ser possible un atac purament estadístic al problema de la traducció. Però enseguida es veié que era un factor de correlació excessiu, tota vegada que calculada amb el mateix mètode la proximitat entre el català i el castellà actuals, el coeficient era d’un 0.8 (un resultat certament alt, però lluny de la concordança total, com convé a dues parles parentes, contemporànies i veïnes), o sigui que la distribució d’aquests 12 sons bàsics del desxiframent de l’ibèric de fa 2.000 anys s’assembla més a la de l’eusquera actual que la del català a la del castellà. Un resultat impossible. De manera que donat que de totes les llengües/escriptures mesurades l’ibèric era la única de la qual la sonoritat és tan sols inferida, suposada, calia desconfiar que no fos que el procediment de desxiframent hagués introduït aquesta proximitat excessiva amb l’eusquera contemporani. I l’anàlisi històrica d’aquest procés de desxiframent (fet en la primera mitat del segle XX per en Manuel Gómez-Moreno), certifica que certament es furtà completament l’element català i amb ell, la Ibèria dels clàssics grecoromans (la cantonada nord-occidental del Mediterrani) i es primà exclusivament una visió pan-hispànica de gènesi tartèssia amb l’element basc com a arquetip ‘primigeni hispano-ibèric’ i amb una sonoritat reduïda a la intersecció entre el castellà i el basc. El context sociopolític explica perfectament la seva obra, el trist és que seixanta anys després es veu que l’academicisme de la filologia ibèrica encara està prés en una visió ahistòrica filla del nacionalisme espanyol més totalitari (es proclama encara avui en dia, per exemple la unitat de les ‘escriptures paleohispàniques’, un dels axiomes d’en Gómez-Moreno)!

En la banda negativa, estem doncs probablement davant d’un desxiframent parcialment erroni. Adversament, aquest esbiaix sistèmic ajuda a entendre com és que tot i els nombrosíssims contactes detectats entre l’eusquera i el desxiframent actual no s’ha avançat significativament en la seva comprensió i/o traducció. Sabent la causa, potser es podrà corregir convenientment el defecte.

La secció Ibèrica i Romana és la que ha rebut, lògicament, el gruix de la feina. Un dels temes que suscità l’anàlisi de la varietat sígnica de la epigrafia ibèrica nord-oriental, fou la conveniència d’assegurar la correcció dels continguts presentats. El corpus d’epigrafia ibèrica de cathalaunia.org deriva en origen del realitzat prèviament per la Carme J. Huertas i en David Folch (públicament disponible al seu web ibers.cat), que són els que realitzaren la feinada de reproduir totes les epigrafies que coneixien amb un signari convenientment proper als originals (quasi 140 glifs). El que encara no s’havia fet, és una tasca de repàs una a una de les inscripcions. I el primer problema per tal tasca, fou com mirar de fer-la verificable per tercers (per una mentalitat ‘de ciències’, dir que s’ha repassat és no dir res). En aquest sentit, la única opció que semblà tenir possibilitats fou mirar d’incorporar els dibuixos que els arqueòlegs o lingüistes fan de les inscripcions per tal d’evidenciar la proximitat entra la versió codificada i l’original ( la fotografia sovint resulta de poca utilitat per aquesta tasca). No és cap panacea, l’ambivalència de moltes epigrafies roman tot i així (els dibuixos, també varien segons l’ull de l’expert o la fase de les investigacions, els signes sovint són dubtosos o de lectura múltiple, etc, etc). La solució que es decidí fou incorporar els dibuixos rellevants de cada epigrafia enllaçant-los amb els articles d’on provenen, (una mena de bibliografia gràfica), així, tothom pot veure el grau d’adequació de la inscripció que es presenta i consultar els treballs on s’ha plasmat el seu aspecte (fins i tot en línia, si estan disponible en la xarxa, ja que la bibliografia de cathalaunia.org procura sempre incloure enllaços a edicions que siguin de lliure accés). Per no allargar la descripció, enumerem les tasques i canvis que s’han aplicat durant el mes.

  • S’ha programat el suport informàtic per afegir aquesta ‘bibliografia gràfica’.
  • S’han incorporat imatges i repassat manualment aproximadament un 40% de les epigrafies.
  • Per millorar la semblança s’han incorporat fins a 8 glifs nous, i en el procés de verificació s’ha detectat i documentat fins 32 signes que caldria encara afegir (la majoria són hàpax legòmenons, però alguns són força freqüents). És a dir, que dels ~140 glifs inicials  es preveu anar fins els ~190. I també s’han ajustat convenientment les eines de cerca en el corpus.
  • S’ha eliminat la part de ‘Codis5889-1’ de les entrades epigràfiques. En origen era per poder fer copia/enganxa si es tenia el font ibèric creat per na Carme J. Huertas, però la incorporació de nous glifs (absents en el font) en trenca la compatibilitat i s’ha preferit eliminar-la. Si cal, sempre es pot tornar a incorporar més endavant.
  • S’ha corregit un petit error que feia que en mostrar els resultats d’una cerca, si es cercava més d’un patró a l’hora i resultava que es detectaven enganxats en una mateixa epigrafia sols es remarcava el primer.

La reflexió global, d’aquesta immersió inesperada en el món de la epigrafia ibèrica, és que de nou, per una mentalitat ‘de ciències’ l’academicisme de les Humanitats sovint sembla el món al revés; és el que m’agrada conceptualitzar com: la Por a la Taula Periòdica. Si el Fons Cathalaunia i amb ell, el web cathalaunia.org nasqué de comprovar que coses tan simples com un llistat dels documents originals on figuren els nostres prohoms altmedievals no existia (pitjor encara, no existia, ni existeix hores d’ara, ni tant sols una llista unificada de tots els documents coneguts – tret de la que es va confeccionant al Fons Cathalaunia, s’entén-!), amb l’epigrafia ibèrica passa quelcom semblant. Ni tant sols hi ha una llista establerta dels glifs que empraren els nostres avantpassats per escriure (hi han reculls diversos, el més esmentat és el de Untermann, però cap de complert i estandarditzat). El mateix per les epigrafies ibèriques, orfes també de quelcom tant simple com un llistat complert de lliure accés de totes les trobades fins el dia d¡’avui (la única iniciativa a nivell espanyol és la base de dades Hesperia, però els continguts publicats són pocs, i presenta els texts desxifrats, sense la seva forma original -em consta que està previst, però sembla que va per llarg-). Tant costa entendre que la Ciència avança a base de compartir el coneixement, a base d’establir fets evidents, com per exemple, la Taula Periòdica? És a dir, evitar de totes totes la pèrdua d’esforços en reinventar una i altra vegada la roda (no confondre amb la falta de crítica sistèmica). Les Humanitats però, en dependre més del consens, semblen atrapades en absurdes guerres acadèmiques. Dit cruament: no és que no ho entenguin, és que no interessa, no surt a compte. A efectes pràctics l’interès per realitzar tasques tan bàsiques e imprescindibles com establir el corpus a estudiar, brilla per la seva absència. Prima el fer bullir l’olla, i els interessos personals o de grup dels experts. Un desespero constant per qui estima el saber.

En l’àmbit de la Bibliografia, les novetats del mes són poques i centrades també en el tema ibèric (la tasca ha estat més de revisió de continguts que no pas de lectura). El resultat és que la subsecció bibliogràfica Ibèrica i Romana s’enfila per sobre de les 800 entrades i es consolida com la segona secció bibliogràfica més ben nodrida del web (i aixo que el vessant romà encara està pràcticament absent!).

Com sempre, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.590 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

2016-desembre a cathalaunia.org

$
0
0

S’acaba desembre, un mes breu, accidentat i amb poca producció. El centre de l’activitat ha estat de nou en el món de la epigrafia ibèrica. Hi havien (i en part, encara hi han) una sèrie de serrells que calia polir.

En el corpus epigràfic ibèric, el sistema de verificació gràfica s’ha anat incorporant a més entrades, però encara hi ha més feina a fer que no pas feta. És una qüestió de temps i dedicació. També relacionat amb aquest tema ha estat la creació d’una font tipogràfica TrueType , iber.ttf  (de lliure accés) per poder escriure en ibèric en els processadors de text amb la mateixa codificació que es fa servir a cathalaunia.org (que no és sinó una ampliació de la original de na Carme J. Huertas). Encara està en proves, però en tot cas, la darrera versió estarà disponible en la pàgina de Signari ibèric del web. A falta d’una codificació Unicode hàbil (i no tornarem ara sobre aquest tema), s’ha emprat l’espai numèric propi del ISO8859-1 (de 0 a 255). El font recull els glifs originals de na Carme, més els definits en la proposta del grup LITTERA de la UB i els més de trenta que el procés de repàs i incorporació de la verificació gràfica al corpus ha propiciat fins ara.

Aquest bloc no ha tingut cap entrada nova però sí un parell d’actualitzacions també de temàtica ibèrica documentant els resultats d’algunes mesures estadístiques ampliades que s’havien demanat per verificar les comparacions que s’havien fet entre el desxiframent de l’ibèric actual i altres llengües relacionades (català, eusquera, castellà i llatí). Una primera prova va ser ampliar significativament la mida (triplicar) dels corpus a comparar en aquestes quatre llengües. Els resultats, tal i com la teoria predeia, no s’aparten apreciablement dels originals.  L’altra prova, de sentit contrari, era reduir el – ja minso – corpus ibèric ignorant les entrades formades per sigles o marques (de propietat?), amb la idea de comparar sols les fragments més textuals o discursius. Una reducció dràstica, limitant l’anàlisi a les entrades de quinze o més signes (una reducció del 50% del corpus total), revela una disposició estructuralment idèntica a la prova original amb tot el corpus. Es modulen els factors secundaris, però l’anomalia estructural detectada inicialment es manté intacta: el més semblant al desxiframent actual de l’ibèric és l’eusquera, i ho és, més que la semblança entre el català i el castellà actuals. I donat que el desxiframent és induït, i en part, suposat, cal pensar en un esbiaix sistèmic vers l’eusquera en el seu procés de definició.

En l’Alta Edat Mitjana, la feina en el Fons Cathalaunia porta dies aturada i amb documents a mig processar (i entrades a comentar en aquest bloc pendents de fa mesos). A veure si l’onada ibèrica afluixa i encarem la compleció del primer miler de documents i tornem a la ‘normalitat’.

La bibliografia nova del mes ha estat residual. Uns pocs títols s’han endut el gruix de l’atenció, i a més, no eren novetats. La pila de lectures pendents continua molt per sobre dels quatre-cents títols, i cada cop amb més llibres i menys articles. Un desastre total…

Llistem les minses incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

A fi de mes, cathalaunia.org presenta 26.611 pàgines consultables.

 

Però també s’acaba un any, el 2016, un any marcat, com no podia ser d’altra manera a Catalunya, per la Independència. Tancàvem l’any passat desitjant que l’estel de la Llibertat il·luminés als nostre electes. Un any ha passat i no estem millor.

El principal escull per la Llibertat del País continua sent la seva classe política. Aquest any hem vist com les CUP, el ‘partit antisistema’ que va ser refugi independentista en les passades eleccions plebiscitàries del 27S davant la descarada manipulació de Convergència de reserva-se la presidència a canvi de convocar-les, en comptes d’entendre el seu rol s’ha dedicat a fer de d’oposició al govern de JxS que tenia el mandat de fer la Independència en 18 mesos, fins el punt d’arribar a impedir la tramitació dels pressupostos i regalar 1.000M d”euros a les arques de la Hisenda espanyola!

Però és encara pitjor el paper de Convergència (ara PDeCAT), que després de prometre refundar-se en un partit netament independentista (sense, però, expulsar a ningú del seu si), hem vist com el MHP Carles Puigdemont i Casamajó (nombrat a dit el president de Convergència, Artur Mas i Gavarró) ha aprofitat la Diada d’aquest any per anunciar sorpresivament que es tornaria ha demanar un referèndum a Madrid! Com si no s’hagués fet solemnement un parell d’anys abans i com si no fossin precisament els seculars incompliments de l’estat espanyol els que van dur al poble català a dir ‘Adéu Espanya‘ el 2010 a rel de la sentència contra l’estatut del 2006. Des de llavors, els convergents estan mostrant la seva cara més esquizofrènica. El resultat és el seu enfonsament en les enquestes, fet però, que no els ha deturat de donar un pas enrere més i cercar la complicitat mediàtica del sector de l’esquerra que ni va voler posicionar-se sobre la independència el 27S. Davant la negativa de la CUP als pressupostos, els convergents han aprofitat l’avinentesa, no sols per fer una moció de confiança (quelcom lògic), sinó per forçar un nou intent de negociació referendària amb l’Estat espanyol abans de procedir a fer un Referèndum d’Autodeterminació de forma unilateral defensat. aquest sí, per la totalitat de forces independentistes, amb data, i aquí hi ha el detall revelador, posterior a la Diada del 2017. El que fa veure l’abast de la maniobra, és que ja mesos abans de la Diada d’aquest any, els convergents es van negar sistemàticament a qualificar-la de ‘darrera’, tot i que els divuit mesos per declarar la independència s’acabaven com a molt tard, el juliol del 2017. Estan executant el seu pla.

I així tanquem un any on els polítics ‘independentistes’ afins als cercles econòmics estan ignorant descaradament el mandat democràtic del ‘vot de la teva vida‘ cercant un acord amb l’estat espanyol abans de la Independència que tothom sap falsari. No seria la primera vegada que les elits econòmiques catalanes (els ‘botiflers‘) traeixen les ànsies de Llibertat dels catalans. Ja se sap, les elits econòmiques són tradicionalment els col·laboradors necessaris (i sovint entusiastes) en el sotmetiment al poder forà.

En la banda positiva, però, es manté el compromís de totes les forces independentistes per celebrar un referèndum vinculant i fer valdre la legitimitat catalana (o declarar directament la Independència si l’estat espanyol impedís el funcionament de les institucions catalanes).

Aquest 2017 hem de veure-ho, així que pensant que la realitat està sempre un pas per endavant de les anàlisis, deixeu-me tancar l’any amb un brindis explícit.

Que el 2017 declarem, per fi,
la República Catalana!

Salut!

 

 

 


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

L’alou de Santa Maria de Riudaura l’any 850.

$
0
0

Aquest apunt arriba amb més de mig any de retràs i encara bo, ja que es podria endarrerir força més si es volgués tractar amb un mínim de fonament les moltes derivades que la seva temàtica planteja, però les ganes de tornar a parlar sobre l’alta edat mitjana catalana han pogut més que l’insaciable desig de completesa.

L’alou de Santa Maria de Riudaura serà objecte de disputa en els segles X i XI i donarà lloc a un conjunt de documents manipulats que genèricament podem denominar com els falsos de Riudaura, tema apassionant, però que no tractarem en profunditat aquí, tota vegada que fer-ho requereix tenir un coneixement cabal dels contexts en els que tingueren lloc els fets i el que això escriu no els té pas. Sí podem, però, fer un breu resum de situació i apuntar algunes consideracions derivades de l’anàlisi de dos dels seus documents que estan interrelacionats i que sí han estat incorporats ja en el Fons Cathalaunia:  la consagració de l’any 850 i uns regests d’una altra consagració presumptament feta l’any 950[1].

Si hem d’esquematitzar la posició actual, diríem que segons la lletra, Santa Maria de Riudaura es consagrà en un primer moment l’any 850, en la generació dels pares del Pilós. Ja entrat el segle X, el matrimoni comtal Sunyer I de Barcelona i Riquila hi feren reformes i cediren l’alou al llunyà monestir de la Grassa, casa de la seva predilecció on representa que hi morirà el propi Sunyer (la majoria de la documentació a: Magnou-Nortier, Elisabeth + Magnou, Anne-Marie : 1996 : “Recueil des chartes de l’abbaye de la Grasse”). Cessió de la qual tenim varis documents de donació comtal i que es veu confirmada en el testament de la seva muller; texts que van del 936 al 954 i que també han estat qualificats de sospitosos[2]. Serà per fi en el segle XI quan la disputa per el seu control esclatarà obertament, moment en el qual es suposa que es confeccionaren/alteraren la majoria de documents relacionats (si és que no s’havia fet abans). De fet, els dos documents que comentarem han estat considerats fins i tot invencions del monestir[3], de manera que la consagració inicial podria no ser el 850 sinó en algun moment desconegut anterior a la mort de Sunyer. Posició no pas sense fonament ja que certament els documents mostren signes d’alteració, però és precisament d’això que parlarem, ja que a semblança del que hem comentat en aquest bloc sobre l’herència de Radulf a Ripoll i d’Emma a Sant Joan de les Abadesses, el que expliquen els documents no pot ser rebutjat sense més per poder haver estat manipulats en algun moment posterior als fets, tota vegada que mostren una disposició coherent tant en el plantejament general com en els detalls. En el cas de Riudaura creiem que passa quelcom similar, però és un exemple més complicat i cal desfer primer un bon grapat de nusos. Entrem al detall.

Riudaura 850

Per començar, el document de la consagració de l’any 850, tardaner, incomplet i amb clars anacronismes (per exemple, una formulació similar a la consagració de Santa Maria de Ripoll del 977[4]), presenta un comte i marquès Guifré, que havia estat identificat tradicionalment com el Guifré d’Arrià de la Gesta Comitis Barchinonensium[5], el pare biològic del Pilós, de manera que les incoherències del text han estat llargament comentades i analitzades per els contraris al que diu la GCB, que formen des de fa temps el gruix de la historiografia acadèmica. No entrarem aquí en el tema de la paternitat del Pilós tota vegada que es mereix un apunt propi, però si avençar que es poden reconciliar les dues versions existents, l’actual i la tradicional, sense masses dificultats (tret de les derivades de la inèrcia acadèmica a l’hora de construir el consens, però aquestes, són evidentment rèmores extrahistoriogràfiques). El fet, és que sí tenim documentació d’un comte Guifré a Girona en la generació dels pares del Pilós[6] i si recordem que la titulació de marquès es multiplicarà en els segles X i XI a casa nostra,  el comte i marquès Guifré del text, podria ser índex del moment d’una refacció posterior del text (per exemple, en temps del propi Sunyer, aquesta doble qualificació és molt freqüent).

L’altra gran dificultat està en l’altre protagonista, un bisbe de Girona Soniofredus, i va relacionada amb la datació del document, l’única part de l’escatocol que ens ha arribat, i que diu:

Perhacta sunt enim haec anno Incarnationis dominicae DCCCL. , VIII. kalendas octobris , anno XI. regnante Karulo , gloriosissimo rege.

Com que el VIII tant es pot entendre com referit a les kalendas o a l’any de l’Encarnació, tradicionalment el document ha estat datat en el 858. Any que d’entrada no s’avé amb l’onzè de Carles i en que qual sabem segur que no pogué existir un bisbe Soniofredus[7] ja que tenim a Elies a partir del 853, seguit de Teuter l’any 870 i el que és més definitiu, un document de finals del s. IX que explicita que Teuter succeí a Elies. De manera que un Soniofredus a l’any 858 ha estat llegit per els que consideren el document com una falsificació completa com una mostra més de la inventiva dels de La Grassa, al igual que el marquès Guifré (i no els hi falten indicis, cal recordar que Seniofred és un nom molt conegut del monestir, sense anar més lluny, l’abat homònim de la generació del Pilós). De fet, fins i tot es pot donar raó d’aquest onzè de Carles en un any 858, com fruit de la utilització de la cronologia de Gotmar (escrita a mitats del s.X) que sí presenta un rei Carles a partir de l’any 848, i sumar-ho als paral·lelismes amb la consagració del 977.

Però també és evident que aquesta lectura es pot obviar si recordem que l’any onzè de Carles el Calb sí correspongué efectivament al 850, i que per tant, el VIII es pot referir al dia i no a l’any. I de retruc tenim que un bisbe de Girona Soniofredus a l’any 850 ja no és tan fàcil de rebutjar ja que la darrera menció del bisbe Gotmar és a inicis d’aquest mateix any i la primera d’Elies no serà fins el 853. Cal recordar a més, que el context de l’any 850 és extremadament volàtil, ja que s’està en la part final de la revolta de Guillem, el fill de Bernat de Septimània, que segons el contemporani Sant Eulogi tenia revoltada tota la Gòtia.

wikipedia-800px-riudaura_01_catalonia

El monestir de Santa Maria de Riudaura avui en dia.
Imatge de wikipedia.org

Un tercer element que es pot intentar examinar, en aquest cas, prosopogràficament, són la resta de figurants del document. El text manca d’escatocol i la seva habitual corrua de signants, però sí esmenta a sis religiosos al costat del bisbe: dos arxiprestes, Giscafredus i Adalardus, i quatre sacerdots, Persinetus, Argibadus, Durandus i Rodegarius. Desafortunadament, el bisbat de Girona del 850 és un context molt poc documentat (no serà fins el darrer terç del segle que començarem a tenir un volum significatiu de documents), i per si fos poc, a més, aquests documents encara no han estat processats en el Fons, de manera que la verificació prosopogràfica, només s’ha pogut fer per ara respecte a documents posteriors. Tot i així, el resultat és força interessant. Dels sis, en tenim cinc que tenen homònims i amb titulació semblant en l’acta d’entronització feta cinquanta-vuit anys més tard del bisbe de Girona Wigo, un document on hi trobem la flor i nata del bisbat a inicis del s. X i amb més de mig centenar de signants. Allà hi podem trobar entre ells, un arxipreste Giscafredus i uns preveres Perasicius, Argibadus, Durandus i Rodegarius; gent no pas indocumentada, ans bé que podem localitzar en altres documents del bisbat a inicis del segle X. Però estem parlant de l’any 850, i per tant, no és concebible que es tracti dels mateixos individus, de manera que si volem pensar en un text inventat, els documents del bisbat d’inics del segle X serien una possible font. Ara, en sentit contrari també podem enumerar una sèrie de consideracions. En primer lloc, que la correspondència no és completa, sols aproximada. En segon, que són noms bastant freqüents. En tercer, que tampoc es pot descartar una certa recurrència onomàstica pròpia del context, ja sigui per tradicions familiars o de la casa. I finalment, que fins no haver processat la minsa documentació del context i poder verificar qui apareix o no en el bisbat de Girona aquells anys no es pot descartar que es tractin de coincidències. Ara, com indici de falsificació no pot ser ignorat, com els anacronismes evidents i les proximitats terminològiques i de formulació amb documents de finals del s. X.

Però queda un element més per examinar i és precisament en aquest que trobarem els elements que fan pensar que tot i les més que possible refaccions, el que expliquen els texts té la seva part de veritat. Parlem de l’alou de Santa Maria i de com s’incardina amb el de Sant Joan de les Abadesses.

L’alou

La vall de Riudaura i la de Vallfogona, formen part d’un mateix plegament geològic que va en sentit est-oest que es veu ortogonalment partit per la serra de Santa Magdalena en el vessant sud i amb el coll de Canes com a punt de separació. A l’est, la vall de Riudaura, ens portarà fins la part nord de la Vall d’en Bas, mentre que a l’oest, la vall de Vallfogona corre a l’oest en direcció a Ripoll, però es veurà tancada abans d’arribar-hi i es desviarà cap al sud per anar a desaiguar al Ter a l’alçada del Cap de la Fogonella. En comentar en aquest bloc els documentes de la fundació del monestir de la Sant Joan de les Abadesses, donàvem en nota la delimitació del seu alou i un petit gràfic:

Et donamus ibidem terra nostra quod ibidem habemus , sicut dividet de oriente parte usque in terminio Bisuldunense , de australi vero parte jungit in serra Valle Facunda , de occiduo autem annititur in serra Arzamala vel in via publica que discurrit , de circi namque in flumen Tezere

sant-joan-abadessses-ter

L’alou de Sant Joan de les Abadesses l’any 887.En blanc les terres inicials del monestir.

Un alou en el comtat d’Osona delimitat per l’est de forma genèrica amb el terminio Bisuldunense i en el sud per la pròpia Valle Facunda. L’alou de Riudaura es descriu in comitatu Bisuldunense vel Ausonense, i efectivament veurem que limitarà per el nord-oest amb el terme de Sant Joan, mentre que per el sud-est anirà fins la Vall d’en Bas. El text en dóna les finques posades sota la jurisdicció del la casa així com la descripció del perímetre de l’alou. Diu el text:

villulis & villaribus quorum nomina sunt haec : Riodazarii , Crosaunas , Artigas , Bacholardario , Cuguciago , Felgars , Tarnadela , Abíetem , Galindono , Vilareto , Collo Iuvino , villare Aliario , in Bisuldunense territorio nostro. Sic concedimus praelibatae ecclesiae cimíterium in circuitu ecclesiam dex[…] XXX. Nam & domnus comes Vifredus nostro assensu donat eidem ecclesiae ecclesiam Sanctae Margaritae cum decimis & prímitiis de villulis & villaribus ad ipsa ecclesiam pertinentibus cum terminis & aiacentii ssuis. Et ego supramemoratus comes dono eidem ecclesiae supramemoratae in valle Riodazari ,iuxta ipsam ecclesiam , domos meos cum terras & vineas , cum omnibus pertinentiis , & in Collo Iuvino terras & vineas quos in dominicum teneo cum terminis & aiacentiis suis. Et habent afrontationes haec omnia suprascripta : de oriente in Frarago , de meridie in terminis de ipsos Balbos per ipsa media serra , & sic pervadit per ipsa serra usque in Gurgo Nigro , & iniungit ad Aqua Bella usque supercilio montís , & pervadit in collo Frigido per ipsa serra usque in collo de Cannas & pergit ad ipsa Sentigosa ; & de circi vero parte vadit per ipso medio rio quae dicunt Bianna.

L’esment truncat a les trenta passes, és evidentment un altre clar anacronisme del segle XI (les sagreres), però més enllà d’això, posem sobre el mapa aquests topònims, ja que la majoria encara es poden reconèixer o si més no localitzar temptativament. Gràficament:

riudaura12

L’alou de Santa Maria de Riudaura l’any 850.
En blau l’aigua, al nord la riera de Bianya, al centre la riera de Vallfogona i la de Riudaura. A l’est el Fluvià.
En vermell les fites i el límit aproximat de l’alou fundacional de Santa Maria de Riudaura.
En groc les finques identificades de la dotalia del 850.

Hi ha un munt de coses a comentar ja que el procés de mirar de localitzar aquestes localitzacions va ser d’allò més interessant. Per començar, recordar lo molt hàbil que resultà el volum coral: Alcalde, Gabriel + Saña, Maria : 2009 : “Sis mil anys vivint a la vora dels aiguamolls de la vall d’en Bas”, tant per el que fa específicament al text de la consagració (amb especial menció al capítol: Folch, Cristian + Gibert. Jordi : 2009 : “Als segles IX-XI- vil·les, vilars, esglésies i castells” : Sis mil anys vivint a la vora dels aiguamolls de la vall d’en Bas : p.113-131) com al del context geogràfic. No tots els vilars s’han sabut localitzar, falten els de Cucuciago, Abiete i Galindono i altres són ben dubtosos, com el de Tarnadela i Vilareto, però tot i així, el resultat resulta força detallat. Ens estalviem parlar dels més evidents com la pròpia església de Santa Maria de Riudaura o la de Santa Margarita de Bianya cedida a la casa per el comte segons el text.

wikipedia-800px-margbianya3

Santa Margarida de Bianya en l’actualitat.
Imatge de wikipedia.org.

Per el que fa al perímetre, el límit nord sí està clar en la riera que es forma al sud de la serra de Malforat (la de Sant Ponç i la de Bianya)[8]. El límit oriental però, aquell Frarago del text, és l’altre topònim que tampoc s’ha sabut localitzar; potser es refereix al pas del Riudaura entre La Pinya i la serra de Sant Miquel del Mont a l’actual Hostal de la Corda? O potser, a la pròpia Pinya? El que sí sembla clar és que el límit de l’alou ressegueix el peu de la serralada a l’oest de la Vall d’en Bas on tenim Sant Joan dels Balbs en direcció sud fins a trobar el Gurn i pujar vers l’oest, aigües amunt on trobem certament topònims molt propers al Gurgo Nigro del text, com la Gorga blava de Gorners, fins l’Aqua Bella que per context hauria de correspondre a l’espectacular salt de Sallent. En aquest punt la línia de demarcació es torna poc definida, probablement el més senzill sigui seguir aigües amunt fins passar a l’altra banda de la serra Freixeneda per el coll de l’Home Mort per anar fins la collada de Collfred (el coll Frigido del text). Tampoc es detalla com anar a cercar la carena nord de la Serra de Santa Magdalena que és la que ens portarà al coll de Canes, però el més probable sigui salvar el desnivell per on es construirà posteriorment l’església de Santa Magdalena de Cambrils.

Arribats al coll de Canes, que és, com dèiem, on neixen les rieres de Riudaura a l’est i Vallfogona a l’oest,  estem en la part que més ens interessa avui, ja que és a partir d’aquí que el text de Riudaura es complementa amb la descripció de l’alou fundacional de Sant Joan de les Abadesses del 887 i ens permet posar sobre el mapa per on anava el terme entre Besalú i Osona en aquest sector. El text ens indica que l’alou de Riudaura, del coll de Canes anava a una Sentigosa, que correspon al coll, torre, mas i serra encara existents a l’altra banda del Puig d’Estela (passant potser per l’actual coll d’en Roca?) per d’aquí enllaçar amb el límit septentrional del perímetre, la Riera de Sant Ponç/Bianya. Probablement el terminio Bisuldunense seguia per el torrent del Vedellar i d’Escamarc fins et Ter, aigües amunt de Sant Joan de les Abadesses. Gràficament:

riudaura-g5

El teminio Bisuldunense entre l’alou de Sant Joan de les Abadesses i el de Santa Maria de Riudaura.
En blanc les terres de Sant Joan, en marró les de Riudaura, i en vermell el traçat proposat del límit entre Besalú i Osona al segle IX.

És un fragment petit del perímetre, tot just uns pocs kilòmetres, però lliga amb un pensament que em va venir al cap fa uns mesos veient l’especificitat dels mapes moderns dels comtat catalans altmedievals: quin percentatge d’aquestes delimitacions tenen cobertura documental explícita com l’exemple que estem comentant? No tinc la resposta, però no crec que sigui molt alt (són molts kilòmetres), encara que això no vol dir pas que els límits proposats no siguin correctes[9] (les alternatives sovint són reduïdes). En tot cas, aquí tenim un primer element que mostra la veridicitat de les descripcions de bens que presenta el text de la consagració de Riudaura del 850, ja que la complementarietat amb el terminus Bisuldunense dels documents de Sant Joan del 887, sense ser explicita, ja que el text de Riudaura tot i situar els bens en el comtat de Besalú mai parla específicament de la delimitació del comtat, posada sobre el mapa resulta manifesta (la situació fronterera del coll de Canes i d’aquella Sentigosa es veu corroborada per aparèixer descrits en la documentació posterior el primer a Vallfogona i la segona sota el control de Sant Joan).

Aprofitem en aquest punt per fer un comentari lateral sobre un dels topònims del text, el de Balbos (de meridie in terminis de ipsos Balbos per ipsa media serra). Un topònim recurrent en la documentació de la zona a cavall dels segles IX i X i que en la literatura de vegades s’ha reduït a una única localització. Creiem que és un error, ja que els testimonis apunten a no menys de tres Balbos diferents. El de Riudaura, és correspon clarament, com veiem, a l’actual Sant Joan dels Balbs en el marge oest de la Vall d’en Bas. Una altra menció a aïllar és la que es farà el 913 en una transacció entre dos matrimonis d’una finca in territorio transmuntano vel Hausonense , in apendicio de castro qui dicitur Ribopullo , infra fines vel agencias de villa que dicitur Balbos.  que probablement es pugui relacionar amb l’actual Baubs, al nord de Ripoll. Mentre que la resta, és a dir, el gruix de les mencions a una vila de Balbos es troben en les compres que Emma feu per el seu monestir i la situen explícitament en la vall de Vallfogona (per exemple: in locum ubi dicitur ad Valle Facunda , infra terminio de ipsa villa que nominant Balbos). Atesa la seva importància en aquells temps fundacionals però la seva aparent inexistència actual potser es podria proposar si no seria la vila de Balbos d’Emma l’origen de l’actual vila de Vallfogona? Sobre el mapa:

balbos

Els Balbos altmedievals.

L’etimologia del terme, que sovint acostuma a ser una ajuda en la identificació toponímica, en aquest cas, resultava inconcloent. El català Balb, del llatí balbus, tartamut, resulta de difícil interpretació si estem parlant d’orografia i altres possibilitats eren encara més rebuscades. Finalment, el Du Cange aporta la que potser en aquest cas sigui la millor interpretació de balbus: “Agger, quo aliquid defenditur et munitur.”, el que avui en dia en diríem un post, un sentit que resulta lògic si estem parlant del segle IX  i que sí és compatible amb les tres localitzacions proposades (especialment clar en el cas de la orografia de Vallfogona i La Sala).

Però més enllà de descriure indirectament el terme Bisuldunense de l’alou de Sant Joan de les Abadesses, l’altre text a comentar, la presumpta consagració del 950, ens aportarà una dada encara més rellevant per el que fa a la historicitat del que descriuen els documents.

Riudaura 950

Si la consagració del 850, com veiem, està farcida de dificultats, la del 950 no és pas millor ja que no ens ha arribat cap versió completa del text, en tenim sols tres regests, i a més, el que expliquen no pot ser cert.

Segons sembla, el document original, fet per un sotsdiaca i escrivà anomenat Oliba, explicava que l’anno incarnationis Dominicae DCCCCL. , indictione IX. , kalendis octubris , els bisbes de Barcelona Teuderic i el de Girona Wigo, a precs del comte Sunyer, reconsagraren Riudaura sota les tres mateixes advocacions del document del 850: Santa Maria, Sant Pere i Sant Joan, en motiu d’unes ‘novo opere‘. També es recorda la consagració del bisbe Soniofredus i al comte i marquès Wifredus del document del 850 i es precisa que s’afegeixen als bens de la casa l’església de Sancti Andreae conjunta al vilar d’Aliario així com la vila de Rabacolam. El problema és que l’any 950 ni Teuderic ni Wigo eren ja bisbes; a Girona en la dècada dels 940 tenim un bisbe Gotmar i a Barcelona sabem d’un Guilarà des de finals dels 930. Ara, també és cert que Teuderic i Wigo actuaren conjuntament, de manera que la seva presència conjunta sí és un detall versemblant. Per mirar de fer bones totes les mencions, s’ha suposat modernament que a partir de la indicció IX, l’any d’aquesta segona consagració podria haver estat el 936, que és el mateix any en què representa que Sunyer cedí Riudaura al monestir de La Grassa[10]. Els nous topònims, també es poden situar sobre el mapa.

riudaura-a950

Les finques afegides al patrimoni de Santa Maria l’any 950.

La vila de Rabacolam probablement correspongui al mas de Gimferrers, situat en una plana que encara ara està rodejada per el sud i l’est per els Bacs de Rabassola. I l’església de Sancti Andreae no és altra que la de Sant Andreu del Coll[11], que com un dels regests indica va ser associada al vilar d’Aliario en temps del Guifré del 850 (Soniarius commes addidit bonis huic ecclesiae a Vifredo collatis in Villare Aliari)[12]. Recordem que la primera consagració sí esmentava conjuntament el vilar de Collo Iuvino (probablement l’actual Castell del Coll)  i el vilar d’Aliario (amb el coll de jou situat entre ells i per on passaria el camí que connectaria la vall de Riudaura amb la de Bianya, un lloc certament estratègic) però no cap església de Sant Andreu. Com que l’església existeix, si sembla clar que el vilar d’Aliario havia d’estar situat ben a prop seu (potser en la plana al costat de l’actual El Saiol, sobre l’església, en la cota 650?).

Podem pensar que en comptes del Guifré del 850, fou Sunyer el que feu construir Sant Andreu ja ben entrat el segle X, potser fins i tot dintre la seva activitat constructora en la zona que el document esmenta, aquell ‘novo opere‘, però en aquest cas, i si els documents són falsificats, per què voler situar una església en temps de Guifré si la consagració del 850 no l’esmenta? És evident que el redactor de la del 950 coneixia el text ja que n’esmenta els seus actors i en recorda detalls. És aquesta evolució toponímica no concordant entre els dos documents presumptament falsificats la que fa pensar que si més no, la descripció de l’evolució dels bens sí pot ser verídica.

Conclusions

Tot i que les preguntes més punyents que plantegen els falsos de Riudaura (motiu, ocasió, actors, context, etc) no poden ser tractats per qui això escriu (més enllà de les obvietats, com la importància del paper del comte Sunyer, o la rellevància del terme de Santa Maria de Riudaura, evident si comparem la seva extensió amb la del de Sant Joan de les Abadesses) l’anàlisi dels dos documents més clarament manipulats, els de les consagracions de Santa Maria, revela dades que sí semblen versemblants i que apunten a una possible creació de l’alou el segle IX. Mirem d’enumerar-les.

  1. En primer lloc, la situació de l’alou, en el terme de Besalú, al est de Ripoll, a Osona, territori que no serà organitzat fins la generació del Pilós, sí és congruent amb una data anterior si pensem que la influencia carolíngia s’anà estenen des de la costa vers l’interior i de nord a sud. I la seva mida, que fa penar en una acció d’envergadura, poc adient a una fase posterior on el territori ja estarà més parcel·lat entre les diferents autoritats.
  2. La datació de la primera consagració en el 850, permet esvair els dubtes que tradicionalment s’han expressat sobre la identitat dels seus actors. Existí un comte Guifré relacionat amb Girona en la generació dels pares del Pilós i pot haver existit un bisbe Soniofredus entre Gotmar(850) i Elias(853). A més resultaria difícil pensar que un falsificador s’havia pres la molèstia de fer aparèixer (anacrònicament) figurants del context del bisbe Wigo, però s’inventà el bisbe…!
  3. La correcció de la concreció geogràfica del text del 850 es pot veure en la complementarietat a banda i banda del terminio Bisuldunense entre Santa Maria de Riudaura a Besalú i Sant Joan de les Abadesses a Osona l’any 887.
  4. La menció en el text de l’església de Sant Andreu al 950 però no en el 850, tot i que el primer sí la remet als temps de Guifré, tampoc és coherent amb una falsificació conjunta de les dues consagracions. No podem afirmar en quin moment es construí Sant Andreu del Coll, si en el segle X, per obra de Sunyer o si en temps del seu avi com diu un dels regests. En tot cas, com acostuma a passar en aquesta mena de temes, probablement haurà de ser l’arqueologia la que potser ens tregui de dubtes.
  5. Les advocacions de Riudaura: Santa Maria, Sant Pere i Sant Joan es corresponen perfectament a les de la generació del Pilós a Osona i a les de la seva família. I en aquest sentit, fer notar que la de Sant Andreu també s’adiu amb la generació dels pares del Pilós (tot i ser anterior[13]), pensem en Sant Andreu d’Eixalada, el monestir fundat probablement sota la tutela de la família comtal en la vall del Tet, aigües amunt de Rià l’any 840, quan començaven els temps de Carles el Calb.

La generació anterior al Pilós, en la part central del s.IX disposa d’un registre documental molt minso i és per tant un període mal conegut. L’alou de Riudaura és lo prou gran com per fer evident la seva importància en el context si efectivament va ser organitzat llavors. Sembla raonable mirar de no deixar de banda informacions potencialment rellevants en un període especialment borrós per el fet que els pocs testimonis que ens han arribat hagin estat manipulats. Cal filar més prim i, amb totes les prevencions que calguin, mirar de rescatar les dades versemblants, ja que de fet, la manipulació documental en aquests primers temps és més la norma que no pas l’excepció.

Santa Maria de Riudaura a l’any 850 havia de ser una peça important per el comte Guifré ‘de Girona’ quan l’alou era frontera amb la deserta Osona. També ho serà per els seus descendents, encara que ben probablement per motius força diferents.


Notes

  • [1] El de l’any 850.diu:

    In nomine sanctae & individuae Trinitatis. Post corpoream Domini nostri Iesu Christi venerabilem adscensionem & post salutiferam apostolorum suorumque sequacium praedicationem , purgato iam mundo ab idolorum turpissima servitute , non parvae gentilium turbae praebentes colla suavissimo Salvatoris iugo , innumera per totum orbem construxere episcopia atque coenobia , ubi Deo dicati clerici sive monachi religiose viventes , divina celebrare misteria communis utilitatis existimantes commodum , sic per terrenum habitaculum Deo dicatum , fidelium membra Spiritus Sancti fierent receptaculum. Proinde venerandus domnus comes cum omni veneratione vel reverentia nominandus Vifredus ecclesiam quae est in comitatu Bisuldunense vel Ausonense , in villa Riodazari constructa habetur , cum propria voluntate episcopi domni Soniofredi in cuius dioecesi sita dignoscitur , studuit consecrare , quo proficeret ad remedium sui atque suorum. Peracta autem consecratione praedictae ecclesiae paterno affectu locumque semper in honore permaneret & Deo ibi servientibus quae necessaria forent subministrare largissime posset , praesente coetu episcoporum , abbatum ,canonicorum , ceterorum fidelíum suorum , qui praesentes aderant , solercia ingenii & consilio cunctorum , firmissimo sancivit decreto , quatenus praefatum coenobium Sanctae Mariae virginis cum titulis suis , incontaminato statu semper iugi libertate vigeret & quidquid iam adquisierat vel in reliquum adquirere posset , libere possideret , sicut sequens libellus declarat. Sub Dei nutu haec est membrana concessionis seu confirmationis quem fecit Soniofredus , Gerundensis sedis episcopus , cum universo coetu archidiaconorum , canonicorum seu aliorum clericorum in eadem sede sanctae virginis Mariae Deo agonizantium , domno itaque Vifredo , comite atque marchione , iubente atque precante , ut ecclesiae suae quae constructa esse dignosciturin valle Riodazari , ut eam consecraremus , & nos itaque inter nos concordantes quia humana fragilitas magis potest dilabi in inferiora quam ascendere ad suprema & potius delectare terrena quam amare caelestia , & sine peccati contagione nemo possit in hoc aevo mortali vivere & sciamus quia iudex iustus venturus sit in die examinationis reddere unicuique secundum opera sua supplicium iniquis , vitam aeternam iustis. Ob hoc ego Soniofredus , episcopus , Giscafredus , Adalardus , archipresbyteri , Persinetus , Argibadus , Durandus , Rodegarius , sacerdotes , atque canonicorum seu clerícorum coetus , valde expavescentes , consideravimus in animo nostro concedere cellae eidem supramemoratae Sanctae Mariae cum titulis suis , videlicet Sancti Iohannis & Sancti Petri , in die eius dedicationis decimas & primitias & oblationes fidelium de villulis & villaribus quorum nomina sunt haec : Riodazarii , Crosaunas , Artigas , Bacholardario , Cuguciago , Felgars , Tarnadela , Abíetem , Galindono , Vilareto , Collo Iuvino , villare Aliario , in Bisuldunense territorio nostro. Sic concedimus praelibatae ecclesiae cimíterium in circuitu ecclesiam dex[…] XXX. Nam & domnus comes Vifredus nostro assensu donat eidem ecclesiae ecclesiam Sanctae Margaritae cum decimis & prímitiis de villulis & villaribus ad ipsa ecclesiam pertinentibus cum terminis & aiacentii ssuis. Et ego supramemoratus comes dono eidem ecclesiae supramemoratae in valle Riodazari ,iuxta ipsam ecclesiam , domos meos cum terras & vineas , cum omnibus pertinentiis , & in Collo Iuvino terras & vineas quos in dominicum teneo cum terminis & aiacentiis suis. Et habent afrontationes haec omnia suprascripta : de oriente in Frarago , de meridie in terminis de ipsos Balbos per ipsa media serra , & sic pervadit per ipsa serra usque in Gurgo Nigro , & iniungit ad Aqua Bella usque supercilio montís , & pervadit in collo Frigido per ipsa serra usque in collo de Cannas & pergit ad ipsa Sentigosa ; & de circi vero parte vadit per ipso medio rio quae dicunt Bianna. Modo vero excellentissimi & reverentissimi viri domni Vifredi , marchionis , confirmo ego Soniofredus , episcopus , cum voluntate omnium clericorum nostrae sedis Gerundae & statuimus ut ab hodierno die , id est a dedicatione sanctae Virginis Mariae quae est sita in valle Riodazari , & deincebs ipsas decimas & primitias cum oblationibus fidelium de villulis & villaribus suprascriptis cum ecclesiam Sanctae Margaritae cum illorum terminis sic concedimus supramemoratae ecclesiae suisque ministris , sicut superius scriptum est , ab omni integritate , assensu bonorum omnium clericorum seu laicorum qui ibi aderant , omni tempore inconvulsa permaneant , sub ea tamen definitione ut per singulos annos sacerdotes & ministri qui in eadem ecclesia ministraturi erunt , nobis quoque successorumque nostrorum non aliud solvant , nisi veniant ad concilia & chrismale ministerium , secundum instituta canonorum , & cum episcopus confirmationem exercere voluerit obedientiam paratissime exibere procurent.
    Perhacta sunt enim haec anno Incarnationis dominicae DCCCL. , VIII. kalendas octobris , anno XI. regnante Karulo , gloriosissimo rege.

  • [2] Documents 52,67, 68 en: Magnou-Nortier, Elisabeth + Magnou, Anne-Marie : 1996 : “Recueil des chartes de l’abbaye de la Grasse”
  • [3] Martí i Castelló, Ramon : 1997 : “Col·lecció diplomàtica de la seu de Girona – 817-1100” p.128
  • [4] L’edició de : Ordeig i Mata, Ramon : 1993 : “Les Dotalies de les esglésies de Catalunya – segles IX-XII” D.+6 mostra les semblances entre el dos texts, però en la comparació, no sembla possible descartar la possibilitat d’una formulació comuna anterior al 977. En aquest sentit, les floritures pròpies del context de finals del Ripoll del s.X, es concentren en la consagració de Santa Maria del 977, però no en la de Riudaura. Encara que aquesta, sí presenta alguna expressió inusual com :’Deo agonizantium‘ que tot i que la trobem precisament l’any 977 a Sant Pere de Rodes (CC5, D.436) es localitza idèntica en documents de l’abat Maiol deCluny entre el 956 i el 994 (Cartulaire de Sauxillanges.D.166 – una cum norma monacorum ibidem Deo agonizancium-), La fórmula però del text de Riudaura (confirmationis quem fecit Soniofredus , Gerundensis sedis episcopus , cum universo coetu archidiaconorum , canonicorum seu aliorum clericorum in eadem sede sanctae virginis Mariae Deo agonizantium) tot i tenir el mateix sentit, és clarament diversa.
  • [5] Aquí, la referència obligada és a les edicions d’en Stefano Congolani, per exemple: Cingolani, Stefano Maria : 2010 : “Les GESTA COMITUM BARCHINONESIUM (versió primitiva), la BREVIS HISTORIA i altres textos de Ripoll” : Monuments d’Història de la Corona d’Aragó V.4 :
  • [6] Vescomte l’any 841 (CC5 D.18) i comte el 850 (CC5 D.30), sota la forma Unifredi en la còpia del s.XIII del Cartoral de Carlemany.
  • [7] Algú hauria de corregir l’entrada a la wikipèdia en català i la llista de bisbes de Girona per situar-lo a l’any 850.
  • [8] També és de considerar la possibilitat que el Bianna del text, no correspongués a l’actual Sant Ponç/Bianya sinó a la riera que a l’altra banda del coll de Sentigosa baixa directe a Santa Margarida, la de Santa Llúcia de Puigmal, però la coincidència dels noms i la resta de consideracions han decantat la balança per l’opció que semblava més planera.
  • [9] En sentit contrari, tampoc és que siguin rares les controvèrsies per mirar de precisar els perímetres de delimitacions d’aquells segles, la lectura del mes n’ha aportat un bell exemple, en aquests cas, un article doble sobre els pagi del Llemosí: Lacabane, Léon : 1861 : “Observations sur la géographie et l’histoire du Quercy et du Limousin à propos de la publication du cartulaire de Beaulieu (deuxième article)” : Bibliothèque de l’École des chartes – revue d’erudition, consacrée spécialment à l’étude du moyen age : 22.1 p.97-122
  • [10] Document molt planer que no esmenta l’abat receptor i que es limita a cedir la vila de Riodazari amb l’església de Santa Maria i les sufragànies, però sense cap detall. (Magnou-Nortier, Elisabeth + Magnou, Anne-Marie : 1996 : “Recueil des chartes de l’abbaye de la Grasse” D.52)
  • [11] Cal avisar, que si algú intenta anar a l’església de Sant Andreu del Coll fent cas de GoogleMaps acabarà a l’església de Sant Miquel del Mont en la cota 775, a cosa d’un kilòmetre a l’oest de la Sant Andreu del Coll que està en la cota 600 i en una altra pista. Si més no, és una església romànica fantàstica i amb una vista sobre la vall de Bianya privilegiada, i la serra és la correcta… 🙂
    wikipedia-800px-sant_miquel_del_mont_ermita

    Sant Miquel del Mont.
    Imatge de wikipedia.org.

    Millor fer servir l’ICGC.

  • [12] Es podria pensar que el Vifredo aquest fos el Pilós, però l’esment al bisbe Soniofredus apunta al document del 850, de manera que la hipòtesi més econòmica sembla ser pensar que es tracta del Vifredo del mateix text.
  • [13] Pladevall i Font, Antoni : 1990 : “Tona. Mil cent anys d’història” p.50

2017-gener a cathalaunia.org

$
0
0

Gener ha estat un mes llegit, molt llegit. I és complicat per un amant dels llibres com el que escriu reconèixer que des de fa ja un temps la pantalla ha substituït el paper. No en el plaer específic de la imitació de Sant Agustí d’Hipona, on el paper venç de llarg, però és que la practicitat de poder llegir i al mateix temps anar anotant i a més, integrar tant els texts com les notes en un sistema integrat de consulta no té parangó. Potser si Hefaistos i Enki volen podrem tenir aviat paper electrònic per poder llegir sota el sol amb dispositius informàtics, com fem amb el paper normal (si no vaig errat la tecnologia base ja està esbossada de fa temps) i a l’hora poder fer la tasca de Nisaba. I posats a demanar, anem un pas més enllà i creem una tecnologia de  presentació que funcioni contínuament entre llum reflectida i llum emesa i així poder llegir en qualsevol condició de llum (això sí que no hem sona que estigui ja en els laboratoris).

La secció Ibèrica i Romana ha rebut el gruix de la feina del mes, bàsicament consistent en continuar la tasca de incorporar els esquemes de les inscripcions per poder-ne validar la seva correcció. La bona nova està en què ja hi han més entrades amb esquema no pas sense. Encara s’està a mig incorporar un bloc d’epigrafies, de manera que es previsible que el mes que ve també estigui marcat per aquesta activitat. El treball resulta interessant perquè a part de repassar les entrades una a una, permet concretar la pluralitat de formes dels glifs, la darrera tongada en va aportar una trentena de nous i en aquesta també s’esperen algunes incorporacions més. Convé no deixar-ho a mig fer, ja que un cop recopilats els nous glifs cal incorporar-los en el corpus, en la font TrueType iber.ttf i en les eines de cerca del web i és una tasca delicada.

Aquest bloc ha tingut una entrada de temàtica altmedieval (ja era hora!) dedicada a Santa Maria de Riudaura en la generació dels pares del Pilós. Un tema que dóna molt de si i que així que es pugui continuarem comentant. Ganes no en falten.

La Bibliografia, amb tanta lectura, hauria de reflectir-ho més del que ho fa; i el motiu que no ho faci és perquè la majoria de lectures del mes ja havien estat incorporades en el web prèviament. L’acumulació de lectures pendents, havia arribat a superat els 450 títols el desembre, i en acabar el gener està en els 360; continuant al mateix ritme en quatre mesos fem net… (Ni de conya!) Però sí resulta curiós observar la llista cronològicament, ja que indirectament hi pots veure les temàtiques o tòpics que en van propiciar la seva incorporació i fins a cert punt els viaranys per on ha anat circulant l’atenció o si voleu, la curiositat. I encara més de retruc, el motiu particular de cada volum per estar encara en la cua dels pendents tot i que la temàtica que el va dur allí sí va estar raonablement analitzada, més enllà del fet genèric que sempre hi ha més a aprendre del que un voldria…

Per variar, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.652 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

Variabilitat sígnica de l’ibèric nord-oriental.

$
0
0

Havent acabat -momentàniament- la incorporació d’esquemes a les epigrafies en ibèric nord-oriental del corpus de cathalaunia.org, i abans de passar a incorporar un conjunt de glifs nous als 188 actualment existents que aquesta tasca ha propiciat, un pensament s’ha colat inesperadament en els plans d’activitat prevists i ha obligat a fer-ne cas tot alterant la planificació esperada. És el que té la curiositat: quan pica t’has de rascar. D’això parlarem aquí, i com es pot veure en el títol, té a veure amb la diversitat del signari ibèric nord-oriental.

La idea directriu del corpus epigràfic ibèric de catahalaunia.org, com també ho era del seu corpus germinal, el de ibers.cat, és reflectir informàticament la varietat del signari ibèric original i evitar estudiar les dades a partir de transcripcions del seus (suposats) sons. Na Carme J. Huertas definí originalment una codificació amb poc més de 135 glifs (la idea és assignar un número únic a cada glif), i aquesta és la que s’emprà inicialment a cathalaunia (tret d’unes poques variacions en la codificació de les discontinuïtats i dels signes desconeguts). Posteriorment, es publicà la proposta de codificació Unicode de l’ibèric nord-oriental per el grup LITTERA de la UB, que definia uns quants glifs més (metrològics, i un parell de variants)[1]. Encara en un tercer moment i a partir dels comentaris fets a una anàlisi sobre las co-aparicions de variants publicat en aquest bloc, es qüestionà la fiabilitat de les dades del corpus, motiu per el qual es decidí incorporar els esquemes, les representacions gràfiques, de cada una de les epigrafies presents en el corpus com a mecanisme de verificació pública i matar d’arrel tota possible crítica en aquest sentit.

En una primera tongada, s’incorporaren gairebé el 50% de les inscripcions i es pogué comprovar que la taxa d’errors (signes mal transcrits) era baixíssima (menys de 15 signes no coincidents en més de 1.500 epigrafies). El que també es constatà, fou la conveniència d’incorporar més variants per apropar encara més la representació informàtica a l’original, que és, com dèiem, l’ànim inicial del corpus. Les novetats tenien dues tipologies ben diferenciades: o bé eren signes desconeguts (hàpax) o bé variants noves de signes ja coneguts. Els hàpax lògicament són aparicions puntuals de signes que fan de mal interpretar, mentre que les variants a afegir, tot i ser poques, sí es poden detectar en un nombre significatiu d’epigrafies, d’aquí la conveniència de la seva incorporació. En total, s’afegiren unes desenes de signes nous fins arribar als 188 actuals[1].

En la segona i darrera tongada d’incorporacions d’esquemes feta, que ha permès superar els dos terços d’epigrafies amb verificació, també s’ha plantejat la conveniència de crear uns quants glifs nous; de nou, unes poques variants i uns quants hàpax més. Però ha estat aquí, just abans de procedir a efectuar un altre canvi en profunditat en el signari (i no és sols crear el nous signes i posar-los als llocs adients de les epigrafies, cal també ajustar totes les eines de tractament informàtic i de cerca) que la idea d’un possible mètode quantitatiu per mirar detectar variants va fer aparició i ha fet aturar momentàniament el treball. Això és el que comentarem aquí, aquest mètode i els seus resultats.

Variants

La idea és simple: si un mateix caràcter, una mateixa lletra, es pot escriure de més d’una manera, cada una d’aquestes ‘variants’ es comportarà de manera semblant a les altres; és a dir, caldria esperar trobar-les en llocs similars.

Concretant-ho. Podem mesurar entre quines lletres apareix, i esperar que si, per exemple, hi han vàries ‘A’s, es trobin cada una d’elles, en general, al costat de les mateixes lletres. No es evidentment un principi d’obligat compliment, res impedeix que dues lletres diverses apareixin al costat d’unes mateixes lletres, ni tampoc és una qüestió de blanc o negre, ben al contrari, la qüestió però, és que sí pot ser un indici rellevant i té la gran virtut de ser perfectament objectivable. Mesurarem doncs per cada glif, al costat immediatament de quins glifs apareix, fent parelles amb el glif anterior i el posterior. És a dir, per a cada glif anotarem quantes vegades el trobem entre una parella de glifs determinats, cosa que ens proporcionarà un vector de nombres per cada glif que podrem comparar entre ells. És en entrar als detalls que la cosa es complica…

Per començar mostrem el signari amb les freqüències de cada glif en el moment de fer aquesta prova:

ibset-6

178 glifs suposadament fonètics.
Mides alterades per mostrar gràficament la diferència entre el més freqüent amb 1565 aparicions i d’els que en sabem només 10 o menys.
En gris els glifs definits però no existents en el corpus.

En principi, si tenim uns 170 glifs, en teoria, tindríem 28.900 possibles parelles, o sigui que per cada glif, anotem quantes vegades el trobem entre cada una d’aquestes 28.900 parelles. Ara bé, el corpus total existent no passa dels 25.000 caràcters, i de mitjana, un glif hauria de sortir només unes 140 vegades, de manera que és evident que la immensa majoria d’aquestes 28.900 parelles no es donaran mai, és dir, tindran sempre un valor 0.  Per mirar de reduir aquests milers de valors a 0, es podia d’entrada ignorar els de les parelles de signes que no es donen mai en el corpus. Això ens deixa amb menys de 5.000 parelles documentades al menys un cop, un nombre encara molt gran si pensem que la majoria de signes es documenten només algunes desenes o algun centenar d’aparicions i que encara seran menys les parelles de signes entre les que es trobin.  Amb tot, era un inici, i per mirar de comparar aquestes distribucions, es pensà en utilitzar el mateix coeficient de correlació de Pearson que s’havia emprat recentment per comparar les distribucions de sons entre el català, el castellà, l’eusquera i el llatí versus el desxiframent actual de l’ibèric nord-oriental[3]. La diferència està en que allí eren uns vectors petits (de 12 valors) i amb una distribució força simple i fàcilment classificable, aquí en canvi, tenim vectors amb milers de valors a 0 i sols uns pocs valors positius, és a dir, que ja d’entrada s’assemblen molt entre ells per tenir tots molt poca informació diferenciable.

Una primera prova va mostrar que una de les peculiaritats de la codificació de cathalaunia tenia uns efectes desproporcionats. Es tractava que en el corpus es codifica tant les discontinuïtats en els suports com els signes no identificats amb un mateix codi (256), que atesa la fragmentarietat de moltes de les inscripcions, resulta ser de llarg el codi numèric més freqüent, i les parelles (abans-després) que l’incloïen eren molt determinants, sense però que aquesta informació sigui de valor per la tasca que aquí ens interessa, que és determinar quines lletres van preferentment després de quines altres. La solució ha estat salomònica: eliminar totes les parelles que continguin aquest codi. Això ha reduït el total de parelles abans-després a 4.251 i és la base inicial sobre la que es van fer les mesures.

El procediment a seguir podria ser -inicialment-:

  1. Busquem els dos glifs (X i Y) amb la distribució de parelles entre les que es troben més semblant, i si efectivament, sabem que es suposen ser variants d’un mateix signe/so, els unifiquem (per exemple, convertint Y en X o viceversa).
  2. Fet això, tornem al pas 1, fins que no hi hagin més candidats a reunificar. A veure fins on s’arriba.

El procediment era simple però implicava la seva repetició desenes de vegades i l’anàlisi dels resultats va acabar recomanant un mètode diferent, com veurem tot seguit.

Una altra de les peculiaritats de la distribució de les dades que afecta directament als resultats era la seva dispersió. El coeficient de Pearson pot detectar factors de linealitat alts entre vectors que no tenen valors en comú i atès que la majoria de glifs apareixen en poques ocasions i de retruc entre encara menys parelles, la probabilitat de detectar aquesta mena de casos era molt alta. La solució, tot i que parcial, de nou va ser salomònica, eliminar de la comparació els 59 glifs que apareixen 10 o menys cops en tot el corpus; això reduí encara més el conjunt de dades, però no n’alterava la seva tipologia general.

ibset-9

El signari ibèric amb els glifs amb 10 o menys aparicions marcats en gris.

Per mirar de visualitzar el que s’està mesurant, imaginem una matriu de 4.251 columnes i 5.886 files, és adir, de més de 20 milions de nombres, on tot són 0s excepte 10.711 caselles, un únic valor positiu per cada 2.000 0s. El que fem és comparar les files de dues en dues (per definició X vs Y és idèntic a Y vs X) i mesurar-ne el grau de correlació lineal entre elles (recordem que el coeficient de Pearson es mou entre 1=correlació lineal perfecta, 0=no correlació, i -1=correlació lineal inversa perfecta). Col·loquialment: gairebé caçar mosques.

Resultats

Feta la primera mesura, els resultats eren clars: de les 5.886 comparacions, sols 205 tenien coeficients superiors al 0.1, mentre que el valor més baix era de -0.05, amb una gran acumulació de valors al voltant de 0, com era d’esperar si pensem que estem bàsicament comparant vectors quasi nuls. Mostrem aquests 205 resultats superiors a 0.1 (ordenats de dalt a baix i d’esquerra a dreta).

pg-0

Els resultats de la mesura sobre els 164 glifs (ignorant els que apareixen 10 o menys vegades).
En vermell els glifs que actualment es consideren ser variants.
En verd parelles properes per forma o so però no considerades variants.

Veiem que efectivament, la correlació més alta correspon a un parell de variants del signe Ke (codis 112 i 118). Si apliquéssim l’algoritme anterior els unificaríem, és a dir, en comptes de 164 glifs passaríem a tenir-ne 163 (les freqüències dels glifs 112 i 118 s’haurien sumat) i tornaríem a calcular-ho tot. Però també semblava evident que amb un conjunt de dades tan dispers, passar de 164 a 163 glifs, no alteraria de forma significativa les dades, de manera que veient que efectivament les parelles de variants detectades s’agrupen majoritàriament en la part alta dels valors, es procedí a fer una simplificació més gran acceptant totes les parelles detectades amb un coeficient més gran de 0.1 (les marcades en vermell en la taula anterior). Gràficament:

ibset-3

Una primera reducció, totes les parelles de variants amb un coeficient superior a 0.1.
En petit els glifs agrupats.

Això deixà un conjunt de 118 glifs amb 3.079 parelles abans-després detectades, i 1. 953 comparacions possibles, que de nou, filtrant els valors superiors a 0.1, dóna:

pg-1

Segona comparació entre 118 glifs (ignorant el que apareixen 10 o menys vegades) .

On ja es pot veure que les parelles de variants detectades són moltes menys i ja no s’acumulen en la part alta dels valors. Si agrupem encara aquestes parelles de variants, tindrem el següent signari:

ibset-8

Signari amb la segona reducció de variants.
En vermell les variants detectades en la segona comparació.

Feta aquesta segona agrupació ens deixa amb 99 glifs, 2.555 parelles abans-després i 946 comparacions possibles. Feta aquesta tercera mesura ja no és detecta cap parella de variants amb una correlació major a 0.1[4].

De manera que el conjunt de variants detectades en aquest procediment es concreta en: 82 glifs agrupats en 22 signes.

ibset-7

Agrupacions de variants amb coeficients de correlació de Pearson superiors a 0.1.

Comentaris

Presentades les dades, el procediment i els resultats, cal abans d’acabar, comentar els resultats ja que hi ha força a dir. Per començar i abans d’entrar en les consideracions generals, analitzar amb un xic de detall els resultats amb coeficients més elevats.

Ja hem vist que el coeficient més alt sí corresponia a una parella de variants, però el segon ja no, es tracta d’una parella ‘BaTe‘ (codis 83 i 103) . Els signe Ba, no sols és el més freqüent del corpus (1565 aparicions), es també emprat com a numeral de manera que tenim grups consecutius de signes Ba en moltes epigrafies, i per tant, resulta que la parella de signes entre els que es troba més freqüentment un signe Ba, és una parella de signes Ba. Per contra, el signe Te amb forma d’un rombe partit en quatres rombes, es documenta sols en 49 ocasiones, però si mirem entre quins signes apareix, resulta que la parella més freqüent és entre signes Ba (hi han set epigrafies amb la paraula BaTeBa). De manera que ja veiem el perquè d’aquest alt grau de correlació, aquest Ba i aquest Te tenen en comú que la seva principal component és trobar-se entre signes Ba.

El tercer i quarts coeficients (i també el setè) van interrelacionats, i gràcies a aquesta anàlisi s’ha detectat la necessitat d’incorporar una nova variant en el signari que havia escapat totes les mirades fins ara. El tercer coeficient més alt correlaciona un signe Te (codi 105, 95 aparicions) i un signe Tu (codi 235, 36 aparicions). Si mirem els valors de les seves  distribucions, veurem que sols tenen en comú dues parelles (una d’elles amb el valor mínim 1, i l’altra corresponen al valor màxim de cada un d’ells (una E i una I), d’aquí l’elevat coeficient.  Però és que la quarta correlació també és respecte aquest mateix glif Tu, ara però amb un signe Ka (codi 187, 35 aparicions) i el setè coeficient tanca el triangle correlacionant el Te inicial amb el signe Ka. En l’anàlisi es veu que l’evidència compartida és similar a la ja comentada, gairebé mínima, de manera que ens troben en aquella mena de casos extrems en què la correlació de Pearson resulta poc intuïtiva; però en la taula de resultats veiem que la correlació respecte del Tu codi 245 vers al signe Ka codi 187 sí està marcada com una parella de variants, com és això? Doncs la resposta és que gràcies a aquest anàlisi ha estat possible adonar-se que de glifs amb forma de V invertida no n’hi havien dos (el més freqüent amb més de 800 aparicions, codi 57, considerat una forma del so L, i el codi 235, transliterat com un Tu poc habitual), sinó tres, amb un tercer so correlacionable amb el so Ka. com veiem. El punt està en què resulta que era una possibilitat que ja s’havia fet notar prèviament[5], en constatar que si bé el signes Ke, Ka semblen girats 90º entre sí, els primers sí tenien una forma sense travesser que mancava en els Ka: que és just el que aquest joc de correlacions delata quantitativament. L”evidència es concentra aparentment en una sèrie de monedes amb la llegenda Sekaisa però atesa la semblança formal dels signes cal preguntar-se si no hi han també altres Ls que podrien ser Ka en el corpus.

Els dos coeficients següents, els cinquè i sisè corresponen a dues parelles de variants de Ke, el setè ja l’hem comentat i el vuitè, s’assembla molt al segon, tota vegada que correlaciona un signe Ti (codi 126) amb el mateix signe Ba d’abans, i és que de nou, el signe Ti forma part dels numerals i sovint es troba rodejat de signes Ba. Les sis següents correlacions corresponen totes a parelles de variants i tindrem que anar fins la quinzena correlació per trobar una parella E (codi 42) i un Ta (codi 85) que en l’anàlisi revelen no tenir cap coeficient en comú i ser per tant un altre cas atípic.

Ara, obrint la mirada i deixant el comentari detallat, per una banda resulta notable que amb unes dades amb un tal grau de dispersió i amb un corpus tan escàs tenint en compte la seva variabilitat sígnica, s’hagin pogut detectar desenes de variants per el mètode de comparar entre quins signes apareixen, especialment si considerem que la mesura de correlació emprada (la de Pearson) presenta en aquesta mena de distribucions resultats que poden semblar contraintuïtius. Alternativament, i com indicava ja la teoria, que dos signes apareixin més o menys al costats d’uns mateix signes no implica en cap cas la seva equivalència, i a mida que relaxem el grau de correlació és del tot esperable que apareixin signes clarament diversos que sols tenen en comú el fet de figurar més o menys al costat d’uns mateixos signes, que és just el que trobem en els resultats.

Si mirem les agrupacions de variants detectades, també resulta curiós notar que si bé es detecten algunes de les variants, no és així per totes, i en concret, resulta destacable que en els signes Be, es diferencien les agrupacions entre si el signe està cap amunt o avall. Una distinció que analitzant la forma dels signes ja semblava abans rellevant si considerem que estem davant d’un signari que, per exemple, en els signes Ka, Ke, com dèiem, diferencia entre una rotació de 90º; resulta per tant estrany pensar que contràriament s’unifiquin girs de 180º. Les agrupacions trobades les separen, i encara que cal evidentment atendre a altres consideracions per desbrinar el seu desxiframent, no deixa de ser una dada a tenir en compte.

Coda

Arribats aquí, i veient que el factor objectivable que més distorsió aporta a la interpretació dels resultats és el comportament de la correlació de Pearson en dades disperses, s’ha provat un conegut heurisme que mira d’escalar els resultats segons la quantitat de valors no nuls que es comparen. La idea és que a menys factors comuns, menys factor de correlació. No passa de ser un pedaç, ja que la correlació té una explicació geomètrica ben sòlida, mentre que voler que el seu resultats s’adaptin a un cert motllo, no passa de ser un problema d’interpretació, i per tant, una simple conveniència. Amb tot, havent fet ja aquest treball, fer la prova no era complicat, de manera que s’han fet uns quants intents en aquest sentit, i ja posats a fer, s’ha aprofitat per introduir alguna petita millora en el model[6], però tot i així, els resultats no són més clars que els exposats aquí. De manera, que la pràctica aconsella donar per bona l’aproximació inicial, més simple i canònica.

Les comparacions dels recomptes de com es distribueixen els glifs, en ser mesures graduals[7], no poden donar certeses, ja hem dit al començar que era evident que lletres diferents poden tenir distribucions similars, el que sí ens aporten són dades objectives. Dades que neixen de disposar d’un corpus codificat i informatitzat amb un alt grau de semblança a l’original. Sense aquest element (actualment sols disponible a ibers.cat i a cathalaunia.org), cap treball quantitatiu podrà ser verificat independentment per tercers que és un dels requisits bàsics de la Ciència.

Lo presentat en aquest apunt és una foto puntual; com diem, s’incorporaran nous glifs (i aprofitant l’avinentesa s’eliminaran els glifs no documentats) i la codificació de les dades i per tant aquests resultats canviaran lleugerament. Hagués estat millor postposar aquesta anàlisi per després dels canvis? Potser sí, però fixem-nos que si més no per el que fa al glif amb forma de V invertida i so Ka, ha estat el fet de fer aquesta prova el que l’ha posat de manifest. I és que el procés d’adequació del signari als originals és un procés retroactiu i treballós (per exemple, caldrà tornar a repassar totes les epigrafies per comprovar que es registren  totes les aparicions dels nous glifs). Un treball de codificació i publicació del corpus resultant que sembla mentida que hagi de dependre d’iniciatives no institucionals.

 

 


Notes

  • [1] No tocarem aquí el tema de la problemàtica d’aquesta codificació, ja n’hem parlat abastament en aquest bloc.
  • [2] Cal entendre que com que la incorporació de nous glifs es fa a posteriori de la seva detecció, en els casos de variants de signes ja coneguts, es possible que no totes les epigrafies hagin estat convenientment actualitzades i que caldrà una segona repassada per incorporar-los plenament.(s’anoten i actualitzen les que es detecten un cop es fa evident l’existència del nou glif, però no les processades amb anterioritat)  Amb tot, com que en la immensa majoria de casos la diferència és sols entre una variant que ja s’assembla a l’original i una d’encara més semblant, tampoc és una qüestió especialment delicada i es pensa anar ajustant gradualment..
  • [3] Treball que també va ser publicat en aquest bloc.fa poc.
  • [4] Els resultats superiors a 0.1 d’aquesta tercera mesura es poden veure en la següent taula:

    pg-2

    Resultats superiors a 0.1 de la tercera reducció de glifs.
    Cap parella de variants conegudes detectada.

  • [5] Es pot veure si es disposen els glifs segons aparença, per exemple:
    iberglifs

    Glifs per aparença per graus de complexitat.
    En verd les mateixes figures en blau amb un traç vertical inferior afegit.

    .

  • [6] Concretament: unificar tots els glifs separadors de paraula (els formats per una columna de punts) en un únic glif, ja que no sembla que estar al costat d’un separador de dos punts ens pugui aportar cap informació rellevant diferent que estar al costat d’un de tres o d’un de quatre. I en segon lloc, un tecnicisme: mirem el glif abans i després de cada un dels signes, però que fem amb els que estan a l’inici i al final d’una inscripció? En tot el procediment explicat aquí, el que es va fer va ser inserir abans i després de cada epigrafia un caràcter 256 (el de les discontinuïtats). Desafortunadament, com hem explicat, en la fase posterior totes les parelles que contenien aquest caràcter s’eliminaven, i per tant, es perdia la informació del primer i del darrer glif. La solució ha estat inserir un espai, en comptes d’un 256. Amb tot, i com es comenta amunt, cap d’aquestes millores ha resultat tenir un efecte clarament perceptible.
  • [7] La quantitat de mesures de correlació és pràcticament infinita. El fet d’emprar una mesura de correlació lineal com la de Pearson i no d’altres més genèriques com la de Spearman (monotònica) o semblants es deu a preferir sempre que sigui possible la aproximació més simple.En altres termes, caldria donar una raó per poder pensar que una mesura més complexa seria preferible en aquest domini en particular.

2017-febrer a cathalaunia.org

$
0
0

De cop, final de mes. Febrer ha estat un mes ibèric a cathalaunia.org, més del que es preveia.

El web ha rebut una millora global en forma de sistema de navegació entre les dades que es presenten. Com és manifest, és l’objectiu de  cathalaunia.org publicar un seguit de dades objectives sobre la història de Catalunya anterior al segle XII. I per fer-ho defineix i agrupa una sèrie de tipologies de dades, ja siguin: documents altmedievals, epigrafies ibèriques, bibliografia sobre el període visigot, antroponímia altmedieval o el que sigui, i per cada tipus, un conjunt de pàgines numerades, una per a cada ítem rellevant en la seva classe. La millora consisteix en uns botons de navegació en forma de fletxa situats en la part superior esquerra cada ítem, que amb un sol clic, permeten anar al extrems (primer o darrer) o als ítems immediats (previ o següent) del conjunt de dades que s’estigui consultant en un moment donat. És una millora aparentment simple i que feia temps que es volia incorporar, però que no ha trobat la manera adient de fer-la realitat fins aquest mes.

Aquest bloc ha tingut una entrada dedicada a descriure un mètode quantitatiu per mesurar el grau de correlació existent entre les ‘variants’ d’un mateix ‘caràcter’ del signari de l’ibèric nord-oriental (segons les agrupacions fetes per els filòlegs) atenent entre quins glifs es troben. No estava pas previst, però sorgí la idea i calia fer la prova. El resultat és que es poden documentar graus de correlació de Pearson positius (però baixos, la majoria per sota 0.5) per a 89 glifs del signari que s’agrupen en 24 ‘caràcters’. La dispersió de les dades (a prop de 200 glifs en un corpus de menys de 25.000 lletres) fa que – si més no de moment – no es pugui parlar d’evidències gaire clares, tret d’uns pocs glifs.

La Secció Ibèrica i Romana ha concentrat la feina. Per una banda s’ha incorporat un nou gruix d’esquemes d’inscripcions per tal de validar els continguts presentats, i ja són més de dos terços les epigrafies que disposen d’aquest mecanisme. També hi ha hagut la prova estadística comentada abans, sobre l’evidència real de les agrupacions sígniques actuals. A més ja ha aparegut el volum del 2016 de la revista Paleohispànica i cal incorporar les novetats epigràfiques registrades (tot i que en aquesta vegada, una bona part ja estaven presents en el corpus). I per si fos poc, altres obres d’aquest mateix any documenten desenes de noves inscripcions que també caldrà incorporar. De manera que semblava al començar el mes que amb quinze dies endreçàvem la carpeta ibèrica, i arribats a fi de mes encara hi ha un munt de feina per fer. Ars longa, vita brevis

A darrera hora s’ha decidit incorporat una millora programàtica en el mecanisme de cerca del corpus epigràfic i detecció de seqüències. Esperem haver-ho fet bé, però si es detecta alguna disfunció inesperada, s’agrairà que es faci saber per tal de corregir-ho el més ràpid possible (la cerca en el corpus és una de les sub-seccions més actives).

La secció de l’Alta Edat Mitjana i en especial el Fons Cathaluania són els grans absents del més. Hi han millores puntuals però s’esperava que si més no en la segona mitat del mes ja es pogués tornar a dedicar-s’hi plenament; no ha estat així. Afortunadament, el poc que hi ha hagut ha estat de qualitat, encara que no tingui per ara visualització.

La Bibliografia del mes reflecteix el predomini ibèric i les noves aportacions han compensat les lectures  fetes, de manera que la cua de ‘pendent de llegir’ continua en els 360 títols (no hi ha manera que baixi…).

Com és habitual, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.684 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.


Variabilitat sígnica de l’ibèric nord-oriental (2).

$
0
0

El mes passat fèiem un apunt per comentar uns experiments per mirar de detectar les agrupacions sígniques en l’ibèric nord-oriental. És el cas ara de tornar-hi per exposar una sèrie de conceptes que es van ometre allí i que en una revisió més treballada creiem que poden ser d’interès.

No es cap secret que cathalaunia.org neix del creuament de dues disciplines aparentment diverses: Història i Computació. La primera aporta els continguts i la segona els mètodes, i sent un web dedicat exclusivament a la presentació de dades, omet volguda i sistemàticament publicar qualsevol mena d’opinió i/o comentari (quan resulta inevitable s’etiqueta específica i explícitament com a tal), per complementar-ho, existeix però aquest bloc, per poder donar expressió als molts aspectes relacionats amb el web i la seva confecció que no tenen lloc en ell. Un d’aquests usos, és de fer de bloc de notes públic d’algunes de les recerques que es duen a terme, aquest és l’aspecte que farem servir aquí. En concret, no tant per comentar alguns dels experiments fets, com fèiem en el post anterior, sinó per anar un pas més enllà i reflectir la recerca a mida que es va fent. Dit altrament, tenim una idea general a seguir, però no sabem en començar a escriure això quin serà el contingut final d’aquest apunt. Creuem els dits…

Parlàvem de la Computació com quelcom substancial en la confecció de cathalaunia.org[1], perquè així com la Història i en general les Humanitats són ben conegudes del públic i tothom te una imatge més o menys aproximada dels seus professionals i del què comporta la seva dedicació, això no és tan així per el que fa als professionals del món de la Computació. Una de les característiques habituals de la gent que es dedica a la programació, és una mirada naturalment analítica que cerca de forma inconscient els patrons en la realitat percebuda i que usualment mira de comprendre la realitat de lo general a lo particular. Noció, que evidentment, ni és ni nova ni exclusiva de la Computació (en el fons, estem parlant de Plató) però sí és d’efectes ben reals i quotidians, encara que usualment passin desapercebuts.

En el cas que ens ocupa, aquesta mirada analítica subjacent, es furtà en l’apunt anterior perquè no arribà a cap resultat significatiu però en canvi serà la idea directriu d’aquest exercici. La idea germinal era posar a prova un possible mètode quantitatiu de detecció de les ‘variants’ de l’ibèric nord-oriental. Dèiem llavors:

La idea és simple: si un mateix caràcter, una mateixa lletra, es pot escriure de més d’una manera, cada una d’aquestes ‘variants’ es comportarà de manera semblant a les altres; és a dir, caldria esperar trobar-les en llocs similars.

El que es callà és que prèvia i subjacent a aquesta formulació  hi havia una concepció analítica, matemàtica. Específicament:

En la mesura en què la noció que la semblança de les distribucions dels glifs indica pertinença a un mateix caràcter sigui certa, es podria disposar una xarxa, un graf, amb un node per a cada glif i connectar-los per els factors de ‘proximitat de distribució’, i a partir d’aquí, emprar les tècniques d’anàlisi per detectar-ne les agrupacions.

La idea resulta especialment atractiva a una ment analítica perquè cerca una solució general o ‘lliure de domini’ a un problema específic d’un camp del coneixement allunyat del de la computació[2]. Ara bé, hi han un mínim de tres consideracions ‘del domini’ que treballen en contra d’aquesta ideació:

  1. Una primera i estructural, és que certament diferents lletres poden aparèixer entre els mateixos caràcters. En la mesura en què això sigui cert, el graf agrupara no lletres iguals sinó dispars, i per tant, els resultats seran inconclusius.
  2. La segona, també estructural, però en aquest cas, específica de l’ibèric nord-oriental, és l’evidència que existeixen  glifs aparentment idèntics però que representen sons variats, per exemple: els que tenen forma de V invertida, que tan poden ser L, Ka o Tu. En la mesura que el mateix passi en altres glifs i encara no s’hagi detectat, tindrem que aquest glifs actuaran com la suma dels seus sons, i per tant, també difuminaran l’estructuració interna del graf.
  3. El darrer element que juga en contra de la idea original és la migror de les dades. Tenim un signari amb 200 glifs i un corpus d’uns 25.000, això faria un mitjana d’un centenar de casos de cada glif, però a més, la distribució és força irregular, de manera que per unes desenes de glifs tenim centenars i fins i tot algun miler d’exemples d’utilització, però per a la majoria, en tenim encara no unes poques desenes. Això implica que per a la majoria de nodes del graf, els factors de connexió amb la resta es basen en una evidència gaire bé marginal, i per tant, poden introduir un nivell significatiu de soroll en l’esquema general.

En l’apunt anterior, la idea de modelar el problema a partir d’un graf, es va obviar perquè les resultats van ser poc clars, i perquè la dispersió de les dades, derivada de la curta mida del corpus,  es revelà com el primer factor distorsionant. De manera, que el nasqué com un mètode per detectar quantitativament variants, es reduí a una manera de mesurar objectivament l’evidència de les agrupacions que els filòlegs han definit fins el moment. En la part final, es declarà que s’havien fet algunes proves per alleujar el problema de la dispersió però sense cap resultat significatiu. És el cas de tornar-hi aquí, per dos motius afegits: una millora interessant en aquest aspecte, i per què tal i com s’anunciava allí, el signari ha estat ampliat (dels 188 signes s’ha crescut fins els 207) i el corpus ja en reflecteix els canvis[3].

En un post normal, presentaríem els resultats de les proves i mesures fetes amb el nou corpus i les metodologies millorades, en aquest però, començarem per dir que fetes unes primeres mesures, s’ha pensat que seria millor provar les idees no sols sobre el cas problemàtic de l’ibèric, sinó sobre un corpus alternatiu i més ben conegut, per tal de mesurar la bondat dels nous procediments i intentar separar l’evaluació dels mètodes del de les dades. Dit altrament, miren primer un exemple conegut, per mirar de calibrar l’eina i les seves capacitats, i després ja veurem que ens apareix en l’objectiu real.

Per fer la prova tenim els corpus alternatius que es van emprar fa uns mesos en comparar la distribució de sons del desxiframent actual de l’ibèric nord-oriental amb altres llengües, i per comoditat, empraren el corpus català, que recordem, no és altra cosa que un fragment del Gènesi de mida similar al volum del corpus ibèric. De manera que agafarem els primers 15 capítols del Gènesi, posarem un verset per línia, convertirem cada lletra a un número i analitzarem quins números apareixen al costat de quins altres. L’únic coneixement del domini que emprarem serà reduir tots el signes no sonors a un  únic valor, diguem-ne ‘puntuació’, que és una simplificació que podem fer amb certes garanties també en el corpus ibèric. Tenim molta cosa a comentar…

L’exemple del català

En el corpus català tenim un total de 31.624 lletres, amb 58 signes diferents entre majúscules, minúscules i accentuades, registrem entre quines lletres es troben cada un d’ells, comparem les distribucions resultants amb el coeficient de correlació de Pearson, i creem el graf resultant. En lo que segueix, i a semblança del que ja s’ha emprat en altres apunts d’aquest bloc, farem servir per manipular els nostres grafs el programari gephi.

El primer que cal fer és presentar breument les eines d’anàlisi de xarxes que farem servir que són bàsicament dues: la seva disposició espacial i la seva modularitat. El primer considera les connexions entre els nodes com forces atractives/repulsives, i el que fa és: a partir generalment d’una disposició del nodes inicialment aleatòria, cercar una distribució que minimitzi les disparitats entre els factors de connexió i la separació entre els nodes[4]. El segon, és de natura purament topològica i cerca definir els grups de nodes que presenten una taxa d’interconnexió superior a la resta del graf. No entrarem a parlar en profunditat sobre la natura i l funcionament d’aquests mètodes (tot i que és un tema apassionant), per dos motius, ni és el lloc, ni les eines disponibles permeten gaires opcions. Anant a lo concret, per el que fa a la disposició espacial (en 2 dimensions, per poder-ho representar gràficament de forma fàcil), s’empraran els algoritmes ForceAtlas o ForceAtlas2, i per el que fa a la Modularitat, gephi aporta un únic algoritme, ben conegut, i atès que és una mesura relativa i que permet diferents graus d’agrupació el que farem és realitzar tot una sèrie de mesures en aquesta gradació natural (pensem que en un extrem, tots el nodes connectats d’un graf es poden considerar un únic grup, i en l’altre, cada node pot formar un grup propi). La mida dels nodes representarà la suma de les correlacions vers les altres lletres, i cada graf es presentarà en format gràfic (jpg) i en versió svg, que permet un zoom discrecional a gust de  l’usuari.

De manera que en el corpus català, en una primera disposició tenim 58 lletres/nodes connectats cada un d’ells amb tota la resta, és a dir, un graf amb 58 nodes i 1.652 connexions. Si mirem els factors de correlació (les connexions) veurem que segueixen d’aprop els resultats que es detectaven el cas del corpus ibèric: un factor màxim de 0.76, un mínim de -0.06 i amb poc més de 400 valors superiors a 0.1, és a dir, amb una majoria de valors al voltant del 0 (recordem que el factor de correlació de Pearson es mou entre 1 i -1). El fet que cada node es connecti a tots els altres fa que topològicament sigui una xarxa molt regular, sols els diferents valors de les connexions aporten factors de diferenciació. I en aquest sentit, el fet de tenir factors negatius, fa que la seva representació gràfica amb els algoritmes ‘de força’ sigui complicada, ja que tenen tendència a donar disposicions molt disperses. Finalment, amb l’algoritme ForceAtlas i ajustant els seus paràmetres s’ha pogut generat una disposició mínimament aprofitable.

58 lletres, 1.653 connexions disposats amb el ForceAtlas.
Cliqueu per gràfic de mida real o alternativament en format svg.

On podem veure clarament un grup en la part superior format per les consonants, amb les majúscules en la part superior i les minúscules en la part inferior (recordem que en el text del corpus les majúscules segueixen l’ús habitual, en inici de frase o de nom propi).  Més enllà d’aquest grup, podem observar a l’esquerra un grup dispers format bàsicament per les vocals en majúscules i en la part inferior esquerra un d’encara més dispers amb les vocals en minúscules. S’aparten d’aquesta descripció bàsica en la part superior la Q i la q, que apareixen en la part superior, i les u, ü i ú, que s’apropen més al grup de les vocals majúscules que no pas a les de les minúscules. Sembla lògic pensar que tal disposició és deguda a que les velars acostumen a anar seguides de u, i en la lluita per situar-se, les primeres han hagut d’anar a la perifèria mentre que les segones han hagut de cercar un equilibri entre acostar-s’hi i no separar-se de la resta de vocals. Ara, també sembla ben evident que les agrupacions per distribució de forces no van gaire més enllà d’evidenciar la diferenciació entre majúscules/minúscules i vocals/consonants, cosa que pot semblar poc important, però si pensem que el resultats no depenen d’informació filològica, sinó estrictament numèrica, distribucional, tampoc està tant malament.

Mirem ara l’altra estimador, la Modularitat. En la implementació de gephi, l’algoritme disposa d’un paràmetre per graduar al grau de granularitat que es desitja, diguem-li P (1, per defecte, major per tenir menys grups, menor per detectar-ne més). No tenint a priori cap pauta específica per fixar el seu valor, el que farem serà aplicar-lo de forma sistemàtica: amb dècimes entre 0.1 i 1 i un cas de valor 2 afegit. Per tal de visualitzar els resultats, sobre la mateixa disposició espacial, cada grup detectat tindrà un color propi (el programa els assigna aleatòriament). Anant de menys grups a més:

P=2. 2 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb un valor P de 2, tenim que es detecta un grup (en vermell) format sols per vocals i un altre (en blau) per a la resta de lletres, que inclou les consonants més les vocals i, ï í, u, ü i ú més la à i la ó, situades a mig camí del grup consonàntic.

P=1. 3 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb el nivell de partició per defecte (P=1), tenim un grup blau format per les consonants en majúscules (exclosa les B i X i inclosa la q), un grup verd format per vocals (tret de la ü, u, ï i ó) i un grup vermell amb les consonants en minúscules (més les sis excepcions ja descrites).

P=0.9. 4 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb un factor de 0.9 els grups ja són quatre i corresponen a grosso modo amb l’encreuament de vocals/consonants i majúscules/minúscules, però amb excepcions interessants. Els grups de consonants del graf anterior (blau i vermell) bàsicament es mantenen, però el de les minúscules perd les us que passen al grups de les vocals en majúscula (en lila) i la i, í, à, ç, i la j, (aquesta especialment curiosa per la seva posició central en el grup de les consonants) que val al grup de vocals en minúscula (en verd).

P=0.8. 4 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Baixar el factor a 0.8 no incrementa el número de grups però si n’altera significativament la seva disposició, cosa que fa pensar que l’estructuració interna de les dades no és simple. De fet, hem tornat a la partició en tres grups del P=1, però amb un grup nou format per: u, ü i s, i amb una ó que ha passat, ara sí, al grup vocàlic.

P=0-7. 5 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb un factor de 0.7 el nombre de grups creix a 5, però més que res, a base de subdividir les consonants en minúscules, mentre que les vocal encara conserven un gran grup.

P=0.6. 10 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Per sota de 0.6, la fragmentació de les consonants i de les vocals ‘a mig camí’ anirà en augment fins arribar als 23 grups amb un factor de 0.1, sense que sigui evident cap raó extracomputacional que justifiqui la separació en tals grups (potser un filòleg hi pugui veure més…).

P=0.5. 14 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.3. 17 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.1. 23 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg..

El que sí és manifest que es manté en tota aquesta gradació és la presència de dos grups vocàlics, un especialment ben definit per a les majúscules i un de més variable per el que fa a les vocals en minúscula.

De moment, veiem que en el cas del català, una mesura segons el coeficient de Pearson tradicional ens detecta la separació entre vocals i consonants i entre majúscules i minúscules i poca cosa més. De moment, la cosa no pinta gaire bé per el que fa a separar variants segons la seva distribució…

Però també és evident que el corpus català és força diferent de l’ibèric; minúscules i majúscules tenen rols ben diferenciats i els signes són unívocs (no hi ha -gaire- superposició de rols entre les lletres). L’ibèric sembla molt diferent, ja que en teoria presenta més d’una i més de dues maneres d’escriure una mateixa lletra i a penes fa servir la separació per espais (si però la de puntuació). El que farem serà ‘iberitzar’ el corpus català. Ho passarem tot a minúscules, eliminarem els espais, i de forma aleatòria, introduirem fins un màxim de tres variants de cada lletra, és a dir, tindrem fins tres  as (etiquetades com: a, a+, a-), tres bs, etc.

El resultat és un graf plenament connectat amb 102 lletres/nodes i per tant, amb 5.152 connexions (correlacions entre signes), un valor màxim de connexió de 0.7, un mínim de -0.11 i amb un miler de connexions per sobre d’un 0.1 i gaire bé la meitat amb valor negatiu.

102 glifs, 5.152 connexions disposats amb el ForceAtlas.
Cliqueu per gràfic de mida real o alternativament en format svg.

La disposició espacial del graf és francament pobre. En el cas anterior, jugant amb els paràmetres encara s’havia pogut trobar una configuració raonable, en aquest, i probablement degut a la influència dels valors negatius, els algoritmes oscil·len salvatgement entre unes disposicions estiradíssimes, que fan de molt mal llegir o únic amàs molt regular; finalment, ha semblat millor capturar un dels moments intermedis.

A l’extrem dret tenim majoritàriament les vocals sense accent, i en el grup principal es poden discernir sense massa esforç a la banda esquerra les consonants continues, a la dreta les vocals accentuades i en mig les oclusives. De fet, no és pas gaire difícil veure que les ternes de variants introduïdes artificialment en el corpus sí s’ajunten entre sí en el graf. En l’extrem dret, tenim les variants de a, e i o. En la part dreta de l’amàs gran, troben les is i en la d’abaix, les us. En l’extrem esquerra del graf, les ms, ns, ss, ls, rs, en la part dreta les és, òs, ós. Mentre que en la part central les oclusives són les que mostren una agrupació més laxa. El que no fa el graf és individualitzar els triplets de cada lletra. En conjunt, doncs diríem que encara que en la disposició espacial el dibuix és força desagraït, sí sembla evident que la organització quantitativa mesurada per la correlació de Pearson sí és capaç de reflectir realitats de caire filològic. Mirem a veure que tal respon amb les mesures de modularitat.

P=2. 3 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb el coeficient més elevat, es detecten tres grups que corresponen a les us, excepte les d’accent tancat (en vermell), a la resta de vocals més les ys i les qs però sense les ós i les ïs (en verd) i en blau la resta, tot consonants tret de les excepcions enumerades.

P=1. 5 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb el valor per defecte de 1. l’algoritme detecta 5 grups. En vermell els triplets de n,l,s,u,ü,ï i ú. En rosa, els de m,d,b,r,t,x,q,g,ó,f i dues de les z. En verd, els de p,v,c,h,ç,i,j i una ú. En groc un grup dedicat a les ys. I en blau els triplets de les altres vocals. És de remarcar que en les agrupacions de detectades es mantenen junts els triplets de les variants, tret d’unes poques excepcions.

P=0.9. 7 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

A 0.9, es detecten 7 grups. En blau clar els triplets de n,r,l,s,u,ü,ï, dues de les ús. En rosa, les d,m,p,t,f,b i dues de les zs. En blau fosc, les v,c,h,j,ç,à, una de les z i una de les ú. En verd fosc, els triplets de g i q. En groc els de y i é. I en verd clar els de les vocals a,e,o a l’extrem, i i,è,ò,í a tocar de l’amàs gran. Els triplets es continuen mantenint agrupats, tret dels cas de les zs i ús, que són lletres certament poc freqüents.

Si mirem de resumir la seqüencia que continua, direm que les tripletes es mantenen unides fins el factor de 0.4.

P=0.8. 8 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.7. 10 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.6. 12 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.5. 15 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.4. 17 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Aquí tenim 17 grups on 10 d’ells corresponen als triplets aïllats de: l,r,m,v,c,t,f,b,p, i y, més un grup per les ss i una de les ús. Un gran grup per les a,à,ç,e,é,è,i,í,o,ò i una de les js.  Un per les d i zs. Un per les ï,n i una de les ús. Un per les ó i x. Un per les g,q i un per les l,u i ü. I finalment, un per les h, més un parell de js i una ú.

Per sota de 0.4, continuen creixen el nombre de grups però a costa ja de partir els triplets de variants.

P=0.3. 20 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.2. 23 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.1. 30 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Resumint i simplificant: mesurant per el grau de correlació de Pearson, en el cas el català ‘iberitzat’ es poden arribar a detectar aïlladament les variants de les consonants continues i de les labials, les vocals es detecten com a grup, no individualment i les velars es detecten però no es distingeixen entre elles. No està gens malament, però cal recordar que això passa en un corpus amb un grau de dispersió menor que el que es vol estudiar, i per tant, potser menys afectat per el soroll d’una pluralitat d’evidències disperses. Mirem d’anar més enllà.

Dispersions i confiances

Fins aquí, hem estat fent proves amb un corpus, el català, de poc més de 30.000 lletres, que en les seves dues caracteritzacions estudiades (l’original, amb majúscules i minúscules i 58 glifs, i l’iberitzat, sense caixa diferenciada, sense espais i amb fins a tres variants de cada lletra, amb un total de 102 glifs) té un grau de dispersió menor que l’ibèric que per un signari de 200 glifs només disposa d’un corpus de 25.000 lletres. Un dels efectes de la dispersió, si estem utilitzant la correlació de Pearson és que molts valors esdevenen correlacions negatives i a més fets a partir de molts pocs valors. En la part final de l’apunt anterior es va comentar que s’havia intentat un heurisme conegut per tal de mitigar aquest casos però que el seu efecte no havia estat satisfactori. Ara és el cas d’incorporar les millores pensades en aquest aspecte.

La idea general, de nou és força simple: valorem cada factor de correlació entre dos glifs o lletres segons el nombre de parelles comuns entre les que apareguin.

Podem visualitzar-ho com dos segments rectilinis, un per cada lletra. Suposem que el glif X, es detecta entre 20 parelles de signes i que el glif Y ho fa entre 30 i que ho fan conjuntament en 10 parelles. En aquest cas, el nombre total de parelles amb evidència serà de 40 (20+30-10), o geomètricament: els dos segments es sobreposen en 10 unitats. Imaginem ara un altra cas, on els glifs A i B es detecten cada un entre 20 parelles, però amb 18 d’elles comunes. El factor de correlació entre XY, tenia un 25% de factors en comú (10 de 40) i el de AB en tindrà un 81% (18 de 22). Sembla raonable pensar que si dos glifs apareixen entre les mateixes parelles de signes, la seva mesura sigui més ‘fiable’. Entenguis bé, la correlació pot ser alta o baixa, el que estem introduint és un factor de ‘confiança’ en la mesura. De manera que podem multiplicar la correlació de Pearson entre XY per el percentatge de parelles comunes, diguem-li E; sent un factor normalitzat a 1, el seu efecte numèric serà deprimir el valors però no en canvia ni el rang ni el signe.

Però si ho pensem una mica més, també veurem que no hauria de tenir el mateix valor o generar semblant confiança dos percentatge de parelles comunes iguals (per exemple entre CD i entre VW) si la primera es basa en tenir 2 parelles en comú i la segona en tenir-ne 30. Eś a dir, la magnitud també hauria de tenir-se en compte, i per poder-la normalitzar entre 0 i 1, podem escalar-la segons el valor màxim que es doni en el corpus, diguem-li: Q.

Així que tenim dos coeficients de ‘confiança’, el percentual E i el de quantitat Q, una manera típica de combinar dos factors normalitzats, i molt emprat en problemes classificació estadística, és la anomenada F-mesura, diguem-li, F, que les combina així: F=(2EQ)/(E+Q). Funció que dibuixa una superfície corba on només es donen valors alts si els dos factors, E i Q són alts.

La idea va ser doncs multiplicar la correlació de Pearson per aquests factors, fent una primera prova per E, i una de posterior per F. En teoria, la de F hauria de ser preferible (la de E ignora les magnituds i pot ser fruit d’una evidència marginal), però aquestes primeres temptatives sobre el corpus ibèric van revelar que E s’ajustava millor a les evidències conegudes…?! Raonant sobre aquesta aparent contradicció, l’explicació que sembla més probable és: la dispersió de les dades fa que moltes correlacions tinguin un nombre baix de parelles comunes, és a dir de factors Q baixos, de manera, que tot i haver-ho dissenyat per mitigar els efectes de la dispersió, la mesura F l’hi torna a donar un paper predominant; d’aquí probablement que l’ús de E sembli tenir millors resultats en la pràctica.

Però l’ús d’aquests factors de ‘confiança'(ja sigui E o F) té un efecte profund sobre el graf resultant, ja que si dos glifs no tenen cap parella en comú, la correlació serà de 0, i per tant no hi haurà connexió entre ells. A més els valors es veuran disminuïts per els coeficient de confiança, i per acabar-ho d’adobar, en les probes s’ha vist que el programari gephi no discerneix en les connexions més enllà de les mil·lèsimes, de manera que finalment s’ha dissenyat un sistema que permeti filtrar les connexions per sobre d’un cert valor de tall. Tot plegat, fa que ens podem trobar amb nodes sense cap connexió (pensem en els casos dels hàpax), així que a partir d’ara tindrem grafs amb connexions positives però baixes i de topologia no del tot regular (això es posa interessant…).

Començarem per comparar com es comporten E i F en el corpus català, i com que l’objectiu és aplicar-ho després al corpus ibèric, ho farem amb la seva versió ‘iberitzada’ de tres variants per lletra.

Confiança E

Provem primer amb el factor de confiança E, (i per defecte, amb el factor de tall del propi programari de gephi, 0.001). El resultat és un graf amb 99 lletres en comptes de les 102 ‘variants’ que teníem abans (s’han perdur per manca de connexions positives superiors a 0.001, dues ús i una ó) i ‘només’ 1.297 connexions en comptes de les més de 5.100 dels grafs plenament connectats que hem estat provant fins ara. Les connexions es mouen entre un màxim de 0.46 (aquí es veu l’efecte depressiu de la mesura de confiança) i el mínim prefixat de 0.001 amb poc més de 60 connexions per sobre del 0.1 i una gran majoria en valors baixos.

99 glifs, 1.297 connexions positives i superiors a 0.001 del corpus català iberitzat i modulat per el factor de confiança E i disposats amb el ForceAtlas.
Cliqueu per gràfic de mida real o alternativament en format svg.

Com es pot observar, a diferencia del graf anterior, aquest presenta una estructuració força més clara i fins i tot es poden apreciar ternes de variants aïllades. L’agrupació de la part superior correspon a les consonants (amb n,s,m,r,t,d,v i l en la part nuclear i f,b,p,q,h i j en la corona superior, i  z,y,ç,x i ó,u,ï disposades en franja en la part central del graf), mentre que el gruix de les vocats es troben en la part inferior i no agrupades en un únic amàs, tot i que sí es distingeix clarament l’agrupació de les variants de a,e, i o, i aïlladament, les i , les ü i finalment un grup dispers formats per les variants de è,é,à,ò i í. Sembla innegable que l’estructura espacial del graf reflecteix informació de natura alfabètica Passem a la Modularitat.

P=2. 5 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

En el nivell d’agrupació més alt (P=2) tenim un grup amb les ternes de u i ü (en groc), un per les de la q (en lila), un ‘estrany’ només amb una variant de ï i una de ú (en vermell), i dos grups grans: un de consonants (en verd) que les conté totes, tret del grup de les q i una variant de ç però que també abraça les dues ós. una variant de ï i les ys. I finalment un grup de vocals (en blau) que també les conté totes tret de les ja esmentades en els altres grups però també incorpora una variant de ç.

P=1. 6 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb el factor P a 1. l’estructuració anterior es manté idèntica però apareix un grup partint les consonants (en vermell) que diferencia les ternes de m,r,s,l,n amb una variant de z i una de ï; de nou, categories d’àmbit fonètic detectades numèricament gaire bé de manera exacta.

P=0.9. 8 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Baixant P a 0.9, apareixen nous grups de ternes. Es mantenen els grups de les us, el dels qs i l’estrany d’abans (en morat, blau clar i verd-groc) , però els altres grups es veuen alterats. En les vocals apareix un grup per a les ternes de a, e, i, o i è (en vermell) i la resta del grup vocàlic d’abans (ara en verd) s’expandeix per incorporar la terna de les y i dues de les ç. I en la part de les consonants, si abans s’havia partit en dos, ara ho ha fet en tres. El gros, (abans en verd ara en ocre), un (en rosa) per les ternes de ts i ss més una variant de f,z, i g, i un tercer grup consonàntic amb les ternes de l,m,n,r i una variant de j i una de ï.

P=0.8. 8 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb P a 0.8 es manté la divisió en 8 grups. El canvi principal és que el grup que abans tenia les as,es,etc (en lila) ara incorpora també la terna de les és i dues de les às. I en la part consonàntica el grup de ts i ss (en blau fosc) es perfila millor reduint-se a les seves ternes i una variant aïllada de z.

P=0.7. 10 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.7 eleva en nombre de grups fins a 10. En les vocals, el grup (en rosa), de les as i es, torna a perdre les és i às que havia guanyat en el nivell anterior, i l’altre grup de vocals (en vermell clar) torna a perdre les ys i una variant de ç. Es mantenen els grups de les us, les qs i l’estrany, mentre que els nous grups apareixen en les consonants. Ara tenim un grup (en vermell) per la terna de les ss mes una de les zs, un per les rs (en groc), un per les ternes de m,n i l (en blau clar) i dos grups grans més dispersos: un en blau focs amb les ternes de d,c,p,b,j i dues de les variants de f i de g. i l’altre (en ocre) amb les ternes de t,v,x,y, parelles de çs, ós i zs i una variant aïllada de f i de g.

P=0.6. 15 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Amb P=0.6 el nombre de grups creix fins el 15, però comencen a aparèixer agrupacions inesperades. Els grups petits i els de les vocals es mantenen (tret del de les accentuades que perd una variant de à), però entre les consonants, si bé es continuen detectant grups basats en ternes, apareixen un parell de grups no menors que agrupen ‘menes’ de variants: en taronja tenim un grup amb la variant sense marca de b,c,d,f,g,h i j, i en verd clar un amb les variants del signe + de b,c,d,f,g,h més una variant de ç. Amb tot, la resta de consonants sí presenten agrupacions més a o menys clares. Un grup (en rosa) amb les ternes de l i m. El grup de les ss i una de les zs. Un per les qs, un per les ps, un per les ns, i un grup amb les  ys, ts més una variant de c,f,i g. Ara, que la modularitat detecti agrupacions per menes de variants és extraordinàriament significatiu, tota vegada que és una regularitat introduïda artificialment en el procés de creació de tals variants, ja que s’ha mirat de tenir quantitats similars de cada mena (en el moment de convertir de lletres a codis, per a cada lletra s’ha llençat – metafòricament parlant – un dau de tres cares i s’ha assignat la variant d’aquella lletra en particular al seu resultat). En altres termes, que la modularitat detecti aquesta regularitat induïda, vol dir que ha de ser superior a la pròpia de les distribucions, i si tenim en compte que aquesta regularitat no afecta a la aleatorietat de la seva distribució, això vol dir que estem mesurant soroll, caçant mosques – metafòricament parlant – i que incrementar la sensibilitat de la modularitat aportarà més grups però no més informació, i efectivament això és que el tenim per sota de P=0.6.

P=0.5. 17 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.4. 18 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.3. 21 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.2. 24 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.1. 31 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Podríem pensar que és una limitació pròpia del mètode, però vèiem que en la mesura per correlació de Pearson ‘pelada’, si es podien arribar a detectar un nombre no pas petit de tripletes sense que la regularitat de tenir parts iguales de cada mena de variant semblés afectar. És llavors que revisant aquest darrer pas, que s’ha considerat que de fet, hem aplicat un canvi doble: emprar el factor de confiança E, que certament disminueix els coeficients, però també l’eliminació de coeficients inferiors a 0.001 per la limitació de l’eina de grafs que estem fent servir, però potser hem anat massa lluny, i la informació de les correlacions negatives sí siguin necessàries per la detecció per la modularitat. De manera que cal provar que passa si només evitem les connexions entre +0.001 i -0.001. Si feta la prova, la modularitat presenta la mateixa limitació, indicarà en principi que hem topat amb un límit del mètode d’aplicar el factor E (a menys que sigui l’atenuació del coeficients la responsable, però costa creure que sigui un problema d’escalabilitat).

El resultat és un graf amb els mateixos 99 nodes/variants però amb 1.628 connexions. El fet de tornar a incorporar connexions negatives aporta el problema de l’estabilitat de les disposicions per ‘distribució de forces’, per això, aquest cop ens hem decantat per la variant ‘regular’ de l’algoritme.

99 glifs, 1628 connexions del corpus català iberitzat i modulat per el factor de confiança E i disposats amb el ForceAtlas.
Cliqueu per gràfic de mida real o alternativament en format svg.

Un simple cop d’ull permet veure que la majoria de ternes es disposen certament properes entre elles, encara que no individualitzades (com ja vèiem en la mesura per Pearson pur). Per no repetir la descripció detallada de l’evolució dels resultats de la partició per modularitat, diem que tot i tenir 400 connexions negatives més que el previ, respon de forma gaire bé idèntica al anterior. Entre P=2 i P=0.5 detecta agrupacions clares de ternes de vocals i consonants.

P=2.. 5 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=1.. 7 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.9.. 6 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.8.. 8 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.7.. 10 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.6.. 12 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

I quan arriba a 0.6 apareixen els mateixos grups no de ternes sinó de ‘menes de variants’, i així continua fins P=0.2, mantenint bé sí algunes ternes però amb presència de grups espuris, i a P=0.1 es trenquen també algunes de les ternes que s’havien mantingut estables en tota la gradació.

P=0.5.. 17 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.4.. 20 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.3.. 19 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.2.. 23 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.1.. 30 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

O sigui, queda clar que no és el fet d’incorporar o no les connexions negatives les que produeix aquest efecte de ‘barrera’ en la modularitat si apliquem el factor de confiança E.

Confiança F

Provem ara doncs el factor F (amb connexions superiors a 0,001, ja que sembla que no afecta de forma significativa la pèrdua de connexions negatives i sí produeix unes disposicions espacials més expressives) i si ens tornem a trobar amb aquest fenomen en la modularitat, caldrà pensar que es tracta d’un efecte de la depressió en la magnitud del valor de les connexions que provoquen aquests factors de confiança. En aquest sentit, el graf redueix encara més el nombre de nodes/ lletres i el deixa a 94 ja que s’han quedat sense connexions ï-,ó-,z,z+,z-,ú,ú+,ú- (com dèiem, el factor F sols dóna valors alts si E i Q són alts, i per tant, en general te un efecte depressor més intents) i amb un total de connexions superiors a 0.001 de 1.274, i és el següent:

94 glifs, 1274 connexions superios a 0.001 del corpus català iberitzat i modulat per el factor de confiança F i disposats amb el ForceAtlas.
Cliqueu per gràfic de mida real o alternativament en format svg.

Quina diferència!!! Aquest graf d’aspecte anodí, mirat amb cura revela ser extraordinari. No sols presenta la més clara separació entre vocals i consonants (i entre menes de vocals i de consonants) calculada fins ara, és que presenta TOTES les ternes de variants correctament agrupades i properes entre elles (tret de la variant ò que està lleugerament més allunyada de les seves companyes). Quelcom més que remarcable. Aquí tenim un corpus de 30.000 lletres, amb un signari de 102 glifs però 34 caràcters, reduït a un esquema que en retrata perfectament més del 90% en la seva disposició espacial calculada exclusivament a partir de les semblances entre les seves distribucions. Només per aquest graf ja paga la pena tota la feina feta fins aquí!

Però mirem si la modularitat pateix o no d’aquell efecte barrera que es donava amb el factor E. Per tal de no repetir la descripció de cada nivell de granularitat es fixarem especialment en si les grups que marca parteixen o no ternes de variants.

P=2.0. 5 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

A P=2, tenim 5 grups, separació vocals/consonants en grups grans, grups petits coherents, 1 terna partida (la de la ò), 1 terna individualitzada.

P=1.0. 7 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=1. Igual, amb més grups coherents, 1 terna partida, 1 terna individualitzada.

P=0.9. 7 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.9, mateix nombre de grups, partició lleugerament diferent, 1 terna partida, 1 terna individualitzada.

P=0.8. 8 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.8, 8 grups, tots coherents, 1 terna partida, 1 terna individualitzada.

P=0.7. 12 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.7, 12 grups, tots coherents, 1 terna partida, 1 terna individualitzada.

P=0.6. 15 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.6, 15 grups, tots coherents, 1 terna partida, 5 ternes individualitzades.

P=0.5. 16 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.5, 16 grups tots coherents, 1 terna partida, 7 ternes individualitzades.

P=0.4. 19 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.4, 19 grups tos coherents, 1 terna partida, 9 ternes individualitzades.

P=0.3. 23 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.3, 23 grups, 5 ternes partides, 11 ternes individualitzades.

P=0.2. 26 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.2, 26 grups, 5 ternes partides, 14 ternes individualitzades.

P=0.1. 31 grups.
Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

P=0.1, 31 grups, 8 ternes partides, 9 ternes individualitzades.

Ni rastre de les agrupacions per menes de variants, i a més, un comportament magnífic fins els nivells de granularitat més elevats (fins 0.3 es manté una única terna mal detectada, que ho és en tots en nivells provats i que fa pensar en una situació particular com també presenta la seva disposició espacial lleugerament desviada) i tot i que les deteccions directes de ternes aïllades per modularitat són modestes, és a dir, que la majoria ajunta en un mateix grup més d’una lletra, el fet rellevant és que les particions rarament trenquin les ternes, i per tant dibuixin grups que es poden analitzar bé.

Arribats en aquest punt, queda clar que la correlació de Pearson modulada amb el factor de confiança F i eliminant les correlacions negatives dóna en aquest corpus uns resultats extraordinaris. Ara, la pregunta és: com es comportarà amb el corpus ibèric que és bastant mes dispers? Però aquest apunt ja s’ha fet massa llarg de manera que el tanquem i n’obrirem un altre per comentar-ne els resultats a mida que es vagin produint.

– Actualització 2017-III-14 –

Encara que ja s’està escrivint el tercer apunt d’aquesta inesperada sèrie, ha semblat convenient afegir el que segueix a aquest per què expandeix els seus continguts i per claredat en l’exposició.

Les divisions per modularitat que s’estan emprant en aquestes proves generen una gran quantitat d’informació, que resulta difícil de captar en conjunt. El dibuix del graf per codis de colors és molt útil per una partició en concret, però no per una mirada en conjunt. Rumiant com fer visible aquesta superposició de particions, s’ha dissenyat un mètode que pot ser d’utilitat en la problemàtica concreta que estem tractant aquí.

Per variar, la idea és simple: Si fem un conjunt concret de particions,  ens podem situar en cada un dels nodes del graf, apuntar amb quins altres nodes es veu ajuntat en cada una d’aquestes particions i així construir una llista de nodes ‘propers’, cada un amb una quantitat concreta de grups on es documenta.

En el cas que ens ocupa, hem fet fins a 11 particions, el que farem serà presentar la llista de nodes de cada graf d’aquest apunt, i per cada un, al seu costat els nodes més ‘propers’ (es a dir, de tota la llista, sols els que tenen el nombre més alt de particions en comú). En vermell, anirà el nom del node, i en negre els nodes acumulativament més propers (a més, la mida del font reflectirà també aquesta quantitat).

Per el primer graf, el del corpus en català original, el resultat és:

Mapa d’acumulació de grups per modularitat del corpus català, per coeficient de Pearson.

En aquest primer cas, en no tenir variants a detectar la utilitat del mapa és molt relativa. Sí però permet objectivar que les lletres més properes a una determinada sí tenen la mateixa caixa i que segueixen més o menys la separació vocal/consonant.

El segon, el del corpus iberitzat i connectat per la mesura de Pearson, tenim:

Mapa d’acumulació de grups per modularitat del corpus català iberitzat, per coeficient de Pearson.

Aquí sí que ja podem avaluar si cada variant té o no les altres en el grup de nodes més ‘proper’. En aquest cas, per exemple, es fa evident que les vocals resulten indiscernibles entre elles per aquest mètode.

La tercera prova feta ha estat el mateix corpus però amb el factor de confiança E i connexions superiors a 0.001, el seu mapa és:

Mapa d’acumulació de grups per modularitat del corpus català iberitzat, per coeficient de Pearson, i amb factor de confiança E i connexions > 0.001.

Aquí la separació millora, (les vocals per exemple, es diferencien millor, tot i que la a i la e continuen ajuntant-se) però hi han mancances evidents en les consonants.

Afegir-hi els factors negatius ha estat la quarta prova feta, i el seu map resultant és:

Mapa d’acumulació de grups per modularitat del corpus català iberitzat, per coeficient de Pearson, i amb factor de confiança E i connexions > 0.001 i < -0.001.

Que presenta les mateixes mancances que la prova anterior amb només factors positius.

La darrera prova ha estat fet servir el factor F, també amb connexions > 0.001. El mapa resultant és:

Mapa d’acumulació de grups per modularitat del corpus català iberitzat, per coeficient de Pearson,  amb factor de confiança F i connexions > 0.001.

On podem comprovar que efectivament, gaire bé totes les variants tenen entre els nodes més propers els d’altres variants. La indefinició, (en el sentit que al costat de nodes de variants també trobem nodes aliens) es concentra en algunes de les variants de: a,c,ç,ï,j,n,ò,ó,s,t,u i x. En total, dels 94 glifs del graf, 24 presenten alguna vacil·lació, o dit altrament, un sistema de detecció automatitzada de variants, en aquest corpus, en detectaria correctament com a mínim un 75%.

 


Notes

  • [1] A nivell estructural, cathalaunia.org sembla un creuament entre un wiki i una base de dades. Una forma aproximada i incorrecta seria definir-lo com una base de dades XML amb una presentació web, una de més correcta seria dir que és un programa que pot exportar els continguts que presenta en format XML.
  • [2] Quelcom que els analistes i programadors, i en general al gent del món de la computació fa, com diem, de manera constant i natural. A les solucions genèriques se les acostuma a descriure com ‘lliures de domini’ per expressar que funcionen sense aportacions de cap domini del coneixement aliè al matemàtic. Altra cosa és que a nivell pràctic les tècniques més fructíferes usualment neixin del creuament de tècniques genèriques o ‘lliures de domini’ amb coneixements del ‘domini’ dels problema a tractar. Un exemple relativament recent: en el camp del tractament informatitzat de la veu humana, no s’ha avançat de forma significativa en la seva síntesi fins que no s’han emprat models que reprodueixen els sistemes fonadors biològics. De nou, el principi general i la seva particularització (variant els paràmetres que defineixen el model ens podem aproximar més o menys a la ‘particularitat’ de cada una de les veus existents en la natura)
  • [3] Una altra millora ha estat l’eliminació d’epigrafies duplicades. En el corpus inicial hi havia aproximadament un 1% d’entrades que eren relectures o simples duplicacions d’altres entrades. En l’actual, han estat eliminades (tot i que no es descartable que n’hagi escapat alguna).
  • [4] Com que les connexions no tenen perquè formar una mètrica, la seva disposició no té per què ajustar-se a les restriccions d’un espai euclidià (per exemple: tres punts formen sempre un triangle i en un tal espai els angles interns hauran de sumar 180º, però si en comptes de longituds estem parlant de connexions, això no s’ha de complir).

Variabilitat sígnica de l’ibèric nord-oriental (3).

$
0
0

En l’apunt anterior ens havíem quedat  a les portes de crear un graf a partir del corpus en ibèric nord-oriental amb un node per cada glif i connectats segons el grau positiu de correlació de Pearson de la seva distribució, modult per el factor de confiança F allí descrit[1]. El signari ibèric emprat defineix 207 signes però 6 són considerats separadors (línies verticals de punts), 4 són marques metrològiques i 3 no figuren el corpus, aixo deixa un signari hàbil de 194 glifs, xifra que es veurà encara més reduïda per els cassos sense connexions/correlacions superiors a 0.001[2]. El graf resultant (disposat amb l’algoritme ForceAtlas) presenta 155 nodes amb 1603 connexions.

El corpus ibèric 155 glifs, 1603 connexions.
Cliqueu per imatge a mida gran o en format svg.

Un graf que il·lustra molt bé la complexitat del problema. Per una banda, en una mirada superficial i segons el desxiframent actual, es poden percebre tres grups: a l’esquerra tenim les vocals, en la part més alta, un de consonants  no oclusives i en la part dreta i poc dibuixat, n’hi ha un que és un autèntic tuttifrutti (potser nascut del pes de les evidències marginals?). Però més enllà d’aquestes agrupacions el graf presenta un alt nombre de nodes dispersos, tot i que la seva distribució està lluny de semblar aleatòria i de fet, planteja algunes possibilitats interessants. Fem un breu repàs.

Entre les vocals i les consonants contínues tenim agrupats tres variants amb forma de V i Y (codis 62,63 i 65 en el signari de cathalaunia) que per posició suggereix que podem estar davant d’un cas de doble sonoritat i que caldria desdoblar-les en una m? i una vocal (o/u?), o potser un sil·làbic?. També resulta estrany que si bé en general les vocals presenten una localització força clara, les is, tenen també variants en la dispersió del quadrant inferior/dreta. En la part central i aïllada dels tres grups més clars, figura el signe Ba (el més freqüent), amb dos Tis aprop, probablement aquesta disposició sigui provocada per el pes dels numerals en el corpus. En la línia de les 7h (com si el graf fos un rellotge) tenim un grup de tres signes Bo/Ta. En la de les 6h, trobem tres Pis. Entre les 4 i les 5h tenim fins a nou signes Ke, i ben curiosament, al seu costat el signe Ba corbat, que ens faria pensar si no hi han casos en que caldria llegir-lo com un Ke. Al costat dels Kes i fins les 3h trobem fins a 6 signes Be. Entre les 12 i les 3h tenim l’amàs dispers que dèiem, però en la part exterior de les 3h tenim tres variants de Ka, i en la de les 2h quatre Tes junts.

En conjunt, queda clar que tot i que a semblança del corpus en català els grups de consonants contínues i de vocals fan de fàcil delimitar, el problema està en la resta de signes que es comporten de manera ben diferent i que fa pensar efectivament en una natura dual, sil·làbica, funcionant com a consonant a una banda i com a vocal en l’altra. Sent la idea base comparar entre quins signes apareixen els glifs, queda clar que una escriptura alfabètica amb només dues menes de signes, serà més fàcil de detectar tota vegada que l’alternança és la pauta a esperar, mentre que la presència de signes compostos, multiplica les possibilitats, que sembla que és el que reflecteix el graf. Amb tot, la complexitat del graf fa pensar en alguna raó afegida, ja que no sembla evident que la presència de signes sil·làbics per se hagi de produir un graf més dispers…

Això per el que fa a la distribució espacial, provem ara amb l’altra eina, la modularitat, però en comptes d’intercalar les onze particions/mesures com hem fet en l¡apunt anterior, el que farem serà deixar-les en nota[3] i fer servir el seu mapa resum (tècnica que s’ha descrit en una actualització del l’apunt anterior).

El resultat és força variat i el que farem serà marcar amb verd els glifs per els quals entre els glifs més propers – segons modularitat acumulada – es detecti una majoria de glifs equivalents segons el desxiframent actual, i amb vermell els que no sigui així, és a dir, els que resulten més interessants…!

Mapa de glifs propers per modularitat acumulada
(els nombres indiquen la quantitat d’agrupacions compartides).

En verd els que presenten majoria de glifs acords amb el desxiframent actual..
En vermell els que no.

Els comenten per ordre.

  1. En primer lloc el glif que sembla una E inclinada a l’esquerra (codi 41, 6 entrades) sembla ser una I.
  2. El signe espiga de 2 branques (codi 43, 17 entrades) segons això seria una O.
  3. Curiosament una de les Os de 2 travessers (codi 51, 5 entrades) sembla confondre’s amb una E, tot i que figura com a companya dels altres signes O…
  4. En els dos signes de L (codis 56 i 57, 374+537 entrades) apareixen com properes i formant un grup coherent entre ells amb un signe M (codi 60, 99 entrades) i un glif com una L especular (codi 59, 8 entrades).
  5. El signe de forma de F (codi58, 29 entrades), apareix com una E.
  6. La A amb forma de R oberta  (codi 61, 85 entrades) sembla funcionar com una O.
  7. El signe Ba (codi 83, 717entrades) situat al centre del graf no presenta cap glif proper amb sentit evident tot i que forma un grup coherent amb quatre glifs més: un Te (codi 103, 34 entrades), un Ki (codi 193, 18 entrades), una nasal (codi 239, 14 entrades) i un de desclassificat (codi 213 , 2 entrades).
  8. El Ba corbat (codi 84, 26 entrades) que per posició està proper a signes Ke, per modularitat ho esta de signes Ka, un altre exemple de classificació contradictòria.
  9. El Ta amb forma de creu de Sant Andreu (codi 87, 480 entrades), també en posició central en el graf, s’associa majoritàriament amb signes Ka,
  10. Tot i que els signes Ka més habituals semblen agrupar-se de manera correcta, la variant amb el traç afegir a l’esquerra (codi 91, 77 entrades) forma un grup coherent amb dos Tes (codis 101 i 102, 32+45 entrades) i un signe Be (codi 183, 1 entrada).
  11. Un altre grup estrany però coherent el formen dos signes Be (codis 95 i 186, 13+43 entrades), dues Is (codis 145 i 197, 12+22 entrades) i un signe Bo (codi 212, 4 entrades).
  12. El signe Te amb forma de rombe partit per una línia vertical (codi 107, 20 entrades) s’agrupa amb glifs de sibilants.
  13. Un dels grups coherents però sense sentit evident més grans està format per 8 signes (codis 127,219,206,203,195,189,161 i 128, 1+8+20+24+62+3+10+1 entrades).
  14. Un de més petit ajunta un signe Pi (codi 141, 4 entrades), una Be (codi 174, 3 entrades) i una O de quatre travessers (codi 185, 3 entrades).
  15. Les sibilants s’ajunten de manera quasi perfecte tret de d’una variant de la de forma de M (codi 142, 91 entrades) que ho fa amb les sibilants simples.
  16. Una hàpax de Te (codi 143, 1 entrada) s’ajunta amb signes Ti, en un grup que comentarem un xic més avall).
  17. Una variant de S poc habitual (codi 144, 19 entrades) amb tres signes Ka ben documentats (codis 88,89 i 90, 140+23+227 entrades).
  18. Un grups curiós està format per dos Kes poc freqüents (codis 169 i 204, 3+4 entrades) i dos Kis (codis 194 i 196, 8+23 entrades).
  19. Una tripleta també aparentment espúria esta formada per una I ben documentada (codi 180, 23 entrades) , un hàpax de Ke (codi 129, 1 entrada)  i un Tu poc freqüent (codi 233, 22 entrades) .
  20. El grup esmentat en el punt 11, apareix però en comptes d’un signe Bo, presenta una tercera I al grup (codi 182, 18 entrades).
  21. El signe Bo de sis puntes (codi 205, 58 entrades) apareix amb dos signes To (codis 207 i 209, 38+86 entrades).
  22. Un dels signes To (codi 210, 25 entrades) de branques inclinades s’agrupa amb un signe Ku (codi 236, 111 entrades).
  23. Peró el més curiós és que l’altre To que té una base puntual (codi 211, 25 entrades) s’ajunta amb un grups de signes Ti, amb els quals comparteix figura (de fet hi han variants de Ti – no registrades en el signari – que dibuixen l’asta no per baix sinó en la part alta del traç medial). De manera que potser sí calgui considerar-lo una forma de Ti i no de To.
  24. Un altre binomi inesperat és el format per un signe Ko (codi 217, 39 entrades) i un signe rar, una espiga de tres ramificacions (codi 240, 8 entrades).
  25. I el signe Ko semblant a l’anterior però sense traç medial, i encara més ben documentat (codi 220,366 entrades), es veu inclòs en un grups de tres signes Ku, (codis 236, 237 i 238, 111+101+80 entrades) més el signe To del punt 22.
  26. Hi ha un grup coherent de fins a 5 signes Tu que incorporen però dues excepcions, un signe Te(codi 222, 2 entrades) i un signe M? (codi 243, 5 entrades).
  27. El signe To en forma de V invertida (codi 235, 19 entrades) es veu ajuntat amb dos signes Bu (codis 224 i 225, 13+9 entrades). En la situació espacial es veia situat a prop del seu homòglif de valor Ka (codi 92, 8 entrades) i per tant, potser es tracta d’una lectura incorrecta.
  28. Un signe inusual i interpretat com una nasal (codi 241, 3 entrades) es veu però consistentment agrupat amb sibilants. Potser una altra assignació a contemplar?
  29. I finalment, un encert inesperat. Un signe com una R especular (codi 248, 10 entrades) usualment interpretada com una R es veu efectivament agrupat a latres glifs de R.

En les agrupacions per modularitat, tenim doncs fins a 103 glifs de 155 correctament agrupats, és a dir, un 66% d’encert. I el terç restant aporta algunes possibilitats de relectura que caldria verificar, en concret, els punts 1, 2, 3, 5, 6, 8, 12, 17, 23, 27, 28  de la llista anterior. Cal entendre que en ser una anàlisi estrictament quantitativa, ha de ser en tot cas la Filologia la que dictamini l’encert o l’error de tals possibilitats.

En conjunt, doncs tenim una barreja d’encerts i d’errades en la mesura del corpus ibèric segons la correlació de Pearson modulada per el factor de confiança F, expressada com una xarxa i analitzada per la seva disposició espacial i l’estructuració de les agrupacions per grau de modularitat.

Coda

On ens deixa aquest experiment? Doncs amb una certa ambivalència. El mètode descrit funciona perfectament en un corpus alfabètic com és el del català, i per tant, buida de contingut la primera objecció sistèmica que ens fèiem al començar (la derivada del fet que lletres diferents poden tenir distribucions semblants), no per què sigui falsa (les agrupacions espacials de vocals i consonants ho testimonia clarament) sinó per què amb una anàlisi quantitativa els detalls entre les diferents distribucions tenen un pes suficient com per discriminar entre signes propers. Queden però les altres dues.

I el fet és que la mateixa mesura aplicada al corpus ibèric es mostra d’entrada, limitada. La dispersió de les dades segurament està introduint un nivell de soroll que supera el del ordenament natural de l’escriptura, i no es pot descartar que ho hagin més glifs de sonoritat múltiple per detectar i desdoblar (la segona objecció). Però segurament el factor principal sigui la dispersió deguda a la manca d’evidència (la tercera objecció) , tota vegada que es pot observar com la majoria de grups espuris i glifs mal situats per la modularitat estan formats per glifs molt poc evidenciats. Una altra consideració genèrica a fer és que probablement sigui apropiat canviar la idea inicial de considerar només els glifs immediatament al costat d’un signe determinat. En signaris alfabètics, l’alternança vocal/consonant hauria de ser la norma, de manera que si el signe és vocàlic, cal esperar que la majoria de parelles que l’envolten siguin consonants i viceversa si el signe és una consonant. Aquest esquema tant regular – i que tan be funciona en aquesta metodologia d’anàlisi – desapareix si tenim signes sil·làbics, ja que aquests podran aparèixer també tant abans com desprès i per tant això fa que les distribucions de les parelles que envolten a un signe determinat seran més complicades. Queda clar que cal seguir pensant, la bona nova és que certament, de vies a explorar no en falten…

En resum, i per tancar ni que sigui provisionalment aquesta inesperada minisèrie d’apunts, diríem que l’anàlisi quantitatiu del corpus (i en concret de les correlacions entre les distribucions dels glifs) es revela com una eina molt efectiva i amb un alt potencial d’ajut en l’estudi de l’escriptura ibèrica, amb la virtut estructural de ser completament objectiva.

 


Notes

  • [1] Per distribució entenem el recompte de entre quines parelles de signes es documenta cada un dels glifs del corpus. F és una F-mesura feta a partir del percentatge i la quantitat normalitzada de factors comuns entre dos distribucions.
  • [2] Els codis no presents en el graf son: 55, 64, 99, 100, 106, 117, 127, 128, 129, 130, 132, 133, 134, 135, 136, 137, 139, 162, 163, 164, 165, 168, 170, 171, 172, 175, 176, 177, 178, 179, 181, 188, 199, 202, 214, 215, 216, 218, 223, 229, 230.
  • [3] Els grafs de les particions per Modularitat del mapa-resum són:

    P=2. 3 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=1. 4 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.9. 7 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.8 8 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.7. 8 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.6. 10 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.5. 12 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.4. 14 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.3. 17 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.2. 25 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.1. 34 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.


2017-març a cathalaunia.org

$
0
0

Març ha estat un mes ibèricament pràctic, vull dir, pràcticament ibèric, vaja, pràctic i ibèric. En teoria, la idea era dedicar la primera meitat del mes a tancar el treball en el corpus Iberika i poder tornar a la tasca del Fons Cathalaunia ; en la pràctica, s’ha cruspit tot el mes i més que en vol.  Tampoc es tractava de tancar-ho del tot, només deixar les millores del corpus en un estat lo prou correcte com per no sentir el rossec de la feina pendent; doncs ni això. En teoria no s’havia de teoritzar sobre cap més aspecte de l’escriptura ibèrica, en la pràctica s’ha estat bona part del mes rumiant heurismes i procediments pràctics per definir el mapa de caràcters de l’ibèric nord-oriental algorítmicament. Anem al desglòs.

La secció Ibèrica i Romana ha vist elevar el percentatge d’entrades amb dibuix o esquema de la inscripció original fins el 85%. Com ja es va comentar, la idea és incorporar l’aspecte del text original per poder verificar la correcció (o si es vol , el grau de semblança) de la transcripció informatitzada que es presenta. És com una ‘cita’ però en gràfic: en comptes de dir que ‘tal diu tal a tal lloc’, aquí es mostra que ‘qual ha dibuixat això a tal lloc’ i/o que ‘tal qual ho ha fet altrament a tal altre’, tota vegada que cada imatge va enllaçada a l’entrada bibliogràfica corresponent a l’obra o article d’on prové. No deixa de ser el mateix que es fa en tot el web, donar dades, amb enllaços a fonts d’autoritat externes (bibliografies, enciclopèdies, museus, etc).

Aquesta tasca de verificació ha propiciat l’expansió del signari per tal de fer-lo encara més proper als originals del que ja era, i actualment presenta fins a 207 glifs diferents. Tampoc és l’estadi final, ja que hi han millores encara en cartera, però cada cop són de menor envergadura; per exemple: hi han més de seixanta glifs candidats a entrar, (la majoria detectats només en una o dues entrades), també n’hi han 3 dels 207 que finalment no s’han emprat, a més, hi ha encara un 15% del corpus per verificar i potser aparegui algun glif nou més, etc, etc. A la espera de definir quina serà la nova versió del signari, el que sí es fa en tot cas, és proporcionar la font iber.ttf amb l’estadi actual. A la que l’acumulació de canvis aconselli fer una nova revisió del signari també es proporcionarà una nova font (les versions són compatibles entre elles, ja que els canvis bàsicament, o afegeixen codis nous o en redefineixen de no emprats i per tant, són compatibles entre sí.

I per acabar-ho de rematar (o més ben dit, d’iberitzar) els amics de l’Institut d’Estudis Ibers de Terrassa van tenir l’amabilitat de programar aquest mes una xerrada en el seu curset anual sobre iberisme on es va poder comentar el funcionament de les eines de cerca del corpus ibèric de cathalaunia. Tenint en compte que la idea de fer el corpus nasqué precisament allí, fa anys, assistint a una xerrada de na Carme J. Huertas sobre codificació del signari ibèric, era una cita inevitable. A més, és un rar plaer, avui en dia poder gaudir d’un ambient de gent curiosa, participativa, amant de la temàtica i de ment oberta. Havent-hi anat unes quantes vegades (la gran majoria d’oient), no sabria dir si xalen més el ponents o els oients…

Aquest bloc, ha estat on s’ha visualitzat bona part de la tasca teorico-pràctica feta aquest mes.

  1. El fet d’haver ampliat el signari ha propiciat repetir el recompte de co-variants en una mateixa epigrafia que s’havia fet fa uns mesos (i que de fet, fou el detonant dels canvis haguts des de llavors). En el seu moment, es va constatar que la quantitat de variants d’un mateix caràcter era molt superior al que el desxiframent actual proposa (amb un màxim de dues variants) i es recomptaven casos de tres i fins quatre variants d’un mateix caràcter en una mateixa epigrafia. La reacció dels experts consultats fou de sorpresa, fins el punt de considerar-ho impossible i arribar a dir que havien de ser errors del corpus…! Com a resposta i per tallar d’arrel tota controvèrsia, s’incorporaren els esquemes de cada epigrafia i així tothom podrà verificar el grau de proximitat amb l’original. Doncs bé, un cop aproximat encara més a l’original i verificat un 85% del corpus, s’ha tornat a programar un recompte de covariants, i la magnitud de la variabilitat es manté. Els resultats del recompte s’han incorporat en una actualització al fons de l’apunt original, amb un pdf on poder consultar en línia cada un dels 397 casos d’entrades epigràfiques amb més d’una variant d’un mateix caràcter (286, si eliminem covariàncies ‘estétiques’), i s’ha fet notar que per el que fa a la manera de diferenciar gràficament les variants, l’allargament o adició d’un traç vertical inferior és quantitativament força més rellevant fins i tot que la marca dels signes del signari dual (l’adició d’un traç vertical central).
  2. El mes passat, en aquest bloc s’havia comentat un primer intent de classificació automàtica dels glifs ibèrics, però amb resultats poc satisfactoris, de manera que el que havia de servir per detectar les agrupacions de glifs, es reduí a un mètode per mesurar quantitativament l’abast de l’evidència de les agrupacions de glifs que proposen els filòlegs (un suport francament baix, tot sigui dit).
    En teoria, l’experiment havia fallat, en la pràctica, això esperonà més la curiositat per entendre els motius de tal fallada, i això ha propiciat una sèrie d’experiments per mirar d’entendre millor el problema i afinar les eines de mesura, de manera que els resultats han acabat convertint l’apunt del mes passat en el primer d’una mini-sèrie de tres.
    En el segon s’han comentat les proves que s’anaven fent per millorar el tractament del problema de la dispersió de les dades (el corpus ibèric és petit però amb molts signes diferents i una casuística molt sorollosa) a partir d’emprar el català (una escriptura ben coneguda) com a camp de proves, i posteriorment es desenvolupà una simplificació de les mesures de segmentació (modularitat) per tal de fer-les de més fàcil lectura.
    En el tercer i final, els mètodes aquests s’han aplicat a l’ibèric, i s’ha pogut contrastar les bondats del sistema (a grosso modo les vocals i consonants es detecten raonablement bé), i les seves limitacions (els sil·làbics no tant). Però més enllà de ser una via d’anàlisi interessant, el fet, és que fins i tot una mesura no del tot reeixida permet plantejar algunes interpretacions alternatives a uns quants glifs. Recordem-ho, fet a partir de mesures estrictament quantitatives, amb una informació del domini mínima (bàsicament només saber quin signes són separadors o metrològics).

La Bibliografia, amb tanta pràctica teòrica i tanta teoria practificada tampoc ha sortit ben parada. La lectura ha estat poca, pràcticament testimonial, (encara que en teoria, molt interessant, ja en parlarem en el seu moment, si Déu vol). La cua de ‘per llegir’ encara està en els 342 títols en escriure això. Terrible…

Com és habitual, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Alta Edat Mitjana:

A fi de mes, cathalaunia.org presenta 26.704 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

Paleografia Ibèrica Digital.

$
0
0

Aquest apunt és per comentar una novetat en el corpus Iberika de cathalaunia.org estretament relacionada amb el seu Signari. El tema venia de lluny però ha cristal·litzat aquesta setmana.

Ja des dels seus inics a l’any 2013, el corpus ha presentat una pàgina Signari on mostrar la pluralitat de glifs que defineixen la seva escriptura (amb la seva codificació numèrica) seguida de l’especificació d”una agrupació d’aquests mateixos glifs en ‘caràcters’ (parlant impròpiament) per facilitar fer cerques i altres manipulacions.

Signari de 207 glifs.

El contingut ha anat variant al llarg del temps seguint l’evolució de la definició del signari; dels 136 signes originals del seu corpus mare, el de na Carme J. Huertas, als 207 de l’actualitat; i fins aquesta setmana, això era tot el que es podia trobar: una llista de signes i codis. A partir d’ara però, cada un dels glifs es pot clicar per obrir una pàgina on recollir la informació que es disposa d’ell en el corpus, que no és pas poca. Mostrem per exemple, el glif 116, suposadament una variant de Ke, lo prou poc documentada com per poder capturar-ho tot en una sola imatge però amb tots els elements que volem comentar:

Informació disponible del glif 116.

En la part alta, les dades bàsiques: el seu aspecte, el seu codi numèric, el seu valor fonètic suposat, i el nombre d’entrades epigràfiques en els que figura. I a sota, una taula amb el desglòs de cada una de les epigrafies. Cada una amb el codi Iberika corresponent (enllaçat lògicament a l’entrada en qüestió), l’identificatiu, el suport, la data, la localització i les formes originals en les que apareix el glif. Tenir un corpus informatitzat permet això, poder dir en quines epigrafies apareix cada un dels seus signes.

No fa gaire es comentava, parlant de la variabilitat sígnica de l’ibèric nord-oriental, de la possibilitat de reconstruir quins signaris s’empraren en cada moment i context de la història de la Ibèria. La idea rera aquestes pàgines de glifs és proporcionar el lloc on presentar les dades necessàries per a tal tasca. No per què sigui un objectiu amb el que hi hagi una afinitat especial, més aviat el contrari, però sembla  indefugible[1] tot i les seves limitacions naturals. Mirem d’explicar-ho.

Certament, qui hagi revisat un nombre lo prou gran d’epigrafies ibèriques pot percebre modalitats i costums diferents, i si tenim el lloc i el moment en el qual es documenten cada un dels signes, hauria de ser  relativament fàcil descriure la modalitat (o modalitats) que s’empraren en cada context. La idea, en abstracte, no pot ser més encertada, però el problema és la seva definició formal, que estarà malauradament farcida d’ambigüitats. Per començar, molts objectes estan descontextualitzats, i per tant, no permeten ni una localització ni una datació que no sigui d’allò més genèrica. Tampoc del fet de trobar un objecte en un cert lloc en podem sovint derivar, ni la seva factura local (no deixen de ser bens mobles), ni menys que ho fos la seva escriptura si són marques fetes amb posterioritat a la seva fabricació. Tampoc l’eix temporal permet gaires alegries, les datacions amb uns mínims de garanties són malauradament minoria (les tècniques de datació han millorat molt, però el gruix de l’evidència, en ser anterior, no n’ha pogut fruir). El perill, és que davant la poca evidència disponible, es caigui en la temptació d’oblidar que ‘absència d’evidència no és evidència d’absència’, i per voler definir un context, es menystingui l’ambigüitat intrínseca de les dades. Si per exemple, tenim un glif documentat en 30 epigrafies, 20 d’elles del segle IIac i d’un context local relativament reduït i la resta sense data, podem estar temptats de creure que efectivament, va ser creat i emprat en aquell context del s.IIac, quan de fet, amb només que una de les altres 10 epigrafies resultés ser del segle IIIac desfaria la hipòtesi. El perill està en què en no saber-ho, ens fixem només en el que sí sabem, que no deixa de ser una inclinació natural de la ment. I com que, agradi o no, cal fer hipòtesis, i en aquesta mena de casos no acostuma a haver-hi gaires novetats que obliguin a replantejar-les sovint, la inèrcia porta a substituir el que originalment era una suposició en una ‘opinió de consens’ al cap d’un temps i d’un cert nombre de repeticions acrítiques en la literatura especialitzada. La pràctica historiogràfica està farcida d’exemples, i tot historiador sap que ha de desconfiar-ne sistemàticament, però això no és tan així en altres disciplines (en el que fa a l’avaluació geotemporal de les dades disponibles, s’entén). D’aquí les recances amb la idea de mirar de delimitar uns suposats modismes locals en una temàtica amb tantes ambigüitats estructurals: el perill d’autoreferenciar-se és molt gran.

Però tornant a lo concret, cal fer una observació d’estat actual. Aquestes pàgines de glifs mostren clarament la gran quantitat de dades que encara falten incorporar en el corpus. La majoria d’epigrafies no tenen ni localització geogràfica ni datació. El motiu està en què en origen, la missió principal del corpus era presentar una codificació el més semblant possible als originals (i aquesta era la informació que les dades d’ibers.cat proporcionava) , però un cop aquesta tasca ha estat raonablement encarrilada, es va fent patent la necessitat d’afegir la resta d’informacions bàsiques, especialment com diem: lloc i data. Per això, de moment, les columnes de Data i Lloc en la pàgines dels glifs, apareixen majoritàriament buides, cal encara una tasca sistemàtica d’anotació, ja que en origen no es disposava d’aquesta informació. És l’objectiu i la metodologia emprada a cathalaunia.org: presentar només dades bàsiques amb referències a fonts d’autoritat externes per si es vol anar més enllà[2]. En el cas de les epigrafies ibèriques, per a cada una es disposa d’una secció de Bibliografia (i en això, la tasca d’afegir les evidències gràfiques feta aquests darrers mesos n’ha permès incorporar-ne un mínim a una majoria d’entrades), una de Web, majoritàriament amb referències a la base de dades Hesperia (tot i que encara publica molt poques dades). I ara cal convertir les dades de Lloc a ser possible en enllaços a descripcions del context geogràfic o jaciment arqueològic (preferencialment de Wikipedia) que continguin les coordenades de la seva geolocalització[3]. Tot plegat es diu ràpid: només cal afegir lloc i data a més de 3.000 epigrafies…

Però més enllà d’aquestes mancances, les pàgines dels glifs, presenten una columna Formes, on s’aniran mostrant les formes que pren el glif en cada epigrafia, i aquí arribem, per fi, a la Paleografia Ibèrica Digital del títol.

Paleografia Digital

Dèiem que la cosa venia de fa un temps (i aquí tenim que passar a la primera persona). L’any 2015, en el magnífic bloc de n’Ainoa Castro, Littera Visigothica, dedicat a la paleografia visigòtica, l’autora comentava la seva disposició a aplicar la informàtica a la tasca paleogràfica d’identificar les diferents mans que confeccionaren un manuscrit determinat. Sent cathalaunia.org  el fruit de creuar Història i Computació, em va causar sorpresa el fet de no haver-hi pensat abans en una tal aplicació de la tecnologia. Certament sabia de webs especialitzats en manuscrits originals i altres aspectes relacionats amb la diplomàtica (sols cal mirar en la llista de ‘Adreces d’interès‘ de cathalaunia per trobar-ne uns quants), però per a la tasca concreta d’individualitzar els caràcters de cada escrivà, no. De manera que vaig mirar de seguir d’aprop el tema per mirar d’estar al dia i per si es podia ajudar d’alguna manera.

Els detalls, arribaren poc després en els següents apunts del bloc, i eren que certament ja existia una aplicació de paleografia digital anomenada DigiPal i que la tasca de l’autora en els propers temps seria adequar l’aplicació al context de la paleografia visigòtica[4]. El programa proporciona una sèrie de facilitats genèriques d’anotació d’escriptures manuals en entorns web, però està pensat per ser modificable per a cada context (les necessitats varien lògicament segons l’àmbit a estudiar, no és el mateix si estem parlant d’epigrafia carolina, o de miniatures, de llibres, o de pergamins, etc, etc).

Un comentari de professional del món de la computació. Sovint, els programes informàtics neixen d’una idea simple, a voltes mínima o fins i tot insubstancial, l’expressió de la qual ocupa una part petita quan no ínfima de tot el programa; la resta, el gruix de la feina (i dels problemes) és com arribar a poder fer funcionar aquest pinyol, aquest germen inicial. En el cas de la paleografia medieval, aquest ‘pinyol’ sembla estar en poder marcar de forma fàcil cada una de les lletres sobre les imatges dels manuscrits a estudiar. Els paleògrafs construeixen (fins ara manualment) llistes de com es dibuixaven cada una de les lletres o signes en cada original i per comparació caligràfica, les agrupen en sengles ‘mans’. El programa DigiPal facilita això: presentar una imatge d’un manuscrit per tal de poder marcar-ne una part, un rectangle, i dir: ‘això és una A‘, ‘això una g‘, ‘aquí hi ha una altra A‘, etc. I a partir d’aquesta informació base, anotar-la, categoritzar-la i agrupar-la i presentar-la segons les necessitats específiques del camp d’estudi. El projecte DigiPal està doncs pensat per crear derivats seus, per exemple, en el cas de n’Ainoa Castro, està construint (i ho comenta més que bé en el seu bloc) un ‘VisigothicPal‘.

De manera que la reacció fou pensar immediatament en un possible ‘IbèricPal‘.

La problemàtica de les escriptures ibèriques preromanes és molt diferent al de les l’escriptures medievals, però possiblement el program seria lo prou adaptable com per poder-ne fer una eina eficaç en aquest domini (potser a efectes pràctics, la dificultat a primera vista mes evident era la necessitat de poder indicar lletres ‘torçades’, és a dir, de marcar rectangles ‘girats’, una facilitat que la darrera vegada que ho vaig mirar, DigiPal encara no incorporava, però que estic segur que incorporarà ben aviat -és una facilitat massa convenient i genèrica com per ignorar-la-). Però tot i així, era evident que resultava una tasca excessiva per mirar d’afrontar-la des de cathalaunia.org, de manera que el tema s’arxivà en l’apartat dels: ‘Estaria bé‘.

Paral·lelament, el corpus i el signari de cathalaunia van evolucionar per fer-lo encara més semblant a les epigrafies originals, i quan el nombre de signes arribà als 188 (l’octubre del mes passat) es feu un recompte de covariacions (variacions d’un mateix signe en una mateixa epigrafia) on els resultats mostraven que la variabilitat de l’escriptura ultrapassava la proposta de dos signes per ‘caràcter’ que es fa modernament, i que en comptes d’uns cinquanta signes, calia contemplar-ne una forquilla entre 85 i 96. Resultats que sorprengueren a uns quants experts[5], reacció que de retruc, propicià la incorporació dels esquemes o calcs, de les epigrafies originals fetes per els estudiosos per poder verificar públicament la correcció de la transcripció presentada en el corpus Iberika i el seu grau de semblança. En fer això, indirectament, ja s’estava complint el primer requisit per poder diferenciar els glifs originals un a un: tenir una imatge de l’original per a cada entrada epigràfica.

Aquesta tasca de verificació ha fet augmentar fins a 207 el nombre de glifs necessaris (i hi han en cartera encara més incorporacions, tot i que ja d’abast quantitatiu molt limitat) quan farà unes poques setmanes, es plantejà la conveniència de rescatar aquella idea de la paleografia ibèrica digital de la carpeta dels ‘Estaria bé‘ per si seria convenient fer-la realitat. No, potser, per fer-ho amb les mateixes eines de DigiPal, que generarien un projecte diferenciat del de cathalaunia.org i de difícil integració (tan tècnica com estructural), sinó amb eines pròpies, ja nativament adaptades al context ibèric. En els projectes Pal, cal anar marcant a mà la posició de cada un dels caràcters, però en el cas del corpus Iberika tenim ja la transcripció feta… En imatges ho explicarem més ràpid.

Agafem una epigrafia, per exemple, la I00836, el seu esquema original dels Monumenta Linguarum Hispanicarum és:

I00836, esquema en els MLH.

I la transcripció del corpus Iberika és:

I00386 transcripció.

Només falta convertir-la a:

I00836 transcripció adaptada a l’original.

I tindrem les posicions de cada glif original (inclosa la seva rotació, inversió i/o redimensionament[6]). És a partir d’aquesta informació que en la pàgina de cada un dels glifs, podem anar mostrant l’aspecte original (en els esquemes) que tenen  en cada una de les epigrafies del corpus. Només cal dedicació, les eines ja estan plenament operatives. Això és el que ha cristal·litzat aquesta setmana, una idea que venia de feia un any i mig i que gairebé inesperadament ha trobat la seva expressió programàtica adient[7] per mirar de millorar encara més els continguts del corpus Iberika. A partir d’ara, i a mida que es vagin incorporant les dades que falten, es podrà avaluar fàcilment l’ús de cada un dels signes de l’ibèric nord-oriental (bé, millor dir: cum grano salis per lo comentat abans sobre la fiabilitat de les dades). És només un començament certament, no s’ha processat ni un 1% de les dades, però ves per on, ara el corpus també incorpora informació paleogràfica, i això, sí que no estava previst…!

Encara més feina a fer…

 

 


Notes

  • [1] Preval el criteri de: sempre que es pugui s’ha de presentar la informació disponible.
  • [2] L’exemple més clar potser sigui el dels documents altmedivals del Fons Cathalaunia. On es presenta una versió del text lo prou fidel als originals com per permetre una avaluació eficaç, però sense pretendre en cap cas substituir les edicions crítiques dels texts, imprescindibles si es vol anar més al detall, i per les quals es procura aportar com a mínim un enllaç a una edició en línia si es coneix i en tot cas, una o més referències a les seves entrades bibliogràfiques corresponents.
  • [3] Observis que s’evita incorporar explícitament les coordenades en el web cathalaunia.org. El motiu és metodològic: sempre que sigui possible es mira d’evitar duplicar dades i es prefereix cercar referències en fonts d’autoritat externes per minimitzar la possibilitat de presentar dades errònies.
  • [4] És una rara satisfacció poder constatar que hi han investigadors en Humanitats que cobren per fer el que els hi agrada, tal i com hauria de ser (el retorn de la despesa en investigació cultural esta mes que ben estudiada). Per quan veurem això per els que investiguen la Cultura Catalana? Una Catalunya independent té objectivament el potencial de ser un referent en aquests àmbits, i el contrast amb la indigència induïda actual, és sagnant…
  • [5] I es poden continuar estranyant, ja que un nou recompte fet amb el signari de 207 glifs, ha confirmat que la variabilitat es manté, amb exemples documentats de tres i quatre variants d’un mateix ‘caràcter’ en una mateixa epigrafia.
  • [6] El terme matemàtic és transformacions afins, Tema que per experiència personal no puc dissociar del de la compressió fractal. Una de les fites de la computació de  finals del segle XX  que encara no ha tingut l’impacte esperable en la societat (es va demostrar que la descripció d’una imatge a partir de transformacions d’ella mateixa equivalia a la pròpia imatge, dir altrament, per enviar una imatge només cal enviar les seves transformacions, la seva ‘fórmula fractal’, i per tant, l’estalvi s’ample de banda resulta brutal (no però el cost computacional, especialment en la descompressió, la termodinàmica és la que és). No és un cas únic, hi han un grapat de tècniques de processament ‘revolucionàries’ que per un motiu o un altre encara no han tingut el ressò que era d’esperar.
  • [7] Evitem deliberadament entrar en el detall de la seva realització, que certament és molt més complex i punyetero del que sembla, aquest bloc tampoc és un lloc adient on parlar a fons de temes estrictament programàtics.

2017-abril a cathalaunia.org

$
0
0

S’acaba un abril de nou ibèric a cathalaunia.org. A voltes, quan més ganes tens de tancar un tema, més interessant i fructívol es torna i t’acabes trobant sense previ avís sota la síndrome del: ‘això no ho puc deixar així…’. Tal ha estat cas del mes.

Aquest bloc ha rebut una rebut una entrada nova per consignar la presentació inicial d’unes inesperades noves capacitats de la secció Ibèrica i Romana del web: epigràfiques! El que allà es presentà, aquí ho completarem.

La Secció Ibèrica i Romana, és la que ha acaparat la feina i l’atenció del mes. En primer lloc, s’han corregit un parell d’errades subtils en el mecanisme de cerca del corpus introduïts en els darrers canvis que s’hi van efectuar no fa gaire (un parell de signes mal col·locats en llocs difícilment detectables). Afectaven a casos molt particulars i per això han tardat un temps abans de fer-se evidents.

Ara, el gruix de l’atenció s’ha dividit en dues àrees ben diferenciades. Per una banda, i tal i com es va comentar en l’apunt anterior a aquest, s’han afegit capacitats paleogràfiques als continguts del corpus Iberika. La idea s’havia albirat feia temps, però a primers de mes es va fer real. És ben simple, es tracta que de crear un mitjà que permeti col·locar sobre les imatges de les epigrafies ibèriques, els glifs del signari (deformant-los o girant-los si cal) per tal de poder seleccionar les parts de la imatges que corresponen a cada una de les lletres de la inscripció. Tan simple com això. El resultat és que per cada glif o signe no sols tenim en quines epigrafies apareix, és que també tindrem la seva imatge (cal anar processant les entrades, però el sistema és força hàbil i efectiu). El que en l’apunt previ no es comentà perquè no existia, era una nova facilitat associada.

Els epigrafistes, acostumen a fer llistes amb les imatges que els glifs prenen en un testimoni epigràfic concret agrupades per caràcter, per evidenciar les semblances o dissimilaritas. No sent epigrafista, no comprenia gaire bé la seva utilitat real; ha estat ara, definint la imatge de cada lletra en els originals que n’he pogut començar a captar la utilitat. Tenint les imatges de cada glif era relativament senzill implementar aquestes llistes de signes en cada una de les epigrafies ja processades, i això és el que s’ha fet, i en fer-ho s’ha fet evident la seva utilitat. En imatges ho farem més ràpid.

A partir d’ara, si una epigrafia del corpus ha estat processada epigràficament, sota la seva imatge apareix un apartat Gilfs : +, mirem per exemple la I01189.

En vermell, marcada la situació del nou apartat epigrafista de les entrades del corpus Iberika.

Com en la resta del web, els signes +/ en blau indiquen seccions que es poden expandir o col·lapsar, de manera que si fem un clic, ens mostrarà la versió electrònica de les llistes de signes dels epigrafistes per aquesta entrada.

El signes de l’entrada I’01189 amb les seves formes.

I és llavors que te’n adones de lo pràctiques que són. I és que mentre vas situant els glifs a lloc, sovint no captes la cohesió en l’estil de cada signe, de manera que et pots trobar que l’assignació de glif inicial, prèvia, feta per inspecció ocular, un cop presentada així, amb tots el signes ‘iguals’ un al costat de l’altre, es demostri no encertada. Estem parlant de casos entre variants molt properes, lògicament, però no deixa de ser notable. Un exemple potser extrem (i encara no processat) poden ser els Tes de la I01129.

3 Te’s iguals?

La imatge mostra un fragment de l’esquema del plom, on figuren tres signes Te, cada un amb un cercle de color diferent, a sota en vermell, tenim els glifs més propers, el 107 (el rombe) i el 110 (el cercle). En una transcripció fonètica els tres serien casos idèntics i com a molt, la distinció entre si emprar el 107 o el 110 seria una qüestió estilística de si és millor emprar formes angulars o rodones. Però la imatge és més punyetera. El Te verd (no la beguda) és clarament un 110, fet amb un traç rodó i un separador vertical que no arriba al fons, i el Te blau (ara ja queda clar que no és beguda,  o no?) sembla un 107, fet amb un traç amb forma de D triangular i complementat amb un traç a la banda esquerra un xic més petit. Ara, el Te taronja (i va i em diu Susanna que ja no sé si és de terres estrangeres) ens confirma per una banda la factura partida del blau, però amb una D més arrodonida i un traç a l’esquerra clarament més petit. I ara la pregunta del milió és: són tots el mateix codi? dit altrament: l’escrivà volia diferenciar entre el primer Te, el rodó, i els altres? O pitjor encara: podem fer aquestes distincions a partir d’un calc? S’accepten suggeriments.

Però més enllà de la epigrafia ibèrica digital, el mes ha estat dedicat especialment a la computació, a com dissenyar un sistema que ens permeti avaluar objectivament les agrupacions de glifs que es fan usualment des de criteris filològics (i de les qual el signari simplificat de cathalaunia.org no n’és sinó una reducció). Una part ja s’ha anat comentant aquest any en aquest bloc en una inesperada minisèrie d’apunts sobre la variabilitat sígnica de l’ibèric nord-oriental, però el cas és que aquest mes sí s’ha pogut fer algun modest avenç i s’està en el procés de donar-li forma. En parlarem un cop tancat el text (hi ha molta cosa a presentar, resumir i comentar).

La resta de seccions del web han patit desafortunadament la desconsideració proporcional a la fixació amb la temàtica de l’escriptura ibèrica que ha engolit el mes.

La Bibliografia, també ha estat menystinguda. Per una banda perquè hi ha una negativa volguda a incorporar nou material mentre la cua de lectures pendents sigui tan llarga (està encara en els 340 títols) i per l’altra, per una manca de flexibilitat mental. És curiós com cada àmbit del coneixement té els seus requeriments. En el cas de la computació i crec que en general en el raonament matemàtic, el tipus d’esforç de comprensió que es fa, és completament diferent del que es fa per exemple en l’estudi de la Història. Segons com, en vigília, m’agrada sintetitzar-ho en termes de: Comprensió vs. Discurs. El primer és una esforç apol·lini, estrictament mental, de comprensió abstracta, sovint absent de llenguatge, mentre que el segon té més a veure amb la capacitat d’organitzar una pluralitat de comprensions interconnectades i interdependents i de saber-t’ho explicar mínimament. Total, per no entrar ara en disquisicions més subtils, que la dedicació a rumiar com distingir uns signes d’altres ha resultat antitètica amb el desig de lectura. No que no n’hi hagin hagut, però les novetats són pràcticament testimonials (i això amb un Sant Jordi al mes…).

Com és habitual, llistem les – minses, però totes profitoses- incorporacions del mes, per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.921 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

A martellades.

$
0
0

Des de fa uns dies cathalaunia.org està sent atacat informàticament amb una certa virulència, de manera que hem acabat fent servir el martell.

Esperem no haver enganxat els dits a ningú, però si algú es troba que no té accés (i no estava fent res dolent….)  pot posar-se en contacte, ja sia fent un comentari  en aquest apunt, o en el email de la pàgina inicial de cathalaunia.org  i podem mirar de solucionar-ho.

cathalaunia.org Pàgina inicial.

Més enllà d’això, lo propi d’aquests casos: molesteu les disculpes!

 


Els 100 signes de l’ibèric nord-oriental.

$
0
0

Ara farà poc més de quatre anys que en aquest bloc ens fèiem ressò de l’apertura d’una subsecció del web cathalaunia.org dedicada a recollir les epigrafies ibèriques conegudes. Llavors, aprofitàvem l’oportunitat per fer-ho emprant grafs per visualitzar dades sobre les seqüencies dels signes ibèrics. Quatre anys més tard, el recull d’epigrafia, creat en origen a partir de les dades del corpus de ibers.cat, després de canvis estructurals importants (per exemple: la codificació ha passat de 136 a 207 glifs/signes) es reanomena en Corpus Iberika, i per parlar-ne avui tornarem a mostrar grafs amb signes ibèrics. De fet, mirarem de mostrar com es poden disposar mecànicament els glifs ibèrics en ‘mapes de caràcters’, distribucions bidimensionals on signes de valor proper estiguin igualment propers espacialment.

Sobre el tema del nombre de ‘lletres’ de l’ibèric nord-oriental, ja n’hem parlat unes quantes vegades en aquest bloc, d’entrada, per mirar de fer entendre que la proposta actual de codificació per a Unicode es queda curta, molt curta[1]. Però el tema va més a l’arrel, al propi esquema de desxiframent actual i als seus problemes. Fa uns mesos, es va fer un recompte de co-variants (variants d’una mateixa ‘lletra’ que es detecten en un mateix testimoni epigràfic). Els resultats indicaven que caldria poc menys de 100 signes per mantenir la variabilitat estructural de l’evidència i es va fer un article per recollir-ho formalment. La reacció que es rebé fou d’incredulitat, les dades havien d’estar malament…[2]! Havent incorporat posteriorment a la majoria d’entrades del corpus (el 85%)  els esquemes o calcs publicats de les inscripcions que fan els experts que treballen les peces, com un mecanisme de verificació públic, es va tornar a fer el recompte, fa poc, i els resultats es mantenien. Ara és el cas de veure com una aproximació, també estrictament quantitativa però completament diferent, torna a donar una xifra similar. La formalitat del que aquí explicarem superficialment ha pres forma en un nou article, qui la vulgui allà la trobarà: Vilaseca i Corbera, Joan : 2017 : “Els caràcters de l’ibèric nord-oriental, una aproximació quantitativa”.

Mapes de caràcters.

Imaginem que volem disposar les lletres, els signes d’una escriptura, en un quadre. Les disposicions són òbviament innumerables, de manera que, per començar, afegim que volem que reflecteixin les característiques observables, i per exemple, diguem que fem que la mida de cada signe estigui d’acord amb la seva freqüència, i que signes més grans indiquin signes més comuns. Ens faltaria encara l’element clau, un criteri de disposició espacial. Si coneguéssim bé la natura dels signes – pensem que estem fent un quadre del català – podríem agrupar separadament vocals, majúscules, signes accentuats, etc, etc, però i si no ho sabem? És aquí que entren els grafs.

Imaginem que no sabem la natura dels signes però que en podem mesurar alguna mena de semblança entre ells (per exemple, cal·ligràfica). Si podem establir un grau de semblança – o de diferència si es prefereix – entre glifs, podem expressar en un valor numèric la relació que cada un d’ells té amb cada un dels altres signes. Diguem que cada lletra és un node i que els graus de semblança són les connexions i ja tenim un graf. Ara, un graf, no és un quadre, cal encara dissenyar un mètode per situar els nodes dins dels quadre. Es pot fer  a mà, i segur que quedaria millor, però no tindria gràcia, volem que ho faci la màquina. Una forma de fer-ho és imaginar que cada connexió és com una molla, un vector de força, és a dir, que els nodes del graf ‘volen’ estar a una certa distància dels altres (segons les connexions que tinguin – i evidentment, dels seus valors-). Aquí entra la programació i el que es coneix com algoritmes de distribució de forces, que no és més que simular que passaria si efectivament féssim materialment la prova[3]. Les maneres de fer-ho són innumerables també, però en general, el que cerquen és una distribució que minimitzi les discrepàncies entre els valors de les connexions i les distàncies entre els nodes dins del quadre[4]. Podria semblar que donats uns valors de connexió determinats, el resultat hauria de ser sempre el mateix, però el cert és que no, poden (i sovint hi han) moltes disposicions ‘correctes’ (i més encara de ‘mig correctes’). El que es fa, és situar inicialment els nodes en posicions aleatòries dins el quadre, deixar-los anar tots a l’hora i anar canviant les posicions de mica en mica, fins que no es moguin – gaire – (el que es coneix com tècniques de gradient o de ‘recuita simulada‘ (una traducció horrible!). Fem-ho unes quantes vegades, per assegurar que la disposició no és espúria (al partir de valor aleatoris, es poden donar situacions atípiques) i ja ho tenim: un mapa de lletres. Substituïm el criteri de semblança cal·ligràfic per un de distribucional (entre quins signes figura un determinat signe) i partim de les dades del corpus Iberika, i tindrem un mapa de caràcters de l’ibèric nord-oriental; quelcom similar a això:

Mapa de caràcters anotat de l’ibèric nord-oriental.

Bé, com es pot entendre, ens hem saltat unes quantes passes. Primer caldria presentar els glifs (els del signari de corpus Iberika), i com s’han agrupat (en les categories del signari simplificat del mateix corpus, que ve a ser una simplificació de les de la proposta per a Unicode).  En una matriu:

Categories i glifs emprats.
La columna Grups presenta el nombre de caràcters en la proposta per a Unicode.

I presentar el graf del qual s’ha derivat el mapa anterior.

El graf del mapa de caràcters anterior.
En format svg es pot fer el zoom que es vulgui.

I encara ens hem saltat un detall important. Si fem -només-  el que hem explicat abans, connectar tots els nodes/glifs a tots els altres, el resultat no seria aquest graf, seria més aviat quelcom així:

Tots contra tots.
La versió svg va amb colors.

Un graf també interessant, ja que podem observar una cosa que no es veia en l’altre: com s’agrupen les vocals per una banda, les consonants contínues per altra, mentre que la resta, està ben dispersada. Què és el que falta -en essència- per des d’aquí anar al graf i mapa d’abans? Doncs incorporar les incompatibilitats.

Per més que dos glifs tinguin distribucions semblants, si són d’aspecte diferents i apareixen junts en una mateixa epigrafia, han de ser diferents. El que es fa doncs, és, en el graf plenament connectat, anar i desconnectar els nodes/glifs que apareixen junts en alguna epigrafia del corpus. Així de simple. Bé, tampoc no del tot, no sempre… Com que el signari està pensat per ser força semblant als originals, recull formes que són molt properes, i que si es troben juntes pot ser que es tracti de variacions involuntàries, per exemple, degudes a la natura autògrafa de molts dels testimonis. En una imatge es veuen bé les semblances.

Glifs considerats ‘equivalents’.

Si trobem alguna parella de glifs que estigui en alguna d’aquestes ‘equivalències’ en mantenim la connexió (és com si fossin un mateix glif). Fent abstracció doncs d’aquests casos, el resultat és que un node només queda lligat i per tant es situa vers els glifs amb els que no co-apareix, i ho fa, segons el grau de semblança de les seves distribucions. En altres paraules, la disposició dels nodes en el graf és indirecta; si els glifs d’una certa ‘lletra’ trobem que se’ns ajunten és perquè el joc de forces vers la resta de glifs així els agrupa, no perquè hagin d’estar connectats entre ells. La proximitat no implica forçosament connexió, sols augment de probabilitat de semblança en les distribucions vers la resta de glifs.

O, parlant amb propietat, així seria si en comptes d’un espai euclidià i de dues dimensions ho féssim sobre un d’infinites (o un nombre lo prou gran per harmonitzar els factors de connexió), el fet d’haver-ho de fer en un espai n-dimensional, fa que el nombre de disposicions alternatives augmenti. El resultat és que un mateix graf pot presentar moltes disposicions depenent de la posició inicial. Dit així sona pitjor del que és. En la pràctica, la majoria de conjunts de dades generen disposicions que mantenen les posicions relatives, o bé que oscil·len entre un conjunt de situacions relatives en els casos més inestables. En la pràctica el que s’ha fet és fer 5 proves sobre un mateix graf, i analitzar-ne el conjunt[5].

O sigui, per cada prova, analitzar les 30 categories de la taula anterior una a una, mostrar la seva disposició i veure quins grups es formaven i amb quins glifs. El resultat, final, és:

89 Grups discernibles i els seus glifs més probables.
En gris els poc documentats (<=10), en vermell els rebutjats en el càlcul.

On resulta que el nombre de grups és de 89, per xiripa, el mateix que s’havia detectat en les co-aparicions (cal entendre que poden haver-hi variacions menors, per exemple, per errors no detectats en les dades, o en la interpretació dels resultats) . El que no sembla probable que sigui casualitat és que dues mesures metodològicament tan diferents coincideixin en uns resultats tan propers!

El títol parla de 100 signes, és una simplificació, una xifra rodona, justificada si pensem que als 89 detectats cal sumar com a mínim separadors i metrològics. Vol dir el que hem explicat fins aquí, que existiren els 100 signes a l’hora? No ho sé. En tot cas, si es vol negar, caldrà donar una explicació a perquè dues mesures tan diferents fetes sobre el corpus (co-variants i distribució) donen resultats tan propers. És més, en una mirada global sobre el signari i les distribucions (la taula anterior) hom pot veure sense gaires dificultats una sèrie de regularitats globals que mal poden ser fruit de l’atzar.

Les tres majors potser serien:

  1. Els grups amb E, (E,Be,Te,Ke) tenen gaire bé el doble de glifs que la resta. No serà que hi havien 6 vocals base i no 5 ? Els grecs en tenien 7 i les diferenciaven. A casa nostra, a la Tolosa del s.II ac, tenim un exemple del seqüència …IOU (veure I02151 i la seva bibliografia[6])…
  2. L’element gràfic diferenciador quantitativament més important, no és com es podria pensar, l’adició d’un traç medial (marca del signari dual), sinó l’adició o extensió en la part inferior d’un traç vertical. El tenim entre els Ti i el To, però també entre bona part dels glifs de les vocals i consonants contínues. Fins ara no se’ls ha tingut en compte, però les seves distribucions són diferenciades, fet que exclou l’atzar.
  3. En el quadre d’abans, certament es poden trobar identificades les dualitats pròpies del signari dual, que veuen així provada numèricament la seva existència, el problema és que al seu costat apareixen divisions més complexes, per exemple, de 4 i no de 2, i de nou, no sembla raonable pensar que és tracti d’una casualitat. En altres termes, si el mètode emprat detecta les dualitats conegudes, hem de fer el cec a les demès, que a més, a voltes tenen un suport documental encara més potent? No sense uns motius ben clars.

Preguntes, preguntes que caldria que la Filologia respongués, però això sí, a partir de dades objectives i raonaments lògics.

El que hem comentat, aquestes mesures (co-varians i distribució) estan fetes sobre una foto momentània. El signari ibèric del corpus Iberika, té en el moment de fer la prova 207 glifs, però n’hi han més de 60 detectats esperant entrar, de manera que probablement per poder representar amb un grau de fidelitat alt els continguts futurs caldrien potser 300 glifs (poden semblar molts, però nosaltres amb una llengua de menys caràcters en fem servir força més, des de fa segles). Ara, cal entendre que l’evolució de les dades no és excusa de res, tota vegada que va en el sentit de reduir les ambigüitats i que afecten progressivament a un volum menor d’informació, Els més de seixanta glifs a afegir, que poden semblar molts respecte als 207 actuals, per exemple, o són hapax legomenon i aporten una informació nova, que no hi era abans, o són variants molt poc freqüents d’altres signes, i per tant fan la foto encara més precisa; però entre tots ells, no arribaran ni al 1% dels continguts existents. Tant de bo trobéssim una biblioteca en ibèric, o un bon grapat de ploms escrits, llavors sí que caldria refer aquests càlculs, però si això no passa, cal entendre que les variacions previsibles, per noves aportacions, o per correcció o millora de les dades, seran petites.

Una darrera pregunta sistèmica que no deixa de treure el cap en considerar els orígens de l’escriptura ibèrica.

Segurament en els seus inicis era ben sabut d’on van venir els seus introductors  o a qui imitaven si fou una iniciativa local. No fa gaire mostràvem un resum d’alfabets mediterranis del segle passat, on podem veure com la majoria de signes ibèrics tenen precedents clars.

Paleosignaris mediterranis.

Però al mateix temps, per poc que es miri els glifs ibèrics i com s’estructuren, un no pot deixar de notar les senyals d’un sistema estructurat (ni que sigui parcialment). Els tres 3 glifs bàsics de les As tenen un valor R en les seves formes especulars, l’equivalència cercle=rombe, símbols girats 90 o 180 graus, versions especulars, l’adició de traç inferior o medial, etc. No fa gaire també donàvem una distribució -casolana- dels glifs per semblança:

Glifs per estructura gràfica.
Verd=Blau+traç inferior.
Falta la Bi curta…

La pregunta és  ben simple: com es combinen aquestes dues evidències? Què és adoptat i què adaptat? Van venir uns signes ja llavors mil·lenaris i van ser sistematitzats aquí, o ja vingueren amb la seva part de sistematització? Realment en sabem tan poc del que hi havia a mitjans del primer mil·lenni abans de Crist com per no trobar precedències en el Mediterrani o l’Orient Mitjà…? I el que personalment potser trobo més interessant: què ens dirà tot això de la nostra Història?

 


Notes

  • [1] I el més trist és que tot apunta a que al consorci Unicode ja li sembla bé no donar un espai numèric adequat per expressar una escriptura desapareguda. Caldrien uns 300 code-points i en tenen pre-adjudicats unes desenes.
  • [2] I sense proves!
  • [3] És un tema que em resulta especialment proper per els records que em porta, de fa anys, parlant davant de la pantalla amb alguns dels primers que programaven aquests algoritmes sobre com mirar d’evitar els problemes dels mínims locals…
  • [4] Per fer-ho curt: les connexions o distancies no tenen perquè formar una mètrica. Tres punts en un pla, que no estiguin en línia, sempre formen un triangle, tres segments, no sempre.
  • [5] Això també és una simplificació, en realitat les 5 proves, s’han completat amb tres mesures més. Dues amb corpus més reduïts, però tipològicament més coherents, i una ignorant les ‘equivalències’ entre glifs. Per tal de tenir dades de les variacions majors a l’hora d’avaluar els resultats.
  • [6] I ens estalviem d’entrar en les batalletes i contraposicions sistemàtiques entre grups de diferents escoles, tan habituals i que vist de fora només fan que treure credibilitat a la disciplina.


2017-maig a cathalaunia.org

$
0
0

Maig ha estat un mes de realitzacions, un mes molt productiu i de tancament de cicle a cathalaunia.org. Mirant ahir aquest bloc, veia fins a quin punt la temàtica de l’escriptura ibèrica ha capitalitzat l’activitat d’aquests darrers mesos. Això és el que s’ha tancat aquest mes. No per haver certament esgotat res, més aviat el contrari, sinó per haver pogut concretar formalment el fruit de l’inesperat impuls que dirigí l’atenció vers aquesta temàtica ara farà poc més de mig any.

El web ha rebut un seguit de millores discretes, potser la més evident és que la barra lateral esquerra del web, ara és de mida fixa. És una fotesa, però amb la introducció dels botons de navegació (primer/anterior/següent/darrer) en les pàgines amb numeració (la immensa majoria), el fet que la barra canvies de mida (segons la disposició dels continguts de la pàgina) feia que els botons també es desplacessin i no poguessis anar fent clic per saltar entre les pàgines sense haver d’estar pendent de si s’havien mogut o no. Ara ja es pot i l’ergonomia és l’adequada.

El Fons Cathalaunia ha rebut també un seguit de correccions menors. Unes poques informacions manifestament mal classificades entrades en els primers temps del Fons, quan la metodologia estava encara molt tendre i que havien passat desapercebudes en el volum total.

Per el que fa a la Secció Ibèrica i Romana, han estat no un, sinó dos, els articles nous tancats aquest mes. Un, sobre el mètode informàtic emprat a cathalaunia.org per individualitzar paleogràficament els signes de les epigrafies ibèriques (Vilaseca i Corbera, Joan : 2017 : “Epigrafia ibèrica digital”) i l’altre sobre un mètode quantitatiu per avaluar les agrupacions de signes ibèrics que fan els filòlegs, les ‘variants’ d’uns suposats ‘caràcters’: (Vilaseca i Corbera, Joan : 2017 : “Els caràcters de l’ibèric nord-oriental, una aproximació quantitativa”). Com que ja van estar comentats en aquest bloc, ens estalviem avui els detalls.

I més enllà d’aquests articles, i de resultes de l’activitat i les millores sistèmiques introduïdes arrel dels treballs fets durant aquests darrers mesos, s’ha decidit rebatejat el recull d’epigrafia ibèrica del web en: Corpus Iberika. Un nom nou per individualitzar uns continguts sensiblement millorats dels de fa un any (signari ampliat i amb correspondències a altres notacions habituals, esquemes, paleografia,etc). És només un començament, la muntanya de feina a fer és descomunal, però sí que s’han pogut delimitar raonablement bé les bases sobre les quals bastir la feina futura.

Aquest bloc ha tingut una entrada precisament per comentar el darrer article (superficialment, ja que els resultats, que potser són la part més sucosa del treball van ser tan sols presentats en una taula), i un altra poc abans, per avisar de les inclemències del temps a Internet si em permeteu la metàfora.

El tancament d’aquests dos articles, ha deixat la natural depressió ‘postpartum’, que fa que no sàpigues massa bé que fer. Especialment forta en aquest cas per tractar-se d’una temàtica que va entrar de forma inesperada i no estar gaire vinculada a l’activitat prèvia. El fet, és que el resultat de tot plegat, és que el web, ara una mica més que abans, presenta dos conjunts documentals notables sobre la història de la Catalunya abans de Catalunya: el Fons Cathalaunia, de documentació i prosopografia altmedieval, i el Corpus Iberika, amb la representació epigràfica més acurada de les epigrafies conegudes fetes en ibèric (‘nord-oriental’ segons el modisme acadèmic actual). A veure si podem reconduir la voluntat i la recerca a escenaris més propers a l ‘any 1000…

La Bibliografia, ha estat la que ha recollit bona part d’aquesta activitat mensual dispersa. Per la banda menor, s’ha reprès el canvi de referències bibliogràfiques velles a YALE (yufind) al sistema ORBIS Yale University Library Catalog. (i les que no es localitzen, usualment a l’impagable catàleg dels Regesta Imperii). Encara queden 250 entrades per corregir, i s’han d’anar fent una a una… Però la buidor d’haver tancat dos articles després d’una feina de mesos, ha trobat en la lectura el seu gran consol. Una dieta estricta i restrictiva per el que fa noves incorporacions sumada a una lectura i anotació sistemàtiques, han permès rebaixar el llistat de títols ‘perllegir‘ dels més de 340 del mes passat als menys de 270 a final de mes. Certament, a partir d’aquí ja serà difícil poder tornar a fer una tal reducció, la majoria d’obres pendents de lectura ara ja són volums o treballs de mida certament considerable. Entre les incorporacions del mes hi han sens dubte articles notables, i probablement en parlarem d’algun d’ells aviat, però com cadascú sap el que li agrada més, no entrarem ara en detalls.

Com és habitual, llistem les incorporacions del mes, per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.981 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

Una de “tombes”.

$
0
0

Una de les novetats del mes passat que no trobà ressò en aquest bloc, fou que per fi es localitzà la versió electrònica d’un llibre, personalment,  llargament esperat: Griffe, Élie : 1933 : “Histoire religieuse des anciens pays de l’Aude”[1]. Una obra certament interessant si es vol mirar d’entendre l’evolució del sud de la Septimània entre l’edat antiga i la mitjana, la lectura de la qual ha relligat inesperadament amb altres lectures prèvies d’aquest mateix mes; en aquest cas, sobre imatgeria funerària. El que fa, crec, lo prou interessant el tema com per parlar-ne aquí, és que relaciona les dues tombes sagrades més importants del cristianisme: el Sant Sepulcre de Jerusalem i la tomba de Sant Pere a Roma, amb la tradició jueva i per si fos poc, té a veure amb casa nostra. Anem a pams.

La tomba de Sant Pere

Una de les lectures del mes passat (inclosa en l’apunt mensual) fou : Ferber, Stanley : 1971 : “The Pre-Constantinian Shrine of St. Peter. Jewish Sources and Christian Aftermath” : Gesta : 10.2 p.2-32, un article molt entenedor que planteja una reconstrucció del santuari  pre-constantinià de la tomba de Sant Pere a partir dels paral·lelismes amb la tradició jueva dels receptacles on es guarda la Torah en les sinagogues.

Els elements arqueològics que han sobreviscut al pas del temps només permeten una reconstrucció molt bàsica:

Elements preconstantinians (~ a. 160) de la tomba de Sant Pere. (imatge Ferber).

Tres cavitats excavades en l’anomenat Mur Vermell, una (N1), sota la part dibuixada, la que està a nivell del terra (N2) , i la superior (N3) amb una obertura o finestrella a l’altra banda del mur de propòsit desconegut. Atenent a la iconografia jueva d’aquesta mena de templets, la reconstrucció proposada seria quelcom semblant a:

Reconstrucció aedícula preconstantinaina proposada per Stanley Ferber, l’any 1971.

El camí que segueix Ferber per arribar a aquesta disposició són els precedents precristians en  iconografia sagrada, que apunten per una banda, com no pot ser d’altra manera, als templets funeraris de tradició romana, que ja presenten el portal amb arc més o menys semicircular i entre columnes, a voltes, amb un espai per l’urna i en certs casos fins i tot amb una superfície on deixar les ofrenes al difunt (no en la imatge d’exemple).

Tomba de Sabinus Taurius a Isola Sacra a Ostia, època imperial.

I la tradició jueva, de la qual el cristianisme no serà sinó una evolució. I en aquest cas, el símbol en forma d’edifici simbòlic més freqüent és sens dubte, els templets on guardar la Torah, coneguts com l’arca sagrada o de al Llei, que tindran un lloc preeminent en totes les sinagogues. Aquí també tenim de nou, el motiu del portal columnat amb timpà semicircular, en aquest cas, usualment adornat per el símbol de la petxina [2] i amb columnes d’estries ondulades.

Imatge de la paret oest de la sinagoga de Cafarnaum.

Símbol que també serà utilitzat per la mateixa tradició en contexts funeraris [3].

Bet-Shearim, Catacomba 3 Habitació VII.

Posteriorment, la tomba de Sant Pere serà refeta per Constantí, a partir de la dècada dels 320,  i un bon punt de partida per saber com era podria ser la imatge més antiga que es coneix d’ella que està en la decoració de la coneguda com Urna de Pola d’inicis del segle V.

Urna de Pola, imatge de la tomba de Sant Pere a Roma a inicis del segle V.

On es pot entreveure un edicle amb una estructura externa de columnes ondulades[4] i una d’interna amb un portal també columnat i un timpà semicircular.

Retinguem doncs els elements bàsics de tal proposta. Un mausoleu amb façana columnada (sovint amb estries ondulades) i un timpà semicircular, o de quart d’esfera si fem la projecció estereogràfica, amb decoració de petxina.

La tomba de Jesucrist

El Sant Sepulcre a Jerusalem és el lloc de pelegrinatge per excel·lència del cristianisme. La basílica o martyrium que el concentra, té en el seu interior el mausoleu o edicle també anomenat  Anàstasi (resurrecció) edificat sobre la tomba, que originalment era una cova tallada en la roca.

Anàstasi. Imatge de wikipedia.org.

La primera versió del qual fou construït també per Constantí entre l’any 325 i el 335, que fou quan es consagrà. L’edifici constava de dues càmeres: la exterior dedicada a la pedra de tancament que remogué l’àngel segons els evangelis[5], i la interior, al sepulcre en sí, que no és més que un esglaó tallat en la pedra on es suposa que reposà i ressuscità el cos difunt del natzarè. La primera destrucció/reconstrucció tingué lloc l’any 614 i posteriorment una altra l’any 1009, i entre elles tenim molt pocs testimonis. La versió actual, de forma aproximadament quadrangular és la suma del treball del croats i la restauració feta a inicis del segle XIX, quan un incendi destruí part del conjunt arquitectònic, però en origen l’Anàstasi era força diferent, la versió moderna en manté l’estructura interior i la planta semicircular posterior, però de l’exterior tot just en recorda la portalada columnada i amb estries ondulades.

Sumant els pocs testimonis antics, els anteriors a l’any 614, i els de abans i després del 1009 tenim que la forma original probablement era més o menys així[6]:

Reconstrucció aproximada de la forma original de l’Anàstasi segons els diferents testimonis.

Un templet columnat[7], amb una primera estança semicircular i una segona amb el replà de pedra excavat en la paret. Els dos darrers testimonis literaris medievals, el patriarca Foci al segle IX, i l’abat rus Daniel al segle XII, la descriuen com una ‘petita casa’ (aedicula/tugurium) rodejada de columnes, (tot i que el nombre i disposició varien entre ells) de forma aproximadament rodona. Per el que ens pertoca aquí, remarcar que els testimonis més antics presenten columnes en espiral i la petxina a l’entrada, tot i que aquesta desapareix després de la destrucció del segle VII.

Narbona s. V

I és aquí que tornem a on haviem començat, amb el treball d’Èlie Griffe sobre l’Aude, i és que en parlar dels inicis del bisbat de Narbona (documentalment, al segle V[8]), mostra una peça escultòrica ben notable, de més de 1.20 mt. d’alçada feta en un monòlit de marbre dels Pirineus[9], actualment – si no vaig errat – en el Museu Lapidari de la ciutat, i en origen, situada suposadament en la basílica del segle V del bisbe Rústic, que ha estat objecte de variades interpretacions:

El ‘sepulcre’ de Narbona, en imatge d’inicis del segle XX.

Un templet de pedra a escala reduïda on s’aprecien perfectament encara les columnes i la forma de petxina de l’entrada, tal i com Ferber ho havia proposat per la tomba de Sant Pere preconstantiniana, però aquí associat al que la majoria d’experts (Griffe entre ells) han identificat com una Memoria Sancti Sepulchri. La semblança amb la reconstrucció de la Aedícula constantiniana és evident; fins i tot l’esglaó mortuori de la càmera interior hi està reproduït.

Varien el nombre de columnes. Segons Foci al segle IX eren 11, mentre que la Memoria en presenta 9 – un nombre per altra banda ben significatiu – però cal recordar que Foci descriu la versió posterior a la destrucció del 614. Potser en origen sí eren 9 les columnes de l’Anàstasi?

També resulta curiós com la Memoria reprodueix l’estructura bicameral del Sant Sepulcre, però al tenir una obertura posterior s’assembla a la finestrella de la part superior de la tomba de Sant Pere (tot i que probablement aquesta semblança sigui circumstancial ja que cal suposar que usualment estaria tancada). El que potser permet entendre millor l’ús del monument, és precisament aquesta obertura, tota vegada que en la part inferior es pot veure un rebaix que forma un canal per on s’hi escolaria alguna mena de líquid (olis sants o aigua consagrada). I que permeten entendre la seva funció,  ja fos com a reliquiari, o com lloc de sacralització per ‘contacte’ amb la representació simbòlica del Sant Sepulcre o amb les relíquies dipositades en el seu interior.

Detall del canal de desaigüe.

Si comparem aquesta imatge moderna amb la del llibre de Griffe, podrem comprovar que l’obra patí desperfectes i reparacions durant el segle XX[10]. El panell lateral apareix trencat i les tres columnes posteriors restaurades (potser per assegurar l’estabilitat del conjunt?).

Imatge recent de la Memoria Sancti Sepulchri de Narbona.

No sabem si en origen les columnes (en especial les dues parelles del frontispici) eren llises o tenien estries en espiral com les de les Arques de la Torah. De fet, potser les semblances entre la versió constantiniana del Sant Sepulcre i la proposada reconstrucció de la tomba original de Sant Pere, retratades en la ‘Memoria‘ de la Narbona del bisbe Rústic, siguin casuals i amb explicacions ben allunyades de les exposades aquí. No sent pas expert en iconografia funerària antiga, si no hagués llegit el treball d’en Ferber poc abans del de Griffe, probablement no hagués fet la connexió. Però és un fet que fou el mateix Constantí qui ordenà en paral·lel tant les obres de la tomba de Sant Pere a Roma com les del Sant Sepulcre a Jerusalem (i recordem el paper de la seva mare Helena i la invenció de la Veracreu) [11].

Com també sembla evident que el tema del Sant Sepulcre havia de tenir màxima prioritat en l’imaginari cristià dels segles IV-V, com prova la mateixa existència d’una peça tant excepcional com aquesta Memoria Sancti Sepulchri feta a penes un segle després, en un lloc tan allunyat con Narbona.

No em direu pas que les concordances (tan formals com de context),  no són notables.


Notes


2017-juny a cathalaunia.org

$
0
0

Juny ha resultat ser un mes discret i funerari, dos adjectius que s’acorden fàcilment.

Aquest bloc ha rebut una entrada treballada sobre les tombes principals del cristianisme, les de Jesucrist i Sant Pere, rematada per dos afegitons abans de tancar el mes.

La feina del mes a cathalaunia.org ha estat discreta, de millores sistèmiques i sense arestes.

La Secció Ibèrica i Romana ha rebut el gruix de l’atenció i mereix un petit comentari. Un dels trets del Corpus Iberika és el fet de dedicar una única entrada a cada epigrafia. Pot semblar obvi, però no era així en origen, i diverses interpretacions d’un mateix text tenien cada una una entrada pròpia. Amb la sistematització dels continguts, això va estar canviat per tal de simplificar l’exposició i facilitar l’anàlisi. Aquest mes s’han eliminat un petit grup d’entrades ‘repetides’ que havien escapat al cribratge major fet fa uns mesos.

Si la voluntat del Corpus fos presentar una edició crítica dels epígrafs, certament caldria contemplar les diverses interpretacions fetes per els experts (per exemple, a base de complicar la notació dels texts originals), però no és aquesta la filosofia del web cathalaunia.org, que es limita a presentar dades bàsiques, acompanyades sempre de les indicacions i referències necessàries per tal que qui ho vulgui pugui consultar les corresponents edicions crítiques. Exactament el mateix que es fa en el Fons Cathalaunia, on es presenta una versió lo més correcta possible dels texts altmedievals, però sense entrar en el detall (i les dificultats) pròpies d’anàlisis crítiques; el que sí es fa és donar sempre els enllaços o les referències als dits treballs. Resumint, i com ja s’ha explicat altres vegades en aquest bloc, el web cathalaunia.org no pretén en cap cas ser una font d’autoritat (ni es pot, ni es vol) sinó una facilitat de recull i exposició de les dades conegudes sobre la Cultura Catalana anterior al segle XII (i a partir d’elles, sí, als treballs que les estudien, per descomptat).

Però més enllà d’eliminar algunes repeticions, el Corpus Iberika a més s’ha vist enriquit amb la incorporació de la resta d’entrades numismàtiques presentades en el Corpvs Nvmmvm Hispaniae Ante Avgvsti Aetatem. Tot i que la majoria ja hi eren, en quedaven desenes per incorporar, un cop processades, el nombre d’epigrafies s’ha elevat fins les 3.366.

Aquesta obra il·lustra força bé els problemes metodològics que encara té el Corpus en el tema numismàtic. Per una banda, si volem que cada entrada reflecteixi una única epigrafia, en el cas de les monedes, el concepte es pot transportar a una entrada (o un grup d’entrades) per cada tipus. Aquesta és l’aproximació dels Monumenta Linguarum Hispanicarum d’Untermann, que presenten una imatge de cada una de les inscripcions de cada tipus, però en l’obra de Villaronga, al sistematitzar els continguts, els elements epigràfics es desglossen en les diferents parts composants de les evidències de cada context, i la relació tipus monetari – text, es redueix a una descripció analítica. Té plena lògica des del punt de vista numismàtic, però perd la individualització de l’escriptura de cada un dels tipus monetaris que Untermann honorava. El Corpus incorpora ara tots les parts composants detectades per Villaronga, per tal de tenir registrades totes les variants, però com que la relació unívoca entre entrada dels corpus i epigrafia concreta es perd, aquestes entrades no tenen reflex en la quantitat d”objectes’ que es recompten en la pàgina inicial del Corpus (una quantitat ja de per se força difícil de definir, atesa la pluralitat de casuística que cal contemplar en el recull). Això introdueix un cert grau de duplicació amb les tipus dels Monumenta incorporats en el Corpus, i a més, una certa simplificació ja que les literalitats presentades per Villaronga no es corresponen sempre exactament a les dels tipus d’Untermann (un exemple d’aquesta problemàtica es detectà en el darrer article produït sobre temàtica ibèrica: Vilaseca i Corbera, Joan : 2017 : “Els caràcters de l’ibèric nord-oriental, una aproximació quantitativa” , apartat: Categoria Ta/Da p.69).

La Bibliografia i la lectura associada ha continuat a bon ritme, i la llista de títols ‘perllegir‘ ha baixat fins els 220s, una xifra inimaginable fa uns mesos.

Per -no- variar, llistem les incorporacions del mes, per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

Aquest mes, cathalaunia.org ha superat la barrera de les 27.000 entrades i presenta en el seu tancament, 27.131 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

Els Fets i el Consens. Tabús i Elefants.

$
0
0

Sabem poc, molt poc. Tan poc, que potser una de les poques actituds vàlides sigui la de Sòcrates: “Només sé que no sé res”.

Fets i Consens

Una de les coses que sorprèn a una persona de mentalitat ‘de ciències’ que es posa a estudiar Humanitats, és comprovar en primera persona com de diferents són en el seu funcionament; d’aquí la primera part del títol. La Ciència mira d’analitzar els fets i escatir les seves causes, seguint l’axioma d’en Guillem d’Occam: elegir l’explicació més simple que dongui raó de totes les evidències[1]. Un sol fet contradictori elimina una teoria, sense excepcions.

En les Humanitats, però, tot i seguir el mateix principi, els fets es veuen substituïts per el consens. En certa manera, és com la inversió del principi periodístic aquell segons el qual: els fets són sagrats i les opinions lliures. I no és en va que sigui així. El coneixement humà és molt ampli, i sobrepassa l’àmbit estricte de les Ciències, centrades en bona mesura en l’empirisme i per tant només en els fets repetibles. En les Humanitats els ‘fets’ sovint fan de mal definir, d’aquí el consens com a  mitjà de validació. En Ciències, o una teoria es demostra lògicament certa i/o empíricament verificable, o no existeix. En les Humanitats, a falta d’uns mecanismes de verificació lo prou simples, és el consens el que dirimeix l’acceptació o no d’una teoria. El sistema funciona en la mesura que el consens no s’aparti de forma significativa de l’experiència comú, i que per tant, resulti efectiu i no disfuncional. El problema és que això té poc a veure amb la Veritat, que no deixa de ser l’objectiu primer tant de les Ciències com les Humanitats.

La cola, la pega que uneix el conjunt, la Filosofia l’identifica com el concepte de: “imago mundi”, o descripció de la realitat. A diferència d’altres espècies, els sers humans naixem a mig fer, cap grossos i pelvis estretes així ho imposen, de manera que els humans necessitem ‘educació’, ‘formació’. Totes les societats han de ‘educar’ els seus petits, per tal que sobrevisquin i siguin i facin com fan la resta dels seus congèneres, de manera que un cop els canvis fisiològics propis del creixement s’hagin esdevingut, el subjecte ja sigui un membre ‘hàbil’ en la seva societat. Tenint en compte que a més, som sers bàsicament culturals (l’evolució física també hi és, però sembla anar a un ritme molt més lent), el resultat es que aquest procés defineix el que és (i ha de ser)  ‘real’ i el que no per el subjecte, que no és, sinó el que la resta de membres ja formats (els mestres) entenia ser; començant per exemple, per la creació d’un ‘jo’ versus uns ‘altres’.

El resultat és que agradi o no, la concepció de la pròpia realitat (i això inclou al propi subjecte) és relativa, diversa, canviant. La cerca de la veritat obliga a examinar-ne els fonaments. I en aquest cas, entendre que la compulsió que vol que aquesta imago mundi sigui total, única i capaç de donar raó a tota l’experiència del subjecte, no neix, evidentment, de la seva naturalesa intrínsecament circumstancial, sinó del fet que és l’única manera que té el subjecte per sobreviure[2]. Sense raó, els éssers humans no semblem ser una espècie gaire satisfactòria. La torna, tràgica, és que la raó, l’única eina per ordenar la nostra percepció, ens porta a confondre la realitat – sempre un pas més enllà dels sentits – amb el que ens ha estat ensenyat, i confondre, com bé escrigué Plató, l’ombra de les nostres interpretacions apresses amb l’innombrable que les provoca.

Poden semblar disquisicions allunyades de l’estudi de la Història, però no. No, atès que si com diem la noció de realitat és fruit del consens social, és evident que aquest no és immutable, tot el contrari, evoluciona en el temps. Segons la imago mundi del que coneixem com civilització occidental, aquesta evolució és atzarosa, no dirigida per cap mà invisible ni influència major discernible (no així per concepcions anteriors, on sí identificaven als actors d’aquesta mena de canvis, per exemple, en les divinitats; però això ens portaria a un punt que no és el que avui es vol desplegar aquí). Però sigui quina sigui la seva causa, és ben evident que la seva evolució al llarg del temps sí cau en l’àmbit de l’estudi de la Història i disciplines associades o properes. Passem a la segona part del títol.

Tabús i Elefants.

Si hem vist com el consens, és, per definició, l’acord dels vivents en un moment determinat, Clio ens ensenya que aquests acords van canviant en el temps i que d’aquests canvis també en podem treure ensenyances. D’això és del que es vol parlar aquí. Anem a lo concret.

L’impuls de fer aquest apunt neix de uns episodis personals relativament recents: una conferència sobre arqueologia dels ibers i unes xerrades informals amb experts, sobre escriptura ibèrica, computació i història medieval. Episodis on es manifestà com la gestió del coneixement de cada disciplina modela – i a voltes deforma – el propi coneixement.

Ja fa uns mesos, en una deliciosa xerrada sobre l’arqueologia del mon ibèric, el conferenciant, entès i entusiasta de la seva disciplina aprofitava el cas ibèric per explicar l’evolució dels esforços que des de fa gairebé un segle van fent els arqueòlegs per mirar de detectar fenòmens socials de caire cultural, com ‘ètnies’ o ‘pobles’, a partir del registre material. Exposició magistral que no deixà de provocar un regust agredolç al veure reproduir-se uns mateixos errors sistèmics, repetits abastament, i que ja hem mirat de comentar en aquest bloc diverses vegades.  En el torn de preguntes vaig mirar d’apuntar els rudiments dels problemes sistèmics de la aproximació que s’havia explicat, però, certament ni era el lloc ni el moment per disquisicions gaire profundes, de manera que vaig preferir deixar-ho així.

En el cas concret de la conferència, la problemàtica era la detecció de ‘cultures’ o ‘etnicitats’ des del món de l’arqueologia, però els problemes sistèmics no tenien a veure específicament amb aquesta problemàtica, ans bé són més generals i es poden trobar repetits una i altra vegada en la producció acadèmica. El que parlarem es pot aplicar al cas aquest, però també a moltes altres temàtiques; ho podem veure en si parlem de ‘revolució feudal‘ o ‘etnogènesi‘ o ‘renaixement carolingi‘ o… Potser la disciplina històrica estigui en una posició especialment adient per diagnosticar-los, en la mesura que obliga a una mirada reflexiva sobre la seva pròpia evolució, i de retruc ajudar a la resta de disciplines de les Humanitats ( si és que es deixen, és clar).

Hi han dues mancances sistèmiques. La primera, la fàcil, és que tota teoria, pateix la tensió entre la simplicitat d’una ideació i la complexitat de la realitat que vol explicar. En Ciències, això no es dóna, ja que s’aplica sobre la part del consens interpretatiu que menys problemes dóna, i que la compulsió porta a considerar ‘universal’, de manera que si la idea no funciona, per maca que sigui, no val, i tal dia farà un any, però adversament, una teoria acceptada s’engrana amb la resta en un edifici cada cop més gran, i no desapareixerà fins demostrar-se falsa o veure’s superada per una explicació millor[3]. Però en les Humanitats, no és així, les teories tracten de parts del consens perceptiu menys globals i que sí admeten explicacions parcials o fins i tot contradictòries, sense que això les anul·li d’arrel. De forma que el cicle usual que recorren les teories en el món acadèmic de les Humanitats és: naixement, evolució (cicles dialèctics tesis/antítesis/síntesis), i … Oblit.

L’enfrontament, la tensió entre la simplicitat de la idea i la complexitat de la realitat alimenta la part central, la fase d’evolució, i tot i que pot precipitar-ne la fase final d’oblit, no té perquè fer-ho , ja que el final en les aigües del riu Leteu esta prèviament marcat per la segona mancança sistèmica, que no és altre que el fet inexorable que tota teoria parteix de les categoritzacions pròpies del seu temps, i que per tant, l’evolució de l’acord interpretatiu global anirà arrastrant el consens fins tornar els termes constituents de la teoria en irrellevants,  per finalment ser oblidats. Pot semblar una posició excessivament derrotista, però és el que indica l’estudi de la Història, o si voleu, les Muses; ja que si us hi fixeu, el crit gairebé instintiu en contra d’aquesta perennitat intrínseca, no neix de la observació sinó de la compulsió de l’acord interpretatiu que vol que les categories que utilitzem siguin, o més ben dit, hagin de ser ‘les de debò’, les ‘certes’, ‘les úniques’, ‘les reals’. Però és un fet que l’edifici teòric que es fa en les Humanitats, tant com es va construint en la façana del present va caient oblidat en la del passat. La part que sobreviu no creix com vol el mite modern del progrés, i cal entendre si més no alguns dels motius que sumats a aquesta evolució global de la interpretació de la realitat i de retruc del consens, fan que això sigui així.

Per exemple, si ens centrem en la disciplina històrica, tenim força exemples de com les categories que van donar lloc a una teoria en el seu moment ‘nova’ s’han anat fent velles independentment de l’evolució de la pròpia teoria. El mecanisme dialèctic (tesi/anti/sinte), que poc durar dècades i fins i tot algun segle, no duu a cap resultat durador, ja que els principis que informen la dialèctica del cas concret esdevenen amb el pas del temps, caducs. Per això sovint sembla inútil l’excés de teorització que apareix a partir d’un cert punt de la evolució d’una teoria. He sentit historiadors queixar-se repetidament d’aquesta mena d’onanisme intel·lectual de parlar i discutir extensivament sobre un edifici teòric bastit sobre uns texts antics, que ni s’han llegit. És un símptoma clar que la teoria està en fase decadent. El següent pas, és el seu oblit per desinterès, no per què s’hagi demostrat errònia, sinó intranscendent. I també cal recordar també que tot i que hi ha gent amb capacitats desmesurades, la majoria de participants en el consens les té normaletes, i per tant, a partir d’un punt, el gruix de participants és simplement incapaç d’anar més enllà.

Una altra de les limitacions sistèmiques que provoca aquest fenomen, és que per definició, en les Humanitats el consens és bàsicament un fenomen social, i de igual manera que als nens els ensenyem el que són i el que han de fer, també els hi inculquem amb igual severitat – però més discreció – el que no. I si ho duem al camp social, aquí neix el tabú, un mecanisme definitori del consens -per negació- tan potent com la pròpia didàctica positivista i que contribueix a formar la ortodòxia regnant en un moment i àmbit determinats. Hi han coses que no s’han de parlar o pensar, i encara menys discutir en públic (Nen, caca!) ; de fet en Sòcrates el van matar per això, i és que ningú ha dit que la cerca de la veritat sigui quelcom fàcil o agradable[4].

Els professionals de l’estudi de les Humanitats ho saben prou bé; de fet, he sentit gent dient que com que controlen l’ortodòxia tenen el poder d’excloure el que no els hi agrada; sense manies i com si fos el més natural del món. De manera que el que semblava que eren disquisicions teòriques sobre el consens perceptiu té una concreció ben real quan aquest conforma el consens de l’estudi de les Humanitats i fa que hi hagi una doble problemàtica. La natural de la teorització, que ja hem delineat fins ara, i la prèvia, que mira de controlar sobre què es pot teoritzar. Aquí arriben els elefants.

I és que el tabú, conscient o inconscient, provoca ceguesa col·lectiva i permet que hi hagin autèntiques ‘àrees mortes’, ‘punts cecs‘ en el coneixement del moment. Els mecanisme és ben simple; ridiculitzant-lo: “Si som molts i fa molt que ens dediquem a això, és impossible que algú ara vingui i ens faci veure que hi havia un elefant que no havíem vist. I ara! S’ha malfixat, tants no podem estar tan equivocats…!”. O la reacció típica del professional encarat a un d’aquests temes tabú: El tema aquest… Uf! Sí, passo, quin marron…!.

Si estiguéssim parlant només d’idees, no passaria de ser ridícul, però parlant de gent resulta especialment feridor, ja que el mecanisme que alimenta el tabú és el mateix que construeix l’ortodòxia, els acords de consens, i baixant al detall, les ‘capelletes’ o adhesions personals, i està modelat preferentment per els interessos socials que certament tenen poc a veure amb el saber i molt amb el control social (homo lupus homini est). Potser sigui en part inevitable, (la natura humana, etc, etc) però cal posar-ho de manifest, ja que sinó ens creurem l’Arcàdia felix que vol que el món del saber estigui per damunt de la seva pròpia societat.

Cal entendre però, que en part és un mecanisme natural. Enfrontada a l’horror vacui de la ignorància, la ment dels humans es refugia en l’únic que té, els seus coneixements, les ombres de la pared i mira d’oblidar que està encadenat. El tabú neix de la projecció a l’àmbit social d’aquesta por ancestral al desconegut, o si voleu, de l’amor a les cadenes amb les que ens van lligar els nostres educadors, o un déu juganer si així ho preferiu.

Si un entén que l’acord perceptiu crea àrees mortes, pot també entendre que és allà on habiten els elefants, i que la seva existència no qüestiona de per se la resta de coneixements, tant sols els amplia (la mida d’un forat en concret de vegades es pot intuir; quantes més preguntes bàsiques, ‘de parvulari’, es puguin fer que tinguin el silenci -o la retòrica buida- per resposta, més gran és el forat).  Però no és socialment fàcil, el tabú amaga també grans preguntes, preguntes bàsiques que exposen la nostra immensa ignorància i que qüestionen les nostres opinions més habituals; per això la seva anàlisi es penalitza. Però com digué en Martin Luther King: “we start to die the moment we become silent about the things that really matter”. Oi que m’enteneu si em quedo amb Sòcrates al costat d’en Galileu i l’esperit del seu: “e pur si mouve“?

 


Notes

  • [1] La famosa Navalla d’Occam: “entia non sunt multiplicanda praeter necessitatem”. Col·loquialment, el principi KISS: “keep it simple, stupid!”.
  • [2] Fixem-nos que si canviem la imago mundi, sí podem donar altres etiologies a tal compulsió. De manera que la pregunta potser seria: pot algú criat en una ‘imago mundi‘ determinada aprendre’n una altra? La resposta és Sí, però és un procés arriscat i que acostuma a tenir efectes devastadors.
  • [3] Quan un tema científic toca aspectes de l’acord global menys compartits, és quan podem veure als científics jugant a ser filòsofs, amb resultats sovint força hilarants si tens una mirada juganera.
  • [4] Tampoc res de nou sota el sol, parafrasejant Qohelet: ‘mal ofici aquest‘, i: ‘on hi ha coneixement hi ha dolor i qui acumula saber acumula penes‘.

2017-juliol a cathalaunia.org

$
0
0

S’acaba juliol i cal fer repàs; ha estat un mes de reconnexió. Desprès de l’inesperat hiatus de gairebé un any dedicat a la escriptura ibèrica, aquest mes s’ha tornat a l’estudi de l’alta edat mitjana. El cert és que aquest parèntesi ha anat força bé per agafar distància i poder avaluar millor la feina feta fins ara La represa de la disciplina històrica es gaudeix millor, tot i la seva exigència.

El web, quasi no ha tingut novetats més enllà de les bibliogràfiques. Ha estat un mes d’estudi, lectura i escriptura.

Aquest bloc ha tingut un apunt d’aquells genèrics que representa no hi tindrien que ser (era sobre el coneixement i els tabús), però les ganes han guanyat i si més no, s’ha obert la porta perquè surtin uns quants elefants a pasturar una estona. Part del mes també s’ha dedicat a preparar un proper apunt de tema històric (d’aquells que porten feina, amb moltes dades i notes), esperem treure’l en qüestió de dies.

La Bibliografia ha estat l’única secció amb novetats. Poques, però novetats si més no. La lectura dels títols pendents ha continuat i ara està en els 190s, tot i que la majoria ja havien estat llistats prèviament i per tant no consten.

Com sempre, llistem les incorporacions del mes, per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta un total de 27.164 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

Viewing all 324 articles
Browse latest View live