Testo, spogli, statistiche, iperlessico

gb 2008




Questa edizione correda il testo di rappresentazioni multiple del suo lessico: glosse, glossario, formario, concordanze... e quello che è stato chiamato ‘iperlessico’. E le visualizza in finestre divise in riquadri. Le rappresentazioni sono state prodotte da informazione codificata dentro il testo, com’è proprio della scrittura elettronica – che è non tanto un formato quanto una matrice di formati (formato è qui una particolare selezione e presentazione di contenuto lessicale).


XML – un linguaggio scribale

L’informazione è aggiunta alla trascrizione elettronica del testo, ed è formulata nella sintassi di XML – eXtensible Markup Language.

XML prescrive di racchiudere il contenuto da ‘marcare’ fra due coppie di parentesi angolari, di apertura e chiusura, con una sigla, tag, scelta opportunamente (XML ha semantica libera):

<tag>content</tag>

E consente di aggiungere, dentro la prima coppia di parentesi, ‘attributi’ del tipo name="value":

W  parola
   l  lemma
   c  classe lessicale
   o  omografia
   s  sintassi (reggenza)
   g  grammatica (morfologia)
   t  traduzione italiana

Così la siglatura

<W l="gefrignan" c="v" s="a+" g="p1p" t="apprendere">gefrunon</W>

sta per:
   - la parola (W) gefrunon è una forma del lemma (l) gefrignan,
   - la sua classe (c) è il verbo (v),
   - regge (s) un accusativo e una frase complemento (a+),
   - la sua morfologia (g) è preterito 1 plurale (p1p), e
   - nel contesto la sua traduzione italiana (t) è apprendere.

L’attributo di omografia, o, distingue lemmi omografi della stessa classe,

<W l="metan" c="v" o="o1" s="a" g="p2p" t="misurare">mæton</W>
<W l="metan" c="v" o="o2" s="a" g="p3s" t="incontrare">mette</W>

ed è usato anche nel caso opposto di nomi con doppio genere (siglato come c):

<W l="sæ" c="m" o="o1" g="as" t="mare">sæ</W>
<W l="sæ" c="f" o="o1" g="as" t="mare">sæ</W>

Altre coppie di parentesi e altre sigle contrassegnao i versi (con umero), le sezioni o fitt (con numero) e l’intero testo (con titolo e abbreviazione); la loro configurazione è a chiasmo:

<POEMA titolo="Beowulf" abbr="Be">
  <FITT num="I">
    <V n="53">
      <W...>...</W>
    </V>
  </FITT>
</POEMA>

La sintassi XML prevede elementi o affiancati fra loro o ‘annidati’ l’uno dentro l’altro (nesting): non consente embricatura.


Finestre e riquadri

Il testo e le rappresentazioni del suo lessico sono visualizzate in due finestre divise in riquadri: Spogli e Iperlessico.


Finestra 1: Spogli

Il menù a tre bande in cima alla finestra indica che cosa può essere chiamato nei cinque riquadri in basso (etichettati).


     Glosse

Testo con glosse interlineari. Le glosse sono un glossario analitico in situ, con i lemmi nell’ordine sequenziale delle parole nel verso e con informazione lessicale completa secondo il contesto. Testo e glosse possono anche essere chiamati in riquadri diversi. Le abbreviazioni si espandono posizionando il cursore su di esse.


     Glossario

Glossario analitico dei lemmi con tutte le loro forme. Anche qui le abbreviazioni si espandono posizionando il cursore su di esse.


     Formario

E’ l’elenco di tutte le forme, ciascuna con il suo lemma, e le omografi distinte.


     Glossario italiano-anticoinglese

E’ il lemmario dei traducenti italiani usati nell’attributo t.


     Concordanze

Le concordanze sono per lemma.

Glossario, formario, glossario italiano-anticoinglese e concordanze sono linkati fra loro. Cliccando un lemma del glossario in un riquadro si può vederne la concordanza in un altro, e viceversa; e così per glossario e formario, e glossario e glossario italiano-anticoinglese. Tutti i numeri nei quattro spogli sono linkati ai versi del testo, e cliccandoli si possono vedere i contesti.


     Composti e parole poetiche

I composti sono elencati per lemma semplice (come prima o seconda parte). Le parole poetiche (quelle usate solo in poesia) sono collegate con un clic ai versi in cui compaiono.


     Reggenze

Sono le reggenze di verbi, nomi, aggettivi e preposizioni. I verbi sono raggruppati secondo il numero di complementi, da zero a tre (caso/i o frase o entrambi); anche alcuni nomi e aggettivi reggono casi e frasi; pre- e post-posizioni con i loro casi sono elencate separatamente (per mostrare quali pre sono anche post).


     Statistiche

Liste di frequenza dei lemmi e distribuzione delle classi lessicali insieme a composti e parole poetiche. Questa distribuzione è anche confrontata con quella del corpus nel suo insieme (attraverso la differenza tra la frequenza effettiva e quella attesa), ed è mostrata in un grafico che dà un profilo dello stile lessicale del testo. I valori sono significativi se eccedono ±2. Sono riprodotti per confronto i grafici di tutti i testi siglati.
Per questi e altri grafici vedi Lo spazio lessicale della poesia antico inglese: pdf.


     Superglossario

E’ il glossario analitico di tutto il corpus siglato finora. Tutte le abbreviazioni, comprese quelle dei testi, si espandono posizionando il cursore. In fondo al file c’è il numero totale di forme e lemmi; in Abbreviazioni c’è l’elenco dei testi e delle edizioni usate.


     Altro

Testo con traduzione italiana a fianco; note linguistiche; elenco delle Abbreviazioni.


Finestra 2: Iperlessico

Le glosse possono essere chiamate una per volta come serve. La finestra dell’iperlessico si apre con il testo nel riquadro in alto a sinistra: la parole cambiano colore quando ci passa sopra il cursore – questo significa che sono cliccabili. E cliccando una parola qualsiasi in un punto qualsiasi del testo si visualizza la sua glossa nel riquadro sottostante. Questa sarebbe la versione elettronica del glossario tradizionale, con la sua consultazione parola per parola. Ma anche la glossa è cliccabile, e cliccando sulle sue varie parti appaiono negli altri riquadri le voci corrispondenti di formario, glossario (anche dei traducenti) e concordanze. Si ha così un profilo della parola.