Le informazioni necessarie al linguaggio stanno in un floppy disk

I dati relativi al significato delle parole, alla loro occorrenza e al loro utilizzo occupano, nel cervello, uno spazio equivalente a 1,5 megabyte di dati: meno di quanto si credesse.

cervello-floppy
Quale quantità di informazioni comporta, conoscere una lingua?|Shutterstock

Quando apprendiamo la nostra lingua madre, il cervello immagazzina tutte le informazioni che ci occorrono per utilizzarla - dalla pronuncia dei fonemi alle regole della sintassi - in (appena!) 1,5 megabyte circa di dati: quanti ne custodiva un vecchio floppy disk. È quanto emerge da uno studio pubblicato sulla rivista Royal Society Open Science, in cui due scienziati delle Università di Rochester e della California hanno applicato i concetti della teoria dell'informazione per calcolare il volume di dati necessari a custodire e utilizzare le varie componenti della lingua inglese.

 

valore aggiunto. La teoria dell'informazione è un ramo della matematica che studia come un messaggio viene codificato e i modi più efficienti per trasmetterlo. Uno dei concetti fondamentali su cui si basa è l'entropia, intesa in questo caso come l'informazione media contenuta in ogni messaggio trasmesso. Un messaggio prevedibile e che ha alta probabilità di essere emesso contiene poca quantità di informazione, uno più inaspettato e poco probabile veicola una maggiore quantità di informazione.

 

La quantità di informazione viene espressa in bit (che la teoria dell'informazione definisce come la quantità minima di informazione che serve a discernere tra due eventi equiprobabili: in altre parole equivale alla scelta tra due possibili valori - sì o no, vero o falso? - quando questi hanno la stessa probabilità di essere scelti): ebbene gli scienziati hanno calcolato quanti bit occorrono per codificare i vari aspetti della lingua inglese. Acquisire padronanza di una lingua implica molto di più che memorizzare le semplici definizioni accanto al lemma di un dizionario. Ci sono le informazioni associate alla pronuncia, quelle relative ai significati evocati da quella parola e le regole sull'uso di quel termine: a quali altri si accompagna? Quando non può essere utilizzato?

La conta dei dati. Gli scienziati hanno iniziato dai fonemi. Ce ne sono circa 50 nella lingua inglese, e possiamo stimare che ciascuno richieda 15 bit: tutti insieme, i fonemi soltanto richiedono circa 750 bit. Memorizzare le circa 40 mila parole che ogni madrelingua inglese conosce richiede circa 400 mila bit, ma se si aggiunge la semantica, cioè la mole di informazioni relative a ciascuna parola, si arriva a 12 milioni di bit.

 

Per semantica si intende «il pieno significato di una parola. Se ti dico "tacchino", ci sono molte informazioni che sai su di esso. Se sappia o meno volare, se sappia o meno camminare», spiega Frank Mollica, tra gli autori. Ricordare con quale frequenza si presenti ogni parola richiede altri 80 mila bit; circa 700 ne servono per fare proprie le regole della sintassi. Fatti i conti, la stima per l'apprendimento e l'uso della lingua inglese è di circa 1,56 megabyte: più o meno il necessario per salvare una foto digitale (di qualità medio-alta).

 

02 Aprile 2019 | Elisabetta Intini