Nei suoi 10 anni di vita, che si celebrano proprio oggi, Twitter ha fornito una miniera di dati utili al mondo accademico: cinguettii da tutto il mondo sono stati usati per elaborare sondaggi politici, mappare la diffusione di mal di testa ed epidemie, e ora anche... per misurare il tasso alcolemico di una città.
Un gruppo di scienziati dell'università di Rochester (New York) ha sviluppato un algoritmo di apprendimento automatico in grado di distinguere i tweet (in inglese) inviati da utenti ubriachi. Lo studio è stato pubblicato su arXiv.
Training linguistico. Il team ha analizzato 11 mila cinguettii geolocalizzati postati tra il 2013 e il 2014 nella città di New York e nell'area suburbana della Contea di Monroe, nello Stato di New York. Da questo database i ricercatori hanno selezionato i tweet che contenevano riferimenti all'alcol, a feste o all'essere ubriachi e le hanno date in pasto al software.
Assegnando diversi "punteggi" e pesi alle varie parole, l'algoritmo ha imparato a distinguere i tweet che si riferiscono all'alcol da quelli ambigui (con termini come club o party, che non necessariamente implicano l'essere "alticci").
Dove si beve di più? Utilizzando questi dati e altre analisi dei 140 caratteri postati, il software è riuscito a capire se ciascun tweet si riferisse allo stato di sobrietà dell'utente e se chi l'aveva scritto fosse effettivamente ubriaco mentre digitava. I dati relativi alla posizione sono stati poi usati per creare mappe sul consumo di alcol nelle aree analizzate.
Strumenti come questo potrebbero servire a elaborare statistiche in tempo reale e a costo zero sull'abuso di alcol e altri parametri associati alla salute, e intervenire con più prontezza rispetto a quanto si faccia attualmente.