Il genoma culturale e il DNA degli scrittori - Idee 45

Secondo Franco Moretti, ricercatore italiano a Stanford, per capire davvero i testi letterari bisogna farli leggere a un computer. Ne scrive il New York Times, non senza ironia. I risultati, però, sono concreti. A partire da indicatori grammaticali e semantici, o dalla pura frequenza delle parole, software dedicati sono in grado di ricondurre un testo a un genere letterario. Ci riescono perché lo fanno a partire da una banca-dati (30 testi identificati per genere e già sottoposti ad analisi). La cosa interessante è che i computer considerano indicatori non contenutistici, ma puramente formali o strutturali: tutta roba che noi, leggendo, difficilmente riusciamo a vedere.
Il bello dei computer è che riescono a macinare enormi quantità di testo. Google, per esempio, digitalizza 5 milioni di libri scritti dal 1800 a oggi. Questa massa di dati ha già un nome: culturomics, genoma culturale. Per ora online c’è un motore di ricerca che permette di scoprire quante volte e quando una parola o un’espressione appare nei corpus scansionati, ma già questo è utile: leggete l’articolo di Punto Informatico (in italiano) o guardate (ancora solo in inglese, purtroppo) il TED Talk che racconta il progetto.
Si può passare dal macro al micro. Dal genoma culturale al DNA degli scrittori, intesi come singoli autori. All’Università di Toronto, Ian Lancashire analizza al computer 16 gialli di Agatha Christie. Scopre che negli ultimi il lessico è meno ricco e le frasi si ripetono. Lancashire è cauto a trarre conclusioni, ma questi marcatori linguistici sono gli stessi che si trovano nelle persone colpite da Alzheimer.
In un paper tecnico Ying Zhao e Justin Zobel della School of Computer Science and Information Technology di Melbourne raccontano della capacità dei computer di riconoscere gli autori lungo un corpus di opere.  A pag. 5 del documento c’è un indice di accuratezza del sistema: Tolstoj viene individuato solo una volta su due, ma su Shakespeare il computer non sbaglia praticamente mai. E, distinguendo con chiarezza Shakespeare da Marlowe, smentisce analisi precedenti. Insomma: perfino i computer cominciano a dissentire fra loro sulle attribuzioni. Il che li rende almeno un poco umani…
Se volete analizzare la vostra scrittura potete farlo online. Potete, per esempio, scoprire quali sono le vostre parole e le vostre frasi ricorrenti. E trovate strumenti per valutare la leggibilità di un testo o evidenziare la terminologia specifica.

8 Commenti a Il genoma culturale e il DNA degli scrittori – Idee 45

  1. jac

    E pensare che fino a quando non fu inventato il computer i filologi tedeschi facevano questo lavoro “a mano”!. Non diteglielo, per favore!!

     
  2. andromeda

    Riguardo alla ripetizione di alcune frasi o “marcatori” del linguaggio( anche nei libri), credo anch’io che questo sia valido per molti aspetti che caratterizzano il “fattore umano” e che non siano solo sintomo di un Alzheimer incombente. Seguendo la trasmissione di Stefano Bollani su rai3 in tarda serata, domenica scorsa, mi ha colpito( pur non essendo una novità) il racconto che Bollani ha fatto del famoso brano di Nino Rota, poi diventato colonna sonora ufficiale de Il Padrino e per questo famosa in tutto il globo. Bollani, per introdurre il discorso, diceva: perchè, Nino Rota, non ha mai vinto un oscar per questa canzone? Non ha mai vinto l’oscar perchè non era una colonna sonora originale, mentre lo vinse nel ’75 per la colonna sonora de Il Padrino parte II. Nino Rota aveva dimenticato che quella colonna sonora http://www.youtube.com/watch?v=ehh2wH2MJmI era stata composta da lui anni prima, o almeno il refrain, per un altro film, Fortunello: la musica era molto più veloce e allegra, ma il motivo in apertura del film, era proprio quello. Semplicemente, Nino Rota se ne era dimenticato…nella musica accade continuamente, si ripete per mancanza di memoria, di fantasia, di originalità( ma non è il caso, a parte la memoria, di Nino Rota..), nella vita di tutti i giorni questo accade nel linguaggio parlato e scritto, la cosa che più dovrebbe rappresentarci. Trovo il culturomics, il genoma culturale individuato da questo nuovo sistema informatizzato, qualcosa di estremamente interessante, senza dubbio da approfondire . E trovo ancora più interessante che i vari computer dissentano tra loro sulle attribuzioni, un pò come se da questa sorta di “discorso incrociato” potesse nascere qualcosa che lontanamente potrebbe assomigliare all’anima, a qualcosa di vivo e non semplicemente di “funzionante” o funzionale. Un pò come i post di Annamaria che suscita ancora, nei confronti di un linguaggio sempre più povero, basico, sempre più linguaggio-macchina, pro-internet, pro-google e così via, la possibilità di rianimarsi e prendere vita, almeno nel suo blog…

     
  3. Utente Anonimo

    All’università ho dato un esame di Linguistica Computazionale che prevedeva anche una prova pratica: inserire su appositi software un corpus lavorato con appositi marcatori. Lì ho conosciuto le concordanze e il loro potenziale. Il corpus era a scelta e io ho scelto di confrontare due poeti, a partire da una personale ipotesi di somiglianza tra i due. Non ritengo la mia prova esaustiva – non ho infatti inserito l’opera omnia ma soltanto una parte di essa – ma scoprire che questi due autori, lontani per stili e nel tempo, abbiano addirittura un verso in comune è stata… una rivelazione. Non solo, scoprire che uno dei due, che nelle antologie viene sempre descritto come incline al sentimento amoroso, in realtà – ossia nei fatti, nella sua stessa scrittura – usi termini che riguardano tale sentimento solo in seconda battuta rispetto ad altri, molto più forti, di fuga, be’, per me è stato come aver compreso che può esistere un metodo scientifico alla base di ogni studio serio e concreto della letteratura e non solo. Chiara – http://www.ivasicomunicanti.net

     
  4. annamaria

    Ciao Chiara, il lavoro che hai fatto è per caso online? Se sì, ci dai l’indirizzo? Tra l’altro: ogni tanto succede che un tema di NeU ritorni, qualche giorno dopo, sulle pagine di un grande quotidiano. La cosa mi fa piacere: vuol dire che siamo riusciti a cogliere al volo qualcosa che era nell’aria. Oggi, per esempio, esce su Repubblica un articolo sul lavoro di Carlo Strapparava.

     
  5. ivasi

    Ciao Annamaria, sì, direi che cogliete spesso qualcosa che era nell’aria… Peccato che spesso tante idee rimangano solo nell’aria qui in Italia, e si vedano volatilizzare giorno per giorno quei tesori che abbiamo sotto gli occhi, a portata di mano. Erano tanti anni che non riaprivo la mia ricerca, era molto tecnica, quindi non l’ho mai pubblicata. Ci sono due alternative: o vi mando i documenti, riservandomi di dargli una forma pubblica comprensibile, oppure mi decido finalmente a pubblicare il lavoro sul mio blog, e vi mando poi il link. Almeno so che qualcuno gli darà un’occhiata;) Grazie per il tuo/il vostro lavoro instancabile, come sempre “nuovo e utile”! Chiara

     
  6. Utente Anonimo

    Chiara, per favore: pubblicalo sul tuo blog. Interessa molto anche a me, il tuo lavoro! Grazie, Valeria

     
  7. Fiorella Palomba

    Affascinante! Mi piacerebbe approfondire (*_))

     
  8. Pingback: La scrittura delle emozioni e l’analfabetismo emotivo - Nuovo e Utile | Teorie e pratiche della creatività.

Inserisci un commento al post

Cerca in Nuovo e Utile
34 queries in 1,171 seconds.