mercoledì 13 gennaio 2016

Il problema dei dati

Sono un fisico e mi occupo - in buona parte del mio lavoro - di meccanica statistica. In origine la meccanica statistica studiava la statistica della meccanica.

Un esempio che si capisce? Le molecole di un gas. Ogni singola molecola obbedisce alle leggi della meccanica (lasciamo stare se classica o quantistica, è importante ma non in questo discorso), che in genere sono note e comprensibili, spesso persino semplici. Un classico esempio di sistema a due corpi (in prima approssimazione) è il sole e la terra.



 Ma cosa si può dire di un sistema con molte (moltissime) molecole?


Predirre il moto di tutte le molecole è impossibile e - oltretutto - poco interessante; saper dire qualcosa su una proprietà statistica (una media, una varianza, etc.) dell'insieme di molecole è possibile ed è spesso molto interessante. Ad esempio: temperatura e pressione di un gas in un palloncino sono proprietà statistiche.

In un paio di secoli di vita, la meccanica statistica ha sviluppato conoscenze, metodi, tecniche matematiche totalmente ignorate - quasi sempre giustamente (perchè non servono quasi mai ai loro scopi) - dagli statistici di professione. Ma in quel quasi si è aperto un grande spazio vuoto negli ultimi decenni. Le molecole di un gas, soprattutto in situazioni di grande "affollamento" (densità), interagiscono tra loro, e questa interazione complica enormemente lo studio statistico. I fisici statistici hanno imparato come affrontare questa complessità. Il risultato è che in una serie (sempre più grande) di problemi in finanza, economia, biologia, epidemiologia, informatica, sociologia, etc., la meccanica statistica fornisce strumenti migliori di quelli appresi nelle facoltà di scienze statistiche, scienze economiche, politiche etc.


Va bene, ci siamo dilungati. Anche troppo. E allora?

Allora non voglio svelare subito il mio obiettivo. Mi limito (per chi è arrivato fin qui) a proporre un piccolo quiz. Il quiz consta di un'immagine e due domande.

Ecco l'immagine:



Dico pochissimo di questa figura: è la traccia di un segnale misurato in un esperimento. In ascissa c'è il tempo, in ordinata c'è una certa quantità. Come si intuisce, la figura è tagliata e il grafico rappresenta solo l'ingrandimento (per una piccola porzione di tempo) di un grafico che mostra lo stesso segnale per un tempo molto più lungo. Ed ecco le due domande:

  1. Qual'è la quantità in ordinata?
  2. Il segnale "completo", ovvero misurato in un tempo molto più lungo, ha una media nulla, positiva o negativa?