List first – le liste e la Business Intelligence.

le liste e la business intelligence
Gianluca Mazza Analisi Digitale 4 maggio 2015 Leave a reply

Alcuni la chiamano business intelligence .

Anche l’attività di analisi dei dati (la cosiddetta Business Intelligence) può essere vista come un “sistema di liste”.

Uno dei miei libri preferiti “Alta fedetà” di Nick Hornby inizia così:

Ecco, per stilare una classifica, le cinque più memorabili fregature di tutti i tempi, in ordine cronologico:
1) Alison Ashworth
2) Penny Hardwick
3) Jackie Allen
4) Charlie Nicholson
5) Sarah Kendrew
Ecco quelle che mi hanno ferito davvero. Ci vedi forse il tuo nome lì in mezzo, Laura? Ammetto che rientreresti tra le prime dieci, ma no c’è spazio per te tra le prime cinque; sono posti destinati a quel genere di umiliazioni e di strazi che tu semplicemente non sei in grado di appioppare”.

Il protagonista, Rob Fleming, ha la mania di stilare liste di Top Five su tutto, come per esempio:

1 – Film in versione originale sottotitolata
2 – Migliori canzoni di apertura di lati A di 33 giri di tutti i tempi
3 – Donne che non vivono dove vivo io, da quello che so, ma che sarebbero benvenute qualora volessero traslocare
4- Musica che voglio sia messa al mio funerale
5 – Attività più accattivanti da bambino

Forse non ce ne accorgiamo ma anche noi generiamo continuamente liste. E’ il nostro tentativo di fare luce, capire qualcosa del mondo che ci circonda mettendo ordine e catalogando ciò che osserviamo e ciò con cui interagiamo.
Raggruppiamo, aggreghiamo, sommiamo, ordiniamo, cerchiamo somiglianze, affinità, correlazioni, oppure separiamo, distinguiamo, suddividiamo cerchiamo differenze, indipendenze. Questi sono i due grandi movimenti. Per arrivare ad un risultato accettabile in certi casi escludiamo ciò che non si piega o che è troppo “fuori” rispetto ai nostri criteri di classificazione oppure correggiamo dati incompleti o parziali in base a regole predefinite.
Ciò che alla fine otteniamo sono comunque “liste” di dati, elenchi di informazioni.

L’organizzazione della realtà in liste ci segue durante tutta la giornata; proviamo a pensare di quante liste ci circondiamo:

lista della spesa
lo scontrino del supermercato
estratto conto del conto corrente
dettaglio delle telefonate fatte
elenco delle cose da fare
lista degli appuntamenti della settimana
i link salvati sul browser
i tag sul nostro blog
gli amici di facebook
i contatti nel telefono
l’indice di un libro
lista dei cd o dei libri che possediamo
degli ingredienti di una ricetta
lista dei farmaci che dobbiamo prendere
la tavola degli elementi periodici
le tabelline che insegniamo ai nostri figli
l’elenco dei clienti ordinati per fatturato
il catalogo dei prodotti di un’azienda
elenco degli espositori di una fiera
gli articoli della costituzione
i 10 comandamenti
la formazione di una squadra
la classifica di un campionato
la lista nozze
le farmacie di turno
il pantone dei colori per dipingere la cucina

… ops … ho fatto una lista di liste …

Insomma sembra che ragionare per “liste” ci aiuti ad organizzare le informazioni e a muoverci nel mondo.

Nel bellissimo film “Non è mai troppo tardi” Jack Nicholson e Morgan Freeman vivono gli ultimi anni della loro vita cercando di realizzare una “Bucket List” cioè un elenco di cose da fare prima di morire.

 

Ci sono liste immobili, eterne, universali, direi “scolpite nella pietra” (a questo punto tutti avrete pensato ai Dieci Comandamenti …), e ci sono innumerevoli liste più o meno strutturate, spesso confuse, incomplete, fluide e volatili che nascono e muoiono nel giro di pochi giorni o di ore. Ci sono liste soggettive, particolari che necessitano di legende e spiegazioni per essere comprese anche da altri.

Anche l’attività di analisi dei dati (la cosiddetta Business Intelligence) può essere vista come un “sistema di liste”.
La Business Intelligence, in fondo, è un sistema e un metodo per mettere ordine tra i dati, organizzarli e associare loro altre proprietà che ci aiutano a comprenderli e quindi a trarne azioni, comportamenti, indirizzi.
Quindi la Business Intelligence ha a che fare con liste particolari, soggettive, fluide e mutevoli. Tanto è vero che una degli aspetti più importanti è avere un sistema di dati sempre aggiornato in grado di “fotografare” questo continuo cambiamento.
La questione fondamentale della Business Intelligence è: come li classifichiamo questi dati, come descriviamo ciò che osserviamo in modo che sia per noi utile?

Questo è proprio il punto critico di ogni organizzazione e rappresentazione dei dati: dare una conoscenza utile e fruibile e non solo formalmente corretta e scientifica.

Mi viene in mente un passo di un libro che ho riletto in questi mesi: “La vertigine della Lista” di Umberto Eco
Il problema di come classificare i dati è vecchio quanto il mondo.

Dice Eco:” Il sogno di ogni filosofia e ogni scienza sin dalle origini greche è stato quello di conoscere e definire le cose per essenza, e sin da Aristotele la definizione per essenza è stata quella capace di definire una data cosa come individuo di una data specie e questa a sua volta come elemento di un dato genere…Se ci pensiamo bene questo è lo stesso procedimento che segue la tassonomia moderna quando definisce la tigre o l’ornitorinco…
… Naturalmente il sistema delle classi e sottoclassi è più complicato, per cui la tigre apparterrebbe alla specie Felis Tigris, del genere Felis, famiglia dei Felidi, subordine dei Fissipedi, ordine dei Carnivori, sottoclasse dei Placentalia, classe dei Mammiferi; …
…D’altra parte se un bambino chiede alla mamma che cosa e come sia una tigre, la mamma difficilmente risponderebbe che è un mammifero dei placentalia o un carnivoro fissipede, ma direbbe piuttosto che è una bestia feroce che sembra un gatto ma è più grosso, è agilissima, gialla e striata di nero, vive nella giungla, all’occorrenza è mangiatrice di uomini, e così via.
Buona descrizione per conoscere e, nel caso, evitare una tigre.”
(La Vertigine della Lista, Umberto Eco, Bompiani pagine 217 e 218)

La nostra salvezza o meno dipende da come ci è stata descritta la tigre …

La realtà è molto più fluida, sfaccettata, complessa delle nostre categorie mentali ed a volte seguire strade nuove può anche portare ad acquisire nuove conoscenze.
Sempre citando il libro di Eco, mi chiedo che nuova conoscenza potremmo acquisire se suddividessimo gli animali in questo modo:
… l’elenco degli animali dell’enciclopedia cinese Emporio celeste di conoscimenti benevoli, inventata da Borges e poi ripresa da Michel Foucault come esergo di Le parole e le cose, per cui gli animali si dividerebbero in: a) appartenenti all’Imperatore, b) imbalsamati, c) ammaestrati, d) lattonzoli, e) sirene, f) favolosi, g) cani randagi, h) inclusi in questa classificazione, i) che s’agitano come pazzi, j) innumerevoli, k) disegnati con un pennello finissimo di peli di cammello, l) eccetera, m) che hanno rotto il vaso, n) che da lontano sembrano mosche
(La Vertigine della Lista, Umberto Eco, Bompiani pagine 327)

Oltre al problema di come classificare si pone anche il problema di cosa classificare.
Oggi abbiamo la possibilità di analizzare flussi continui di grandissime quantità di dati e stiamo fronteggiando un livello di complessità e, arrivo a dire, di confusione caotica, mai visto prima.
E’ come dover “classificare” una folla che riempie una piazza: persone di tutti i tipi, in continuo movimento, che entrano ed escono continuamente dal nostro campo visivo.

Cluster Analysis

Quante caratteristiche considerare per classificare una persona? E se queste cambiano nel tempo? E se consideriamo anche le parole che si dicono? E se vogliamo anche raccogliere informazioni sul loro stato d’animo?  Quale vertiginosa immensità di dati sta per abbattersi sul nostro sistema di Business Intelligence …

Data wave

Allora forse la qualità della analisi dati non sta più nella capacità di classificare e comprendere tutto, ma nella qualità delle domande che ci si pone, nella capacità di farsi le domande giuste.

Domande risposte

E sta sopratutto nel non smettere mai di farsi nuove domande e nel saperci convivere, perché è dalle domande che nasce la conoscenza. Non dalle risposte.
Lo spiega bene Wislawa Szymborska in una delle sue poesie:

Elenco

Ho fatto un elenco di domande
a cui ormai non otterrò risposta,
poiché o sono premature
o non farò in tempo a comprenderle.
L’elenco delle domande è lungo,
tocca questioni più e meno importanti,
e poiché non voglio annoiarvi,
ne rivelerò solo alcune:
Cos’era reale
e cosa sembrava esserlo appena
in questa platea
stellare e substellare,
dove oltre al biglietto d’ingresso
bisogna avere quello d’uscita;
Che ne sarà di tutto il mondo vivo,
che non farò in tempo
a paragonare con un altro mondo vivo;
Di cosa scriveranno
l’indomani i giornali;
Quando cesseranno le guerre
e cosa le sostituirà
All’anulare di chi
è ora l’anello
rubatomi – Perduto;
Dov’è il posto del libero arbitrio,
che riesce a esserci e non esserci
contemporaneamente;
Che ne sarà di decine di persone –
ci conoscevamo davvero oppure no;
Cosa cercava di dirmi M.,
Quando non poteva più parlare;
Perché ho preso per buone
cose cattive
e cosa mi occorre
per non sbagliarmi più?
Certe domande le annotavo
un istante prima di addormentarmi.
Al risveglio
non riuscivo più a decifrarle.
A volte ho il sospetto
che si tratti di un codice vero.
Ma anche questa è una domanda
che mi abbandonerà un giorno“.

Farsi le domande giuste in questo vastissimo mare di dati è come avere una carta nautica mentre si naviga nell’oceano sconfinato.
Magari non descrive con il necessario dettaglio tutto, ma ti aiuta ad arrivare dove vuoi arrivare…

Carta nautica

 


Lascia un commento

Your email address will not be published.