fbpx

Dopo due settimane di pausa, l’aula dell’Executive Master in Data Management & Business Analytics torna a incontrarsi a distanza per la seconda parte del Modulo 4, dedicata alla Text Analytics e alle Piattaforme di AI.

Prima di entrare nel vivo della lezione, però, i partecipanti sono impegnati nel test sui contenuti relativi a Machine Learning e Predictive Analytics.

Il terzo test segna il giro di boa in vista della graduatoria per il Premio di Studio offerto da Vem sistemi.

I temi sono complessi e la mezz’ora dedicata alla prova trascorre nel silenzio e nella concentrazione, palpabile anche se via Skype.

Attorno alle 10, arriva il momento di incontrare il Dott. Boselli, Docente del Dipartimento di Statistica e Metodi Quantitativi dell’Università degli Studi di Milano-Bicocca.

Con Roberto ci addentriamo in un tema affascinante che ci indica la strada per rispondere a una domanda davvero fondamentale:

Come ottenere contenuti strutturati a partire da testi non strutturati?

Ci approcciamo, quindi, alla Text Analytics con qualche necessaria chiarificazione teorica che ci condurrà alle esercitazioni del pomeriggio.

Innanzitutto è necessario definire l’Analisi Automatica dei Testi che si serve di strumenti statistici, informatici e di linguistica computazionale.

Ci troviamo di fronte a una disciplina complessa e vale la pena analizzare più approfonditamente soprattutto la differenza fra Text Mining e Text Analytics.

Text Mining

si tratta dell’esplorazione in un corpus di materiali testuali per recuperarne informazioni strutturate ed è composta da diverse fasi, tra cui:

  • Preparazione e pulizia dei dati
  • Rimozione di Stop-word, numeri e punteggiatura
  • Segmentazione
  • Stemming

Text Analytics

è la fase di applicazione di algoritmi di analisi ai testi strutturati risultato della fase di Mining.

Anche in questo caso si tratta di mettere in atto una serie di procedure:

  • Modellizzazione
  • Allenamento e valutazione del modello
  • Applicazione del modello
  • Visualizzazione

Dopo aver approfondito definizioni, strumenti e obiettivi, siamo pronti per immergerci con il Dott. Boselli in qualche esempio, come quello che prende in esame i Tweet riguardanti l’ultimo Sanremo

Nel pomeriggio l’Aula diventa protagonista dell’analisi grazie a Orange, uno strumento che ormai abbiamo cominciato a conoscere piuttosto bene e al suo Add-On Text che ci permette di mettere in pratica la Text Analytics e procedere verso la Sentiment Analysys.

Nella lezione del sabato mattina proseguono le esercitazioni pratiche sulla classificazione dei testi.

Ci occupiamo, in particolare, di una raccolta di racconti dei Fratelli Grimm.
Attraverso il confronto di diversi modelli cerchiamo di capire quali testi siano Racconti di Animali e quali di Magia.

Questa esercitazione ha per risultato un processo che sarà base preziosa per l’analisi di qualsiasi corpus:

Per finire in bellezza (ed è proprio il caso di dirlo) concludiamo le prime lezioni del Dott. Boselli con l’analisi delle immagini.

Cominciamo a clusterizzare animali, poi immagini subacquee e infine opere d’arte, scoprendo che Orange “riconosce” Monet.
Infatti, chiedendo al software quali sono i Neighbour di un quadro del pittore parigino otteniamo una risposta corretta: l’unica altra tela dello stesso autore presente nel dataset e un’altra opera che raffigura un paesaggio simile a quello del dipinto di partenza.

Se per l’esame di Storia dell’Arte l’algoritmo Painters dimostra di aver studiato discretamente l’Impressionismo, il Rinascimento, però, necessita di un ripasso…

Soprattutto per imparare a distinguere meglio Sandro Botticelli da Piero Cosimo 🙂

 

Richiedi la Ricerca

Indagine sul livello di adozione e utilizzo dell'Intelligenza Artificiale in Italia

Privacy Policy

You have Successfully Subscribed!