Alcuni esempi e strumenti su come è possibile estrarre i commenti degli utenti per l'analisi di sentiment e la buzz analysis. Ulteriori informazioni sul sito www.semioanalysis.com
Come estrarre dati e commenti degli utenti da articoli e social network
1. Sentiment Analysis:
come estrarre dati e commenti degli utenti
da articoli e social network
Valentina Porcu
valentina@semioanalysis.com
Aggiornamento - 1 Ottobre 2014
2. L’estrazione dei commenti per:
• analizzare l’interesse intorno a un soggetto o a un
marchio
• variazioni dell’interesse nel tempo (ad esempio in
seguito a una notizia)
• opinione dei commentatori riguardo al
brand/soggetto in esame
3. Per questo motivo si parla di
sentiment analysis
cosa gli utenti pensano di un prodotto/servizio/candidato
buzz analysis
monitorare l’interesse nei confronti di un brand
4. Creare una base dati di commenti degli utenti
1. l’intervallo di tempo da analizzare
2. le pagine dei social network o siti che contengono le
conversazioni
3. estrarre i dati
5. Copiare i dati a mano?
É più veloce utilizzare le tecniche per
l’estrazione automatica di dati
o
web scraping
6. Se sapete programmare
Esistono vari strumenti e librerie su più linguaggi di programmazione:
Scrapy
Portia
Gemme di Ruby (Scrubit, Scrapi)
Librerie di Python (BeautifulSoup, Urllib2)
Quelle di PHP (Curl)
7. Se non sapete programmare
Gli strumenti automatici, ad esempio:
Mozenda
Heritrix
Import.io
FMiner
Outwit
Wire
8. Utilizzi: le lead lists
vengono utilizzati soprattutto per le cosiddette lead lists, delle
liste di contatti comprensivi di email e telefoni “confezionate”
per i motivi più svariati, dalla creazione di mailing list alle
analisi di benchmark o sui competitors
9. A noi, in questo caso, interessa estrarre i commenti degli
utenti
esistono vari modi per gestire i commenti degli utenti dal punto
di vista di un sito web
quindi non è automatico utilizzare sempre lo stesso strumento
10. Ad esempio, Outwit, anche in versione gratuita, può essere utilizzato
per i siti che gestiscono i commenti sulla normale pagina html
11. Oppure Import.io può essere utilizzato in modalità crawler o extractor
per estrarre i commenti ai prodotti di Amazon
12. Per estrarre le conversazioni dalle pagine pubbliche di Facebook, ad
esempio, possiamo usare Datatool
13. O, infine, potete utilizzare il Comment Extractor per estrarre i commenti dagli articoli con
Disqus, da Amazon, dalle pagine pubbliche di Facebook, da IMDB o da Youtube
copiando il link che vi interessa
15. I file di output sono solitamente in formato xls, csv o json, quasi tutti gestibili con excel
16. Oltre ai commenti sui siti uno degli strumenti più importanti per la
sentiment:
…è senza dubbio
17. Cosa analizzare su Twitter
Testi
Numero di retweet
Numero di preferiti
Risposte
18. Gli strumenti per estrarre i dati da Twitter
Sono per la maggior parte a pagamento, e forniscono delle prime
analisi dati
Qualche esempio:
Datasift
Tweetarchivist