O documento apresenta um curso sobre extração, mineração e visualização de controvérsias em redes sociais. O curso objetiva capacitar os participantes no uso de ferramentas para análise de redes sociais, compreender termos e métricas básicas e realizar atividade prática analisando um caso sobre o Marco Civil da Internet no Twitter.
Introdução à Teoria dos Grafos e Análise de Redes Sociais
1. #1
EXTRAIR, MINERAR
E VISUALIZAR
CONTROVÉRSIAS
EM REDES SOCIAIS
curso na
Câmara dos Deputados
Laboratório Hacker
Prof. Dr. Fábio Malini
Universidade Federal
do Espírito Santo
Rede VemPrarua: junho a outubro de 2013
2. #1
objetivos
Compreender os Termos e Medidas
básicos utilizados na análise de redes
sociais.
Extração de redes para analisar as métricas
dentro de uma rede social.
Capacitação no uso do software Gephi e
em análise semântica de controvérsias na
rede.
Prof. Dr. Fábio Malini :: curso
Câmara dos Deputados
3. #1
objetivos
Compreender os Termos e Medidas
básicos utilizados na análise de redes
sociais.
Realização de atividade prática para
consolidar o conhecimento teórico
adquirido.
Capacitação no uso do software Gephi e
em análise semântica de controvérsias na
rede.
Prof. Dr. Fábio Malini :: curso
Câmara dos Deputados
4. #1.1
Termos e definições
na análise de redes
sociais.
fabiomalini
Nó
. Representado, numa
rede, por pontos. Em redes
sociais, os nós representam o
nome do perfis.
ufesonline
ufeslabic
francisodre
Prof. Dr. Fábio Malini
UFES
5. #1.1
Termos e definições
na análise de redes
sociais.
fabiomalini
Aresta
. Representado,
numa rede, por linhas. Em
redes sociais, as linhas
revelam as ações dos perfis:
compartilhamento (RTs) ou
comentários (ATs) de uma
mensagem.
Prof. Dr. Fábio Malini
UFES
ufeslabic
6. uma aresta
#1.1
(RTs, Shares, Replies, Ligação...)
Nós e arestas.
B
A
Nós
humanos ou bots
Nós e arestas possuem
atributos. Ex: conteúdo
de um tweet é atributo
de uma aresta.
5
Rede direcional
Rede não-direcional
O peso da rede
(valor atribuído nas arestas)
7. #1.1
simples: quando a
ligação não possui peso
arestas.
Importante:
As arestas podem
ser de tipo Simples
ou de tipo
Ponderada.
Quando o peso da aresta
entre dois nós é forte,
conceituamos a relação de
“laços fortes”.
ponderada: quando diferentes
arestas possuem pesos distintos.
1
5
3
8. #1.1
Cluster 01
Clusters.
Cluster 02
Cluster 03
É um conjunto de
nós fortemente
conectado.
Clusters, em termos
sociais, são grupos de
interesses comuns. São
estruturas de afinidades.
Perspectividades.
Cluster 04
9. #1.1
Cluster 01
Grafo.
Cluster 02
Cluster 03
É a representação gráfica
de uma
rede interativa.
Ele pode ser:
- Direcional ou dirigido: quando um nó possui ligação
com outro não necessariamente recíproca (ex:
Instagram, Twitter);
- Não direcional ou não dirigido: quando a ligação
entre dois nós é necessariamente recíproca (ex:
Facebook e Orkut).
Cluster 04
11. #1.1
Estatísticas
As medidas ajudam no
entendimento dos papéis
sociais (em sentido amplo,
nas subjetivações)
constituído pela ação dos
perfis nas redes sociais.
12. #1.1
Estatísticas
GRAU MÉDIO
Define o peso dos nós de acordo
com a quantidade de suas
conexões.
Grau de entrada: número de
conexões que um nó recebe de
outro.
Grau de saída: número de
conexões que sai de um nó para
outro.
13. #1.1
Estatísticas
GRAU PONDERADO MÉDIO
Similar ao grau médio, mas, para
a sua medida, utiliza-se dos pesos
das arestas em seu algoritmo para
então definir o peso dos nós.
A recebeu 50 Retweets de B
C recebeu 10 Retweets de B, 10
de D, 5 de E, 5 de F,
14. Qual é a diferença de GRAU e
GRAU PONDERADO MÉDIO?
João recebeu doação de R$ 50 mil da
empresa Slide.
Maria recebeu doação de R$ 50 mil reais
de 50 empresas diferentes, no valor de
R$ 1 mil.
João e Maria possuem o mesmo Grau.
Mas Maria possui um valor maior em
seu grau Ponderado Médio, por conta
da diversidade de suas relações.
15. Qual dos nós possuirá maior
GRAU MÉDIO?
(
(
(
(
(
(
)A
)B
)C
)D
)E
)F
F
E
12
6
A
C
2
3
1
10
2
B
1
D
16. Qual dos nós possuirá maior
GRAU PONDERADO MÉDIO?
(
(
(
(
(
(
)A
)B
)C
)D
)E
)F
F
E
12
6
A
C
2
3
1
10
2
B
1
D
17. Qual dos nós possuirá maior
GRAU PONDERADO MÉDIO DE
ENTRADA?
(
(
(
(
(
(
)A
)B
)C
)D
)E
)F
F
E
12
6
A
C
2
3
1
10
2
B
1
D
18. Qual dos nós possuirá maior
GRAU DE SAÍDA?
(
(
(
(
(
(
)A
)B
)C
)D
)E
)F
2
F
E
11
4
A
C
2
3
1
8
1
B
1
D
19. GRAU de entrada: é uma
medida de popularidade.
GRAU de saída:
é uma medida de
intensidade informativa.
E
11
4
A
C
2
F
2
3
1
8
1
B
1
D
20. #1.2
Extraindo dados
para identificar o
grau de um nó
numa rede social.
Crawl: importado do inglês, o verbo
“crawlear” (“to crawl”) neste
contexto significa minerar/coletar
dados da web, de mídias, de redes
sociais etc.
Prof. Dr. Fábio Malini
UFES
21. #1.2
Crawlers
Flocker
Webapp que age como estruturador de
redes de retweets em tempo real. Permite
exportar o grafo criado para GEXF, PNG e
SVG.
http://flocker.outliers.es/
Netvizz
Aplicativo do Facebook de fácil utilização que
possibilita extrair redes de amigos, páginas e
grupos a que o usuário está conectado.
https://apps.facebook.com/netvizz/
Prof. Dr. Fábio Malini
UFES
22. #1.2
Crawlers
NodeXL
Extensão para o Microsoft Excel que permite
extrair dados de redes como
Facebook, Flickr, Twitter e Youtube, assim
como posterior exportação para Gephi.
http://nodexl.codeplex.com/
GNIP
Permite extrair dados da rede do Twitter. É o
único que não possui limite de tempo de
publicação do tweet nem limite de
requisições ao servidor.
http://gnip.com/
Prof. Dr. Fábio Malini
UFES
23. #1.2
Crawlers
YourTwapperKeeper
Permite a configuração de diferentes
keywords para monitoração,
captura e armazenamento de tweets
em tempo real. Necessita de
instalação.
https://github.com/540co/yourTwap
perKeeper
Prof. Dr. Fábio Malini
UFES
24. TELA DO YTK
AS PRIMEIRAS EXTRAÇÕES DO LABIC/UFES E CIBERCULT E MEDIALAB / UFRJ
(processo de pesquisa Cartografia das Controvérsias políticas na internet – CNPq/CAPES)