SlideShare uma empresa Scribd logo
1 de 41
VISUALIZANDO
DADOS
2º MEETU P R LADI ES R I O
ERA DA IN FO RMAÇÃO
Como podemos obter respostas tão
rapidamente como obtemos dados?
ERA DA INFO RMAÇÃO
DADO S
Dados são muito mais do que números.
Como uma fotografia, os dados são
pequenos momentos no tempo.
DAD OS
Um conjunto de dados sempre vai ter agregado
a ele alguns metadados importantes.
DAD OS
Um conjunto de dados sempre vai ter agregado
a ele alguns metadados importantes.
DAD OS
Quem O que Quando Onde Porque
Um conjunto de dados sempre vai ter agregado
a ele alguns metadados importantes.
DAD OS
Quem O que Quando Onde Porque
Great information visualization
never starts from the standpoint
of the data set, it starts with
questions”
Ben Fry, Visualizing data.
CON TEXTO, VARIÂNCIA & I NCERTEZA
Você deve olhar para tudo ao redor do seu
conjunto de dados, enxergar o que eles
representam como um todo.AIN DA SO BRE DADOS
Contexto
As vezes você precisa ver os padrões gerais
dos seus dados para depois focar em um
detalhe específico.
As vezes você não sabe que um único
conjunto de dado vale a pena ser investigado
se não tiver a noção do conjunto todo e suas
relações.
Context can completely change
your perspective on a dataset, and
it can help you decide what the
numbers represent”
Nathan Yau, Data Points.
Data isn’t about numbers,
is about people”
Riley Newman, Data Scientist at Airbnb.
Somos capazes de identificar padrões, ciclos
e diferentes agrupamentos em um conjunto
de dados, mas nem sempre isso ocorre de
forma fluida.
AIN DA SO BRE DADOS
Variância
Total, médias, medianas e outras medidas podem
ser interessantes, mas elas fazem apenas parte
da história, a variância entre os dados são na
maioria das vezes o ponto mais interessante e
importante dessa historia.
Existem casos onde ter acesso a todos os
dados é impossível e trabalhamos com
pequenas amostragens ou distribuições.
AIN DA SO BRE DADOS
Incerteza
Data is a moving target”
P RIN CÍP IOS &
COMP O N ENTES V ISUA IS
Como tornar o complexo claro?
P R INCÍP IOS & COMPONENTES VISUAIS
90% dos dados processados no nosso cérebro
são visuais, e esse processamento é 60.000
vezes mais rápido que o processamento
textual.
P R INCÍP IOS & COMPONENTES VISUAIS
A visão é o nosso sentido mais
dominante.
More data doesn’t mean better.
Ben Fry, Visualizing data.
VI SU ALI Z AÇÃO &
RETÓRICA DO DESI GN
Visualização de dados é uma maneira
de representar uma abstração do
mundo real com abstrações.
VISUAL IZAÇ ÃO & RETÓRICA DO DESIGN
Da mesma forma que as palavras são
usadas para contar diferentes histórias,
as visualizações também podem.
VISUAL IZAÇ ÃO & RETÓRICA DO DESIGN
A interpretação dos dados muda
baseada na forma visual ao qual
eles são representados.
VISUAL IZAÇ ÃO & RETÓRICA DO DESIGN
MU L HERES DIZ EM SOM EN TE 27%
DAS FA L AS N O S F ILMES MAI S
BADA LADOS DE 2016.
I felt like this could be the year for
gender equality in Hollywood’s
biggest films”
Amber Thomas, Data Scientist.
Para toda resposta existe uma pergunta. Qual
a pergunta que você quer responder?
O S SET E ES TAD OS DA VISUAL IZAÇÃO
0. A pergunta
O processo de entendimento dos dados,
como falamos, começa com uma série de
questões, os passos a seguir formam o
caminho para a resposta.
With so many powerful women in
these films, some of them must be
gender-equal, right?”
I decided to look for female
equality across the Top 10
Worldwide Highest Grossing
Films of 2016”
O S SET E ES TAD OS DA VISUAL IZAÇÃO
1. Obtendo os dados
Precisamos extrair os dados de algum lugar.
pode ser um arquivo, uma mídia ou um
conjunto de dados da internet.
O S SET E ES TAD OS DA VISUAL IZAÇÃO
1. Obtendo os dados
O S SET E ES TAD OS DA VISUAL IZAÇÃO
2. Análise
Defina alguma estrutura para os
seus dados e ordene em
categorias que signifique algo.
#Adicionando gêneros aos
personagens
#Contagem das palavras ditas por
personagem
O S SET E ES TAD OS DA VISUAL IZAÇÃO
3. Filtro
Remova os dados que não são do
seu interesse
# Todas as palavras ditas nos filmes foram incluídas no data set
O S SET E ES TAD OS DA VISUAL IZAÇÃO
4. Mineração
Aplique métodos estatísticos e mineração
de dados para encontrar padrões
O S SET E ES TAD OS DA VISUAL IZAÇÃO
5. Representação
Escolha um modelo de visualização mais
básico, como um gráfico de barras, lista e etc.
O S SET E ES TAD OS DA VISUAL IZAÇÃO
5. Representação
O S SET E ES TAD OS DA VISUAL IZAÇÃO
6. Refine
Aperfeiçoe sua representação básica para
que ela se torne mais clara e mais
visualmente engajada.
# Bubble Chart
O S SET E ES TAD OS DA VISUAL IZAÇÃO
7. Interação
Adicione métodos para manipulação
dos dados controlando o que pode
ou não estar visível.
PAR A TIRAR D UVIDAS, TROCAR UMA IDEIA~
Ingrid Luz
@seabraluz
Natália Medina
@nt_medina
REFERÊNCIA S
Data Points - Visualization that means
something, Nathan Yau, Wiley, 2013;
Visualizing Data - Exploring and explaining
data with the processing environment, Ben
Fry, O’reilly - 2008;
https://medium.freecodecamp.org/women-only-said-27-of-the-
words-in-2016s-biggest-movies-955cb480c3c4
Amber Thomas

Mais conteúdo relacionado

Semelhante a VISUALIZANDO DADOS: UMA JORNADA DESDE A PERGUNTA ATÉ A RESPOSTA

Vizualização de dados Fundamentos e Técnicas Aula 1.pdf
Vizualização de dados Fundamentos e Técnicas Aula 1.pdfVizualização de dados Fundamentos e Técnicas Aula 1.pdf
Vizualização de dados Fundamentos e Técnicas Aula 1.pdfCelso Paquete Cellso
 
Apresentação na maplink de machine learning
Apresentação na maplink de machine learningApresentação na maplink de machine learning
Apresentação na maplink de machine learningErnani Britto
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonLuiz Eduardo Le Masson
 
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)A Scuola di OpenCoesione
 
Usabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informaçãoUsabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informaçãoAlan Vasconcelos
 
Apostila Modelagem e Desenvolvimento de Banco de Dados.pdf
Apostila Modelagem e Desenvolvimento de Banco de Dados.pdfApostila Modelagem e Desenvolvimento de Banco de Dados.pdf
Apostila Modelagem e Desenvolvimento de Banco de Dados.pdfFlvioMachadoLobo
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoadscsmp
 
Ver
VerVer
Vercsmp
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceIsmael
 
Monitoramento e Visualização da Informação
Monitoramento e Visualização da InformaçãoMonitoramento e Visualização da Informação
Monitoramento e Visualização da InformaçãoPaperCliQ Comunicação
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014WANDERSON JONER
 
Capacity planning - Projetando o seu cluster de Elasticsearch
Capacity planning - Projetando o seu cluster de ElasticsearchCapacity planning - Projetando o seu cluster de Elasticsearch
Capacity planning - Projetando o seu cluster de ElasticsearchThiago Barradas
 

Semelhante a VISUALIZANDO DADOS: UMA JORNADA DESDE A PERGUNTA ATÉ A RESPOSTA (20)

Vizualização de dados Fundamentos e Técnicas Aula 1.pdf
Vizualização de dados Fundamentos e Técnicas Aula 1.pdfVizualização de dados Fundamentos e Técnicas Aula 1.pdf
Vizualização de dados Fundamentos e Técnicas Aula 1.pdf
 
Apresentação na maplink de machine learning
Apresentação na maplink de machine learningApresentação na maplink de machine learning
Apresentação na maplink de machine learning
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores Python
 
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
 
Banco de Dados - Conceitos Básicos
Banco de Dados - Conceitos BásicosBanco de Dados - Conceitos Básicos
Banco de Dados - Conceitos Básicos
 
Usabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informaçãoUsabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informação
 
Apostila Modelagem e Desenvolvimento de Banco de Dados.pdf
Apostila Modelagem e Desenvolvimento de Banco de Dados.pdfApostila Modelagem e Desenvolvimento de Banco de Dados.pdf
Apostila Modelagem e Desenvolvimento de Banco de Dados.pdf
 
Weka pentaho day2014-fidelis
Weka pentaho day2014-fidelisWeka pentaho day2014-fidelis
Weka pentaho day2014-fidelis
 
Modeloestruturaçaoads
ModeloestruturaçaoadsModeloestruturaçaoads
Modeloestruturaçaoads
 
Ver
VerVer
Ver
 
Bancodedados
BancodedadosBancodedados
Bancodedados
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Apostila banco de dados
Apostila banco de dadosApostila banco de dados
Apostila banco de dados
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Monitoramento e Visualização da Informação
Monitoramento e Visualização da InformaçãoMonitoramento e Visualização da Informação
Monitoramento e Visualização da Informação
 
Aula 01
Aula 01Aula 01
Aula 01
 
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 20144 semestre trabalho individual analise e desenvolvimento de sistemas 2014
4 semestre trabalho individual analise e desenvolvimento de sistemas 2014
 
Data mining
Data miningData mining
Data mining
 
Data Storytelling
Data StorytellingData Storytelling
Data Storytelling
 
Capacity planning - Projetando o seu cluster de Elasticsearch
Capacity planning - Projetando o seu cluster de ElasticsearchCapacity planning - Projetando o seu cluster de Elasticsearch
Capacity planning - Projetando o seu cluster de Elasticsearch
 

VISUALIZANDO DADOS: UMA JORNADA DESDE A PERGUNTA ATÉ A RESPOSTA

  • 2. ERA DA IN FO RMAÇÃO
  • 3. Como podemos obter respostas tão rapidamente como obtemos dados? ERA DA INFO RMAÇÃO
  • 5. Dados são muito mais do que números. Como uma fotografia, os dados são pequenos momentos no tempo. DAD OS
  • 6. Um conjunto de dados sempre vai ter agregado a ele alguns metadados importantes. DAD OS
  • 7. Um conjunto de dados sempre vai ter agregado a ele alguns metadados importantes. DAD OS Quem O que Quando Onde Porque
  • 8. Um conjunto de dados sempre vai ter agregado a ele alguns metadados importantes. DAD OS Quem O que Quando Onde Porque
  • 9. Great information visualization never starts from the standpoint of the data set, it starts with questions” Ben Fry, Visualizing data.
  • 10. CON TEXTO, VARIÂNCIA & I NCERTEZA
  • 11. Você deve olhar para tudo ao redor do seu conjunto de dados, enxergar o que eles representam como um todo.AIN DA SO BRE DADOS Contexto As vezes você precisa ver os padrões gerais dos seus dados para depois focar em um detalhe específico. As vezes você não sabe que um único conjunto de dado vale a pena ser investigado se não tiver a noção do conjunto todo e suas relações.
  • 12. Context can completely change your perspective on a dataset, and it can help you decide what the numbers represent” Nathan Yau, Data Points.
  • 13. Data isn’t about numbers, is about people” Riley Newman, Data Scientist at Airbnb.
  • 14. Somos capazes de identificar padrões, ciclos e diferentes agrupamentos em um conjunto de dados, mas nem sempre isso ocorre de forma fluida. AIN DA SO BRE DADOS Variância Total, médias, medianas e outras medidas podem ser interessantes, mas elas fazem apenas parte da história, a variância entre os dados são na maioria das vezes o ponto mais interessante e importante dessa historia.
  • 15. Existem casos onde ter acesso a todos os dados é impossível e trabalhamos com pequenas amostragens ou distribuições. AIN DA SO BRE DADOS Incerteza Data is a moving target”
  • 16. P RIN CÍP IOS & COMP O N ENTES V ISUA IS
  • 17. Como tornar o complexo claro? P R INCÍP IOS & COMPONENTES VISUAIS
  • 18. 90% dos dados processados no nosso cérebro são visuais, e esse processamento é 60.000 vezes mais rápido que o processamento textual. P R INCÍP IOS & COMPONENTES VISUAIS
  • 19. A visão é o nosso sentido mais dominante.
  • 20. More data doesn’t mean better. Ben Fry, Visualizing data.
  • 21. VI SU ALI Z AÇÃO & RETÓRICA DO DESI GN
  • 22. Visualização de dados é uma maneira de representar uma abstração do mundo real com abstrações. VISUAL IZAÇ ÃO & RETÓRICA DO DESIGN
  • 23. Da mesma forma que as palavras são usadas para contar diferentes histórias, as visualizações também podem. VISUAL IZAÇ ÃO & RETÓRICA DO DESIGN
  • 24. A interpretação dos dados muda baseada na forma visual ao qual eles são representados. VISUAL IZAÇ ÃO & RETÓRICA DO DESIGN
  • 25. MU L HERES DIZ EM SOM EN TE 27% DAS FA L AS N O S F ILMES MAI S BADA LADOS DE 2016.
  • 26. I felt like this could be the year for gender equality in Hollywood’s biggest films” Amber Thomas, Data Scientist.
  • 27. Para toda resposta existe uma pergunta. Qual a pergunta que você quer responder? O S SET E ES TAD OS DA VISUAL IZAÇÃO 0. A pergunta O processo de entendimento dos dados, como falamos, começa com uma série de questões, os passos a seguir formam o caminho para a resposta.
  • 28. With so many powerful women in these films, some of them must be gender-equal, right?”
  • 29. I decided to look for female equality across the Top 10 Worldwide Highest Grossing Films of 2016”
  • 30. O S SET E ES TAD OS DA VISUAL IZAÇÃO 1. Obtendo os dados Precisamos extrair os dados de algum lugar. pode ser um arquivo, uma mídia ou um conjunto de dados da internet.
  • 31. O S SET E ES TAD OS DA VISUAL IZAÇÃO 1. Obtendo os dados
  • 32. O S SET E ES TAD OS DA VISUAL IZAÇÃO 2. Análise Defina alguma estrutura para os seus dados e ordene em categorias que signifique algo. #Adicionando gêneros aos personagens #Contagem das palavras ditas por personagem
  • 33. O S SET E ES TAD OS DA VISUAL IZAÇÃO 3. Filtro Remova os dados que não são do seu interesse # Todas as palavras ditas nos filmes foram incluídas no data set
  • 34. O S SET E ES TAD OS DA VISUAL IZAÇÃO 4. Mineração Aplique métodos estatísticos e mineração de dados para encontrar padrões
  • 35. O S SET E ES TAD OS DA VISUAL IZAÇÃO 5. Representação Escolha um modelo de visualização mais básico, como um gráfico de barras, lista e etc.
  • 36. O S SET E ES TAD OS DA VISUAL IZAÇÃO 5. Representação
  • 37. O S SET E ES TAD OS DA VISUAL IZAÇÃO 6. Refine Aperfeiçoe sua representação básica para que ela se torne mais clara e mais visualmente engajada. # Bubble Chart
  • 38. O S SET E ES TAD OS DA VISUAL IZAÇÃO 7. Interação Adicione métodos para manipulação dos dados controlando o que pode ou não estar visível.
  • 39.
  • 40. PAR A TIRAR D UVIDAS, TROCAR UMA IDEIA~ Ingrid Luz @seabraluz Natália Medina @nt_medina
  • 41. REFERÊNCIA S Data Points - Visualization that means something, Nathan Yau, Wiley, 2013; Visualizing Data - Exploring and explaining data with the processing environment, Ben Fry, O’reilly - 2008; https://medium.freecodecamp.org/women-only-said-27-of-the- words-in-2016s-biggest-movies-955cb480c3c4 Amber Thomas