SlideShare uma empresa Scribd logo
1 de 21
빅 데이터 개요 및 활용
정 진 욱
2014. 5. 7
목차
 빅 데이터 개요
 빅 데이터 동향
 빅 데이터 분석
 빅 데이터 활용
2
빅 데이터 개요 : 정의
 빅 데이터는 단지 크기(규모)만을 의미하지 않는다.
3
…
빅 데이터 개요 :규모와 속도
 데이터 홍수
– 2020년은 현재(2011년 기준)대비 50배 Data 증가예상 = 40ZB ~ 50ZB
 40ZB = 전 세계 모래알의 수 7억 50만조개 X 57
4
1.8 Zeta byte
빅 데이터 개요 : 다양성
 정형 데이터 (컴퓨터가 이해할 수 있는 포맷을 가짐)
– DATABASE, XML, RDF 등
 비정형 데이터 (컴퓨터가 이해할 수 없는 포맷을 가짐)
– 이미지, 동영상, 기타 (PDF, 엑셀, PPT 등등)
5
http://www.wolframalpha.com/input/?i=linear+equations&lk=4
http://www.wolframalpha.com/
목차
 빅 데이터 개요
 빅 데이터 동향
 빅 데이터 분석
 빅 데이터 활용
6
빅 데이터 동향 : 주요 국가별
 주요 국가들은 (미국, EU, 영국, 호주등) 빅 데이터 활성화 노력.
– 미국 : 12년부터 연간 2억 달러 이상투입, (빅데이터 R&D 계획)
– UN : 정책의 수립 및 집행에 빅 데이터 활용
7
빅데이터 투자 (미국)
빅데이터 투자 (국내)
빅 데이터 동향 : 주요기업 (서비스)
8
빅 데이터 동향 : 주요기업 (데이터 분석)
 IBM
– 지난 5년간 140억 달러 이상을 투자, 네티자, 에센셜, 코그너스 등 데이터 저
장/분석 업체를 인수하면서 빅 데이터 기술력 확보에 주력
 SAS
– 전세계 비즈니스 분석 소프트웨어 및 서비스 분야의 리더
– SAS Visual Analytics software demo
 ORACLE
– 하이페리온사 인수하여 데이터 분석 기술 확보
– SUN 인수하여 하드웨어 기술과 자사 주력분야인 DB S/W를 결합한 빅 데이
터 어플라이언스를 개발하고 출시하였다.
9
빅 데이터 동향 : 신조어 (어플라이언스)
 어플라이언스
– H/W와 S/W를 결합하여, 업무목적에 맞게 최적화시킨 통합시스템
 빅 데이터 어플라이언스
– 빅 데이터 S/W (예 : 하둡) + H/W
– 예 : 오라클 빅 데이터 어플라이언스 , LG CNS의 SBP Appliance
10
어플라이언스 (SW+HW의 통합 생테계) 빅 데이터 어플라이언스
목차
 빅 데이터 개요
 빅 데이터 동향
 빅 데이터 분석
 빅 데이터 활용
11
빅 데이터 분석 : 질문
12
나란히 진열된 기저귀와 맥주, 비밀은「데이터마이닝」 - ZD Net Korea
대형할인점에서 유아용 기저귀와 함께
가장 잘 팔리는 제품은 무엇일까?
빅 데이터 분석 : 두 가지 목적
 두번째 목적 : 통찰력 얻기
– 데이터 마이닝 방법
 연관규칙 찾기 (예 : 맥주와 기저기)
– 통계적 방법을 통한 분석 및 예측
 범죄지역 예측 / 이현봉 교수
 다음의 빅데이터 분석사례 (10m)
 당신의 욕망이 보인다. / 소셜 매트릭스
13
 첫번째 목적 : 서비스
 추천서비스 (아마존, 페이스북 친구추천)
 분류서비스 (감정분류)
 시리, 왓슨, 구글번역, 등
 음성인식
 딥 러닝(MIT 올해의 10대 혁신기술)
데이터 분석 후 시각화 (Visualization)
[인포그래픽] / R 등 이용
통계
빅 데이터 분석 : 분석과정 및 방법
14
빅 데이터 분석 : 분석을 위한 데이터 얻기
 공공 빅 데이터
– 특징 : 개방성 (상대적 가치)
– 얻을 수 있는곳
 세계 각국 기관에서 공개한 데이터 사용
– 예 : 공공 데이터 포털(https://www.data.go.kr/), http://data.seoul.go.kr/, Linked Open
Data, Etc
 데이터 예: 지하철 승하차 인원
 관련영상 : 내 삶은 바꾸는 데이터 혁명 (유주완 프로그래머 강연)
 비공공 빅 데이터
– 특징 : 폐쇄성 (상업적 이용, 가치가 있음)
– 얻을 수 있는 곳
 내부 비공개 데이터로 획득불가
15
목차
 빅 데이터 개요
 빅 데이터 동향
 빅 데이터 분석
 빅 데이터 활용
16
빅 데이터 활용 : 응용사례 (주요한)
17
빅 데이터 활용 : 응용사례 (인공지능)
 IBM
– 왓슨
 Data : encyclopedias, dictionaries, thesauri, newswire articles, and literary
works. Watson also used databases, taxonomies, and ontologies.
Specifically, DBPedia, WordNet, and Yago were used.
18
빅 데이터 활용 : 응용사례 (인공지능)
 구글
– 구글 무인자동차
 초당 1G 데이터 처리, 빅 데이터 수집 , 정리, 분석
 기사
– 빅 데이터 관리 (데이터 센터)
19
빅 데이터 활용 : 응용사례 (분석 및 예측)
 Crimemapping.com
20
- 미국의 샌프란시스코에서 범죄 기록을 바탕으로, 범죄 발생지역 예측Minority Report
- Minority Report의 범죄예측이 현실에 가까워 지고 있음
감사 드립니다.
21http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

Mais conteúdo relacionado

Mais procurados

Neo4j Data Science Presentation
Neo4j Data Science PresentationNeo4j Data Science Presentation
Neo4j Data Science PresentationMax De Marzi
 
Object detection and Instance Segmentation
Object detection and Instance SegmentationObject detection and Instance Segmentation
Object detection and Instance SegmentationHichem Felouat
 
Lecture9 camera calibration
Lecture9 camera calibrationLecture9 camera calibration
Lecture9 camera calibrationzukun
 
Introduction to Graph Databases
Introduction to Graph DatabasesIntroduction to Graph Databases
Introduction to Graph DatabasesMax De Marzi
 
Panel: AI for Social Good - Fairness, Ethics, Accountability, and Transparency
Panel: AI for Social Good - Fairness, Ethics, Accountability, and TransparencyPanel: AI for Social Good - Fairness, Ethics, Accountability, and Transparency
Panel: AI for Social Good - Fairness, Ethics, Accountability, and TransparencyAmazon Web Services
 
How to Synchronize ArcGIS Portal Items with FME
How to Synchronize ArcGIS Portal Items with FMEHow to Synchronize ArcGIS Portal Items with FME
How to Synchronize ArcGIS Portal Items with FMESafe Software
 
水耕栽培を始めたばかりの時に 知っておきたかったこと
水耕栽培を始めたばかりの時に 知っておきたかったこと水耕栽培を始めたばかりの時に 知っておきたかったこと
水耕栽培を始めたばかりの時に 知っておきたかったことMitsushige Ishiguro
 
올바른 분석을 방해하는 함정 카드 피해가기
올바른 분석을 방해하는 함정 카드 피해가기올바른 분석을 방해하는 함정 카드 피해가기
올바른 분석을 방해하는 함정 카드 피해가기Minho Lee
 
Neo4j Bloom: What’s New with Neo4j's Data Visualization Tool
Neo4j Bloom: What’s New with Neo4j's Data Visualization ToolNeo4j Bloom: What’s New with Neo4j's Data Visualization Tool
Neo4j Bloom: What’s New with Neo4j's Data Visualization ToolNeo4j
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축BOAZ Bigdata
 
Webinar: Survival Analysis for Marketing Attribution - July 17, 2013
Webinar: Survival Analysis for Marketing Attribution - July 17, 2013Webinar: Survival Analysis for Marketing Attribution - July 17, 2013
Webinar: Survival Analysis for Marketing Attribution - July 17, 2013Revolution Analytics
 
Neo4j Presentation
Neo4j PresentationNeo4j Presentation
Neo4j PresentationMax De Marzi
 
Machine learning testing survey, landscapes and horizons, the Cliff Notes
Machine learning testing  survey, landscapes and horizons, the Cliff NotesMachine learning testing  survey, landscapes and horizons, the Cliff Notes
Machine learning testing survey, landscapes and horizons, the Cliff NotesHeemeng Foo
 
Choosing the Right Graph Database to Succeed in Your Project
Choosing the Right Graph Database to Succeed in Your ProjectChoosing the Right Graph Database to Succeed in Your Project
Choosing the Right Graph Database to Succeed in Your ProjectOntotext
 
An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...
An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...
An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...Joshua Shinavier
 
Towards Responsible AI - KC.pptx
Towards Responsible AI - KC.pptxTowards Responsible AI - KC.pptx
Towards Responsible AI - KC.pptxLuis775803
 
Enhanced Deep Residual Networks for Single Image Super-Resolution
Enhanced Deep Residual Networks for Single Image Super-ResolutionEnhanced Deep Residual Networks for Single Image Super-Resolution
Enhanced Deep Residual Networks for Single Image Super-ResolutionNAVER Engineering
 

Mais procurados (20)

Neo4j Data Science Presentation
Neo4j Data Science PresentationNeo4j Data Science Presentation
Neo4j Data Science Presentation
 
YOLO
YOLOYOLO
YOLO
 
YOLO v1
YOLO v1YOLO v1
YOLO v1
 
Object detection and Instance Segmentation
Object detection and Instance SegmentationObject detection and Instance Segmentation
Object detection and Instance Segmentation
 
Lecture9 camera calibration
Lecture9 camera calibrationLecture9 camera calibration
Lecture9 camera calibration
 
Introduction to Graph Databases
Introduction to Graph DatabasesIntroduction to Graph Databases
Introduction to Graph Databases
 
Anything-to-Graph
Anything-to-GraphAnything-to-Graph
Anything-to-Graph
 
Panel: AI for Social Good - Fairness, Ethics, Accountability, and Transparency
Panel: AI for Social Good - Fairness, Ethics, Accountability, and TransparencyPanel: AI for Social Good - Fairness, Ethics, Accountability, and Transparency
Panel: AI for Social Good - Fairness, Ethics, Accountability, and Transparency
 
How to Synchronize ArcGIS Portal Items with FME
How to Synchronize ArcGIS Portal Items with FMEHow to Synchronize ArcGIS Portal Items with FME
How to Synchronize ArcGIS Portal Items with FME
 
水耕栽培を始めたばかりの時に 知っておきたかったこと
水耕栽培を始めたばかりの時に 知っておきたかったこと水耕栽培を始めたばかりの時に 知っておきたかったこと
水耕栽培を始めたばかりの時に 知っておきたかったこと
 
올바른 분석을 방해하는 함정 카드 피해가기
올바른 분석을 방해하는 함정 카드 피해가기올바른 분석을 방해하는 함정 카드 피해가기
올바른 분석을 방해하는 함정 카드 피해가기
 
Neo4j Bloom: What’s New with Neo4j's Data Visualization Tool
Neo4j Bloom: What’s New with Neo4j's Data Visualization ToolNeo4j Bloom: What’s New with Neo4j's Data Visualization Tool
Neo4j Bloom: What’s New with Neo4j's Data Visualization Tool
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
 
Webinar: Survival Analysis for Marketing Attribution - July 17, 2013
Webinar: Survival Analysis for Marketing Attribution - July 17, 2013Webinar: Survival Analysis for Marketing Attribution - July 17, 2013
Webinar: Survival Analysis for Marketing Attribution - July 17, 2013
 
Neo4j Presentation
Neo4j PresentationNeo4j Presentation
Neo4j Presentation
 
Machine learning testing survey, landscapes and horizons, the Cliff Notes
Machine learning testing  survey, landscapes and horizons, the Cliff NotesMachine learning testing  survey, landscapes and horizons, the Cliff Notes
Machine learning testing survey, landscapes and horizons, the Cliff Notes
 
Choosing the Right Graph Database to Succeed in Your Project
Choosing the Right Graph Database to Succeed in Your ProjectChoosing the Right Graph Database to Succeed in Your Project
Choosing the Right Graph Database to Succeed in Your Project
 
An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...
An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...
An Algebraic Data Model for Graphs and Hypergraphs (Category Theory meetup, N...
 
Towards Responsible AI - KC.pptx
Towards Responsible AI - KC.pptxTowards Responsible AI - KC.pptx
Towards Responsible AI - KC.pptx
 
Enhanced Deep Residual Networks for Single Image Super-Resolution
Enhanced Deep Residual Networks for Single Image Super-ResolutionEnhanced Deep Residual Networks for Single Image Super-Resolution
Enhanced Deep Residual Networks for Single Image Super-Resolution
 

Semelhante a 빅 데이터 개요 및 활용

빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0Konkuk University
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScienceNAVER D2
 
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa영진 박
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410Peter Woo
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)Hong-Seok Kim
 
발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2
발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2
발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2BruceDong WinnersLab
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)Steve Min
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력현주 유
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향atelier t*h
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료환태 김
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked dataymchu88
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아K data
 

Semelhante a 빅 데이터 개요 및 활용 (20)

빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0
 
[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience[2A7]Linkedin'sDataScienceWhyIsItScience
[2A7]Linkedin'sDataScienceWhyIsItScience
 
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
 
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
 
BigData, Hadoop과 Node.js
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)
 
Big data
Big dataBig data
Big data
 
발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2
발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2
발표자료 4차 산업혁명 시대를 선도하는 스타트업분석 동우상_170720_v1.2
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력
 
빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향빅데이터 기술 및 시장동향
빅데이터 기술 및 시장동향
 
Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료Enterprise conference 2013 Microsoft BigData 사례발표자료
Enterprise conference 2013 Microsoft BigData 사례발표자료
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked data
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 

Mais de Jin wook

자연어처리 소개
자연어처리 소개자연어처리 소개
자연어처리 소개Jin wook
 
클린 아키텍처 재해석
클린 아키텍처 재해석클린 아키텍처 재해석
클린 아키텍처 재해석Jin wook
 
Angular2를 위한 컴포넌트 분석과 개발
Angular2를 위한 컴포넌트 분석과 개발Angular2를 위한 컴포넌트 분석과 개발
Angular2를 위한 컴포넌트 분석과 개발Jin wook
 
Angular2를 위한 타입스크립트
Angular2를 위한 타입스크립트Angular2를 위한 타입스크립트
Angular2를 위한 타입스크립트Jin wook
 
Angular2를 활용한 컴포넌트 중심의 개발
Angular2를 활용한 컴포넌트 중심의 개발Angular2를 활용한 컴포넌트 중심의 개발
Angular2를 활용한 컴포넌트 중심의 개발Jin wook
 
MIPS CPU의 이해 (입문)
MIPS CPU의 이해 (입문)MIPS CPU의 이해 (입문)
MIPS CPU의 이해 (입문)Jin wook
 
Mongo DB 성능최적화 전략
Mongo DB 성능최적화 전략Mongo DB 성능최적화 전략
Mongo DB 성능최적화 전략Jin wook
 
PHP를 위한 NginX(엔진엑스) 시작과 설정
PHP를 위한 NginX(엔진엑스) 시작과 설정PHP를 위한 NginX(엔진엑스) 시작과 설정
PHP를 위한 NginX(엔진엑스) 시작과 설정Jin wook
 
Mongo DB로 진행하는 CRUD
Mongo DB로 진행하는 CRUDMongo DB로 진행하는 CRUD
Mongo DB로 진행하는 CRUDJin wook
 
아파치 쓰리프트 (Apache Thrift)
아파치 쓰리프트 (Apache Thrift) 아파치 쓰리프트 (Apache Thrift)
아파치 쓰리프트 (Apache Thrift) Jin wook
 
Node.js의 도입과 활용
Node.js의 도입과 활용Node.js의 도입과 활용
Node.js의 도입과 활용Jin wook
 
파이썬(Python) 소개
파이썬(Python) 소개파이썬(Python) 소개
파이썬(Python) 소개Jin wook
 
AngularJS의 개발방식에 대하여
AngularJS의 개발방식에 대하여AngularJS의 개발방식에 대하여
AngularJS의 개발방식에 대하여Jin wook
 

Mais de Jin wook (13)

자연어처리 소개
자연어처리 소개자연어처리 소개
자연어처리 소개
 
클린 아키텍처 재해석
클린 아키텍처 재해석클린 아키텍처 재해석
클린 아키텍처 재해석
 
Angular2를 위한 컴포넌트 분석과 개발
Angular2를 위한 컴포넌트 분석과 개발Angular2를 위한 컴포넌트 분석과 개발
Angular2를 위한 컴포넌트 분석과 개발
 
Angular2를 위한 타입스크립트
Angular2를 위한 타입스크립트Angular2를 위한 타입스크립트
Angular2를 위한 타입스크립트
 
Angular2를 활용한 컴포넌트 중심의 개발
Angular2를 활용한 컴포넌트 중심의 개발Angular2를 활용한 컴포넌트 중심의 개발
Angular2를 활용한 컴포넌트 중심의 개발
 
MIPS CPU의 이해 (입문)
MIPS CPU의 이해 (입문)MIPS CPU의 이해 (입문)
MIPS CPU의 이해 (입문)
 
Mongo DB 성능최적화 전략
Mongo DB 성능최적화 전략Mongo DB 성능최적화 전략
Mongo DB 성능최적화 전략
 
PHP를 위한 NginX(엔진엑스) 시작과 설정
PHP를 위한 NginX(엔진엑스) 시작과 설정PHP를 위한 NginX(엔진엑스) 시작과 설정
PHP를 위한 NginX(엔진엑스) 시작과 설정
 
Mongo DB로 진행하는 CRUD
Mongo DB로 진행하는 CRUDMongo DB로 진행하는 CRUD
Mongo DB로 진행하는 CRUD
 
아파치 쓰리프트 (Apache Thrift)
아파치 쓰리프트 (Apache Thrift) 아파치 쓰리프트 (Apache Thrift)
아파치 쓰리프트 (Apache Thrift)
 
Node.js의 도입과 활용
Node.js의 도입과 활용Node.js의 도입과 활용
Node.js의 도입과 활용
 
파이썬(Python) 소개
파이썬(Python) 소개파이썬(Python) 소개
파이썬(Python) 소개
 
AngularJS의 개발방식에 대하여
AngularJS의 개발방식에 대하여AngularJS의 개발방식에 대하여
AngularJS의 개발방식에 대하여
 

빅 데이터 개요 및 활용

  • 1. 빅 데이터 개요 및 활용 정 진 욱 2014. 5. 7
  • 2. 목차  빅 데이터 개요  빅 데이터 동향  빅 데이터 분석  빅 데이터 활용 2
  • 3. 빅 데이터 개요 : 정의  빅 데이터는 단지 크기(규모)만을 의미하지 않는다. 3 …
  • 4. 빅 데이터 개요 :규모와 속도  데이터 홍수 – 2020년은 현재(2011년 기준)대비 50배 Data 증가예상 = 40ZB ~ 50ZB  40ZB = 전 세계 모래알의 수 7억 50만조개 X 57 4 1.8 Zeta byte
  • 5. 빅 데이터 개요 : 다양성  정형 데이터 (컴퓨터가 이해할 수 있는 포맷을 가짐) – DATABASE, XML, RDF 등  비정형 데이터 (컴퓨터가 이해할 수 없는 포맷을 가짐) – 이미지, 동영상, 기타 (PDF, 엑셀, PPT 등등) 5 http://www.wolframalpha.com/input/?i=linear+equations&lk=4 http://www.wolframalpha.com/
  • 6. 목차  빅 데이터 개요  빅 데이터 동향  빅 데이터 분석  빅 데이터 활용 6
  • 7. 빅 데이터 동향 : 주요 국가별  주요 국가들은 (미국, EU, 영국, 호주등) 빅 데이터 활성화 노력. – 미국 : 12년부터 연간 2억 달러 이상투입, (빅데이터 R&D 계획) – UN : 정책의 수립 및 집행에 빅 데이터 활용 7 빅데이터 투자 (미국) 빅데이터 투자 (국내)
  • 8. 빅 데이터 동향 : 주요기업 (서비스) 8
  • 9. 빅 데이터 동향 : 주요기업 (데이터 분석)  IBM – 지난 5년간 140억 달러 이상을 투자, 네티자, 에센셜, 코그너스 등 데이터 저 장/분석 업체를 인수하면서 빅 데이터 기술력 확보에 주력  SAS – 전세계 비즈니스 분석 소프트웨어 및 서비스 분야의 리더 – SAS Visual Analytics software demo  ORACLE – 하이페리온사 인수하여 데이터 분석 기술 확보 – SUN 인수하여 하드웨어 기술과 자사 주력분야인 DB S/W를 결합한 빅 데이 터 어플라이언스를 개발하고 출시하였다. 9
  • 10. 빅 데이터 동향 : 신조어 (어플라이언스)  어플라이언스 – H/W와 S/W를 결합하여, 업무목적에 맞게 최적화시킨 통합시스템  빅 데이터 어플라이언스 – 빅 데이터 S/W (예 : 하둡) + H/W – 예 : 오라클 빅 데이터 어플라이언스 , LG CNS의 SBP Appliance 10 어플라이언스 (SW+HW의 통합 생테계) 빅 데이터 어플라이언스
  • 11. 목차  빅 데이터 개요  빅 데이터 동향  빅 데이터 분석  빅 데이터 활용 11
  • 12. 빅 데이터 분석 : 질문 12 나란히 진열된 기저귀와 맥주, 비밀은「데이터마이닝」 - ZD Net Korea 대형할인점에서 유아용 기저귀와 함께 가장 잘 팔리는 제품은 무엇일까?
  • 13. 빅 데이터 분석 : 두 가지 목적  두번째 목적 : 통찰력 얻기 – 데이터 마이닝 방법  연관규칙 찾기 (예 : 맥주와 기저기) – 통계적 방법을 통한 분석 및 예측  범죄지역 예측 / 이현봉 교수  다음의 빅데이터 분석사례 (10m)  당신의 욕망이 보인다. / 소셜 매트릭스 13  첫번째 목적 : 서비스  추천서비스 (아마존, 페이스북 친구추천)  분류서비스 (감정분류)  시리, 왓슨, 구글번역, 등  음성인식  딥 러닝(MIT 올해의 10대 혁신기술) 데이터 분석 후 시각화 (Visualization) [인포그래픽] / R 등 이용 통계
  • 14. 빅 데이터 분석 : 분석과정 및 방법 14
  • 15. 빅 데이터 분석 : 분석을 위한 데이터 얻기  공공 빅 데이터 – 특징 : 개방성 (상대적 가치) – 얻을 수 있는곳  세계 각국 기관에서 공개한 데이터 사용 – 예 : 공공 데이터 포털(https://www.data.go.kr/), http://data.seoul.go.kr/, Linked Open Data, Etc  데이터 예: 지하철 승하차 인원  관련영상 : 내 삶은 바꾸는 데이터 혁명 (유주완 프로그래머 강연)  비공공 빅 데이터 – 특징 : 폐쇄성 (상업적 이용, 가치가 있음) – 얻을 수 있는 곳  내부 비공개 데이터로 획득불가 15
  • 16. 목차  빅 데이터 개요  빅 데이터 동향  빅 데이터 분석  빅 데이터 활용 16
  • 17. 빅 데이터 활용 : 응용사례 (주요한) 17
  • 18. 빅 데이터 활용 : 응용사례 (인공지능)  IBM – 왓슨  Data : encyclopedias, dictionaries, thesauri, newswire articles, and literary works. Watson also used databases, taxonomies, and ontologies. Specifically, DBPedia, WordNet, and Yago were used. 18
  • 19. 빅 데이터 활용 : 응용사례 (인공지능)  구글 – 구글 무인자동차  초당 1G 데이터 처리, 빅 데이터 수집 , 정리, 분석  기사 – 빅 데이터 관리 (데이터 센터) 19
  • 20. 빅 데이터 활용 : 응용사례 (분석 및 예측)  Crimemapping.com 20 - 미국의 샌프란시스코에서 범죄 기록을 바탕으로, 범죄 발생지역 예측Minority Report - Minority Report의 범죄예측이 현실에 가까워 지고 있음

Notas do Editor

  1. 1 제타바이트는 1,000*1,000*1,000 테라바이트와 그 용량
  2. 기타 SK 텔레콤 T-Map 네비게이션 전국 도로의 교통 상황을 5분 단위로 수집, 분석해 정확한 친절한 길 안내 및 도착 시간 제공 고객 이탈을 사전에 감지한 T-Mobile 미국의 T-Mobile은 자사의 빅데이터(통화 송수신내역)를 분석해 통신사 전환 위험을 감지하는 시스템을 감지  이탈 징후를 보이는 고객에게 맞춤형 추가 혜택을 제공 볼보(자동차 기업)의 빅데이터 활용 센서를 통한 빅데이터 축적하고 이를 분석하여 결함을 조기에 발견하고, 사후관리 비용 크게 줄임. 운전 제어를 이한 많은 센서와 CPU 내장되어 있음. 수집된 데이터를 본사의 분석 시스템에 자동 전송하도록 하여 빅데이터를 축적하고, 이를 활용해 제품개발 단계에서 알기 어려움 다양한 결함과 소비자의 잠재 요구를 파악하여 대응. (50만대 판매후 제가되었을 결함을 1000대 판매 시점에 포착, 사후관리 비용 감소) 야후,  각국 정부는 빅데이터를 미래사회 경제적 가치의 원천으로 간주하고 각 분야에 걸쳐 빅데이터 서비스 활성화 차원에서 노력해야 하는데요. 우리나라 는 선진국에 비해 약간 늦었지만 범부처가 참여하여 다양한 정책방안을 제시하였습니다. 정부는 공공정보 공개사이트인 '공유자원포털'을 통해 중앙 부처 및 지자체의 공공데이터를 공개하고 있으며, 현재 133개의 서비스와 441개의 데이터 세트를 제공하고 있습니다. 빅데이터 + 클라우드  서비스 빅데이터 활용법과 미래전망 http://www.youtube.com/watch?v=5USR99HKB70 324억달러 규모 성장 전망 투자이유 의사결정 질 속도향상 신제품 개발 신규고객 유치 http://www.youtube.com/watch?v=VHC7B5JO_N4 미래예측 트랜드 예측 개인의 맙춤형 마케팅..에 활용 10년 동안 데이터 수집후 분석  신기술의 예측
  3. 왓슨의 빠른 데이터 처리속도를 바탕으로 건강보험 자료와 웰포인트 건강 보험회사에 등록된 3420만명에 달하는 환자 정보를 통합하고, 이를 기초로 복잡한 의학적 치료법을 찾아내는 것 입니다. 질병 치료법을 제안하는 일은 빅 데이터를 분석하고 처리하는 일입니다. 환자 차트와 의사나 병원이 갖고 있는 각종 질병 치료에 대한 기록, 보험회사가 가진 치료법과 시술 자료뿐만 아니라 왓슨 자체에 저장된 의료 논문까지 포함되는 방대한 자료를 입니다.