1. 빅데이터의 이해
-
데이터 크기 관점
-
일반적인 DB 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
-
-
데이터 분석 관점
-
대규모 데이터를 저렴한 비용으로 가치를 추출, 초고속 수집, 발굴 ,분석을 지원하도록 고안된 차세대 기술 및 아키텍처
-
-
데이터 가치 관점
-
대용량 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일
-
-
가트너 그룹 더 그래니가 언급한 빅데이터의 정의
-
Volume - 생성되는 모든 데이터를 수집
-
Variety - 정형화된 데이터를 넘어 텍스트,오디오,비디오 등 모든 유형의 데이터를 분석대상으로 함
-
Velocity - 사용자가 원하는 시간내에 분석 결과를 제공하는 것 / 데이터의 업데이트 되는 속도가 매우 빨라지는 것
-
-
데이터 단위
-
1TB - 1024 GB
-
1PB(페타바이트) - 1024 TB
-
1EB(엑사바이트) - 1024 PB
-
1ZB(제타바이트) - 1024 EB
-
2. 빅데이터 기능
-
차세대 산업혁명에서 해낼 것으로 기대됨 - 제조업뿐만아니라 서비스 분야 생산성 ↑
-
경제성장에 필요한 '정보'를 제공 - 산업 전반의 생산성을 한 단계 향상
-
데이터가 산업 전반에 영향을 미칠 것
-
'공동 활용의 목적으로 구축된 유무형의 구조물' - 플랫폼
3. 빅데이터가 만들어낸 변화
-
사전처리 -> 사후처리 : 가능한 한 많은 데이터를 모으고 다양한 방식으로 조합해 숨은 정보를 찾아냄
-
표본조사 -> 전수조사 : 표본조사가 주지 못하는 패턴이나 정보를 제공
-
질 << 양 : 데이터 수가 증가함에 따라 사소한 몇개의 오류 데이터가 영항을 주지 않음
-
인과관계 -> 상관관계 : 인과관계 모델은 비용이 매우 비쌈, 비즈니스 상황에서는 상관관계만으로 충분함
2. 빅데이터의 가치와 영향
1. 빅데이터 가치
-
빅데이터의 가치 산정이 어려운 이유
-
데이터의 활용 방식 : 언제 어디서 누가 활용할지 알 수 없음
-
새로운 가치 창출 : 기존에 없던 가치를 창출 --> 측정하기 어려움
-
분석 기술의 발달 : 가치없는 데이터도 거대한 가치를 만들어 내는 재료가 될 가능성이 있음
-
2. 빅데이터의 영향
-
빅데이터 영향
-
기업 : 혁신, 경쟁력 제고, 생산성 향상
-
정부 : 환경탐색, 상황분석, 미래대응
-
개인 : 목적에 따라 활용
-
-
빅데이터가 가치를 만들어내는 방식
-
투명성 제고로 연구개발 및 관리 효율성 제고
-
시뮬레이션을 통한 수요포착 및 주요 변수 탐색으로 경쟁력 강화
-
고객 세분화 및 맞춤 서비스 제공
-
알고리즘 활용한 의사결정 보조 , 대체
-
비즈니스 모델,제품,서비스의 혁신
-
3. 비즈니스 모델
- 빅데이터 활용 사례
- 구글 검색엔진, 월마트의 구매패턴 분석, IBM 왓슨 의료 분야에 활용
- 정부의 실시간 교통정보 활용 ( CCTV )
- 정치인의 사회관계망분석을 통한 유세, 가수의 팬 음악청취 기록 분석 활용
- 아마존의 킨들에 쌓이는 전자책 읽기 관련 데이터 분석해 저자들에게 제공
- 빅데이터 활용 테크닉
- 연관 규칙 학습 : 변수 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법
- 유형분석 : 사용자가 어떤 특성을 가진 집단에 속하는가 와 같은 문제를 해결하고자 할때 사용
- 유전 알고리즘 : 최적화의 메커니즘을 찾아가는 방법
- 기계학습 : 훈련 데이터로부터 학습한 알려진 특성을 활용해 "예측" 하는 일에 초점
- 회귀분석 : "구매자의 나이가 구매차량의 타입에 어떤영향을 미치는가?" 와 같은 문제를 답할 때 사용
- 감정분석 : "새로운 환불 정책에 대한 고객의 평가는 어떤가?" 를 알고 싶을 때 활용
- 소셜 네트워크 분석(= 사회관계망분석 SNA) : 영향력 있는 사람을 찾아낼 수 있으면, 고객들 간 소셜 관계 파악
4. 위기 요인과 통제 방안
- 사생활 침해 - 특정 데이터가 본래 목적 외에 가공 처리돼 다른 목적으로 활용될 가능성이 증가
- 익명화
- 동의에서 책임으로 변경 - 사용자에게 책임을 지움
- 책임 원칙의 훼손 - 잠재적 위험 사항에 대해서도 책임을 추궁하는 사회로 변질될 가능성 증가
- 기존 책임 원칙을 강화
- 데이터의 오용 - 주어진 데이터에 잘못된 인사이트를 얻어 비즈니스에 직접 손실을 불러올 수 있음
- 데이터 알고리즘에 대한 접근권 허용
- 객관적 인증방안을 도입하는 필요성을 제기
5. 미래의 빅데이터
- 빅데이터 활용 3요소 - 데이터 / 기술 / 인력
- 데이터 : 특정한 목적없이 생산된 데이터라도 창의적으로 재활용 -> 가치를 생성
- 기술 : 데이터 양 증가 -> 알고리즘 정확도 증가
- 인력 : 다각적 분석을 통해 인사이트 도출, 조직 전략 방향 제시에 활용
'ADSP > 1강) 데이터의 이해' 카테고리의 다른 글
[6] 가치창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2020.02.03 |
---|---|
[2,3] 데이터베이스 정의와 특징 & 활용 (0) | 2020.01.21 |
[1] 데이터와 정보 (0) | 2020.01.13 |