본문 바로가기

책책책/책 이야기

[책 이야기] 빅데이터 분석대로 미래는 이루어진다 - 우종필



파이썬, R 등을 이용하지 않고 구글에서 제공하는 구글 트렌드로 미국 대선의 결과를 예측한 대학 교수님이 지은 책

빅데이터 분석의 가장 기초는 통계라는 것을 다시 한번 느꼈다.

IT 기술도 중요하겠지만, 통계의 지식 없이 빅데이터를 분석하는 것은 불가능 할 것 같다.



p248

빅데이터라고 하면 언뜻 '많은 양의 데이터'라고 단순히 생각할 수 있지만, 실제로 양보다는 데이터의 다양성이 기존의 데이터와 차별점이라고 할 수 있다. 빅데이터의 정의를 보면 '빅Big+데이터data'의 합성어로 방대한 양의 데이터를 의미하는 것이 맞지만, 기존에 데이터로 불렸던 정형 데이터Structured data뿐만 아니라 데이터로 취급되지 않았던 '반정형 데이터'와 '비정형 데이터를' 포함한다는 것이다.


p252

빅데이터는 기존 데이터가 가지지 못한 고유의 특징을 가지고 있다. 빅데이터의 특징은 다양하지만, 일반적으로 가트너에서 정의한 3V로 압축된다. 3V는 데이터의 양을 의미하는 'Volumn', 데이터 생성속도 'Velocity', 형태의 다양성 'Variety'로 구성된다.


p320

우리 모두는 불확실한 시대에 살면서, 삶의 매순간 의사결정을 강요받게 된다. 이런 불확실성을 줄이기 위해 우리는 끊임없이 미래를 예측하는 시도를 해왔는지도 모른다. 한국의 역술이나 서양의 점성술, 그리고 노스트라다무스의 예언서가 지금까지 연구되는 것도 이렇게 미래를 알고 싶어하는 인간의 심리를 자극하고 있기 때문이 아닐까? 이런 측면에서 빅데이터는 앞으로 우리 인류의 새로운 점성술이 될 것이라 감히 말하고 싶다.

"빅데이터 분석대로 미래는 이루어진다"