[통계 I] 데이터를 지배하는 통계, 진화 거듭하다
[통계 I] 데이터를 지배하는 통계, 진화 거듭하다
  • 김남근 기자
  • 승인 2018.11.07 09:50
  • 댓글 0
이 기사를 공유합니다

데이터를 지배하는 통계, 진화 거듭하다

빅데이터와 통계학의 상호 상생 발전 선행돼야…

ⓒpixabay.com
ⓒpixabay.com

지식기반사회의 기본학문으로서 다양한 학문 분야뿐만 아니라 실생활에서도 그 적용 범위가 넓어지고 있는 통계. 현대의 디지털 혁명과도 맞물리며 대량의 데이터를 수집·축적하고 이를 과학적으로 분석해 의사결정에 활용하는 매우 중요한 학문으로 진화하고 있다. 즉, 사회 전반에 있어 통계에 대한 이해는 필수적이 되고 있는 것이다. 특히, 최근의 IT, BT 기술 발전에 따라 대량의 데이터베이스 구축과 이들을 연계하는 시스템의 발달로 인해 통계는 빅데이터(big data)에 의한 통계적 방법론이 제기되고 있다. 데이터에 의해 진화하는 통계, 그리고 통계로 인해 진화하는 데이터 간의 상관관계를 알아봤다.

통계의 진화는 계속될 것

모든 과학적 분석의 기초가 되는 통계. 세계는 혁명을 거듭하며 통계의 진화도 이뤄왔다. 과거에도 그랬고 현재도 그렇다. 앞으로도 이러한 현상은 지속될 것으로 전망된다.

최근의 통계는 4차 산업혁명과 맞물리며 비약적인 발전을 이루고 있다. 기초학문에서 벗어나 응용학문으로 자리 잡고 있으며, 사회 전반에 널리 적용되어 사용되고 있다. 실제로 우리가 생활하는데 발생하는 다양하고 객관적인 의사 결정 과정을 위해 정확한 표본설계 및 설문 조사의 필요성이 증가하는데, 여기에 통계학적 기법들이 널리 사용되고 있다. 또한, 학계는 물론 제조, 의료산업, 소셜 네트워크 정보의 분석을 통한 맞춤형 마케팅, 금융자료의 통합을 위한 위험관리, 기상 예측 등 많은 분야에 통계가 적용되고 있다. 이처럼 통계에 기반한 활동들은 빅데이터(big data)라는 이름으로 정의돼 사용되고 있는데, 이에 따라 의미 있는 분석을 위해 빅데이터가 발생하는 분야의 전문적 지식, 올바른 통계적 분석 방법의 이해 및 선택, 그리고 효율적인 소프트웨어 개발 및 활용이 가능한 데이터전문가(data scientist)에 대한 사회적 요구도 함께 커지고 있다. 더불어 과학기술의 인문학적 접근에 있어서도 통계, 즉 빅데이터가 활용되고 있기에 앞으로 지속해서 발전을 거듭할 것이란 전망이 지배적이다.

과거의 통계는 기존에 있던 특정 정보를 대부분 사람들이 직접 취합해왔지만, 최근에는 빅데이터에 활용되는 정보를 접속기록, 위치정보, 센서 등과 같이 다양한 대량의 정보를 취합할 수 있게 됐다. 데이터가 많아지면 예상치 못한 변수들이 발생하게 되는데, 이를 통계학적으로 접근하면 이들의 상관관계를 조사할 수 있고, 이전까지는 전혀 연관성 없다고 생각했던 부분까지 확인할 수 있게 된다. 때문에 통계와 빅데이터는 서로 떼려야 뗄 수 없는 관계를 가진다고 볼 수 있다.

서울대학교 통계학과 김용대 교수는 “최근 빅데이터에 대한 이슈는 많아지고 있지만, 통계학과 통계학자의 역할은 명확히 정의되지 않고 있다”며 “‘기존의 데이터 분석 관점을 버리지 않는 한 아무리 새로운 솔루션을 도입한다 해도 진정한 빅데이터의 가치를 얻어낼 수 없다’는 주장이 있는 만큼 빅데이터와 통계학의 상호 상생 발전이 이뤄지길 바란다”고 전했다.

객관적으로 데이터를 보는 노력 필요

이처럼 산업 전반에 커다란 기회의 장을 마련해주고 있는 ‘빅데이터’이지만, 개선·보완해야 할 문제점도 있다. 빅데이터와 관련된 통계학의 발전과 이를 위한 통계학자들의 노력이 첫 번째이며, 지나친 빅데이터 만능주의로 인해 발생될 문제를 예측하고 대응해야 하는 것이 두 번째다. 때문에 이에 대한 대안으로 빅데이터로 찾을 수 없는 것들을 인정하고 세밀한 관찰과 통찰력으로 분석대상에 더욱 집중할 수 있는 ‘스몰데이터’(small data)가 떠오르고 있다.

데이터 관련 사업을 하는 정 모 대표는 “빅데이터 만능주의는 최근 들어 언급되고 있는 내용으로 ‘목적에 대한 고민 없이 일단 모으고 보자는 식의 데이터 수집과 이로 인한 개인정보 유출과 기업의 보안 리스크, 상세한 모형의 내용과 투명성 없이 고객을 평가하고 세분화하여 통계적 차별을 유발하는 행위 등의 부작용’을 골자로 한다”고 전하기도 했다. 또 다른 업계 관계자는 “최근 스몰데이터가 서서히 자리를 굳혀가고 있는데, 스몰데이터 역시 빅데이터와 마찬가지로 그 자체가 강력한 인사이트를 제공하진 않는다”며 “수집된 정보가 무엇을 의미하는지, 또 어떻게 활용해야 하는지는 끊임없이 의문과 호기심을 갖고 바라봐야 새로운 기회를 발견할 수 있을 것”이라고 전했다.

황수경 통계청장은 “가치와 효용을 생각하면 스몰데이터는 작지만 아름답고 강하다. 빅데이터와는 경쟁이 아닌 상호보완 차원에서 스몰데이터를 수집하고 활용한다면 세상을 변화시키고, 우리 삶을 개선할 수 있는 통찰력과 혜안을 얻을 수 있을 것이다”며 “지금까지의 소극적이고 수동적인 통계 의존을 넘어 생활 속 통계와 스몰데이터까지 예리하게 바라보고 분석할 수 있는 관찰자 마인드로 전환이 필요하다”고 한 언론사의 칼럼을 통해 전한 바 있다.

데이터를 좀 더 객관적인 시각으로 바라보기 위해서는 통계라는 학문에 대해 심도 있게 생각해봐야 한다. 최근 들어 빅데이터가 사회적으로 큰 이슈가 되고 있지만, 이는 기존에 존재하지 않았던 것이 아니다. 이는 엄청난 양의 데이터에 수학을 적용해 확률을 추론하려는 노력일 뿐 새로운 것이 아니라는 것이다. 때문에 데이터에 접근하는 방식은 통찰력이 전재 돼야 할 것이다. 데이터로부터는 문제 해결의 실마리를 얻을 뿐, 실제로 이를 해결하고 정답을 만들어가는 것은 ‘사람’이기 때문이다. 진정한 의미의 데이터 활용을 위해서는 통계에 대한 새로운 시각에서의 고찰이 필요할 것이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.