-
Data Scientist 에게 필요한 능력. 인문학적 소양.IT 2015. 6. 5. 23:03
Data Scientist 에게 필요한 능력. 인문학적 소양.
Data Scientist 에게 필요한 능력. 인문학적 소양.
무수한 정보를 내포하고 있는 비정형화된 빅 데이터 속에서 가치를 찾아내기 위한 능력은 지금까지 생각했던 것들은 크게 두가지였다.
대량의 데이터에서 Python 같은 텍스트마이닝 툴을 통하여 원하는 정보를 찾아내는 능력, 그리고 일정한 목적을 가지고 추출한 데이터에 대해서 데이터들의 상관관계를 기반으로 원하는 예측했던 가설을 증명하는 능력이었다.
나의 생각과 경험이 짧았다는 것을 빅데이터 분석 경진대회 칼럼을 통해 깨달았다.
"빅데이터는 데이터를 추출하고 그 데이터에서 패턴을 찾아내는 분석의 과정과 그 패턴에서 의미를 찾아서 가치를 덧붙이는 해석의 과정으로 이뤄져 있다. 여기에서 분석과정은 기술로 해결되지만 해석 과정은 기술로 해결되지 않는다. 해석 과정에서 인간이나 사회에 대한 이해가 필요한 경우가 많기 때문이다. 그래서 인문학이 중요하다고 말할 수 있다.
전산학이나 통계학이 수학이나 컴퓨터에 가까운 학문이라고 본다면 문헌정보학은 기술 보다는 인문학에 가깝다고 할 수 있다. 그렇다면 사회학, 심리학, 철학이 더 인간 사회에 대한 해석이 유리할 수 있는데 그럼에도 불구하고 문헌정보학과가 빅데이터와 연관성을 갖는 이유는 무엇일까.
그 답은 분류에 있었다. < [DT광장] `빅 데이터` 올바르게 해석하기 >"
데이터의 분석 만큼이나 해석 과정이 중요하다는 것이다.
애플이 사용자의 경험을 통대로 제품을 개발하기 위한 인문학이 중요하다고 한 것 처럼, 빅 데이터의 해석 과정에서 세상의 기본적이며 잠재된 의식을 내포되어 있는 데이터에서 원하는 것을 뽑아내는 데 인문학적 소양이 중요하다는 것을 새삼 깨달게 되었다.
만약 비인문학적 전공자로서 이러한 인문학적 능력을 기르기 위해 필요한 것은 무엇일까?
먼저 다양한 분야에 대한 독서를 통한 배경지식을 쌓는 일이다. 최근이 인기를 얻고 있는 '지금시작하는 인문학' 같은 책은 심리학, 회화, 신화 , 역사 등의 이야기에 대해서 통해서 내가 이미 알고 있던 내용을 다시한번 곱씹어 볼 수 있었고, 지금까지 인류 생활의 흐름을 통하여 다양한 삶의 이야기를 배울 수 있다. 다양한 환경과 위치 속에서 인류가 살아온 모습은 지금의 삶과 앞으로의 삶을 예측하는데 도움이 될 것이다.