“별 일이 없다면” 매주 매드타임즈(MADTimes)에 기고 중인 칼럼
2024년 새해가 밝았다. 새해를 밝히고 가장 먼저 한 일은 그동안 준비했던 솔루션을 론칭하는 일이었다. 론칭이라고 해봤자 운영하는 사이트에 업로드하고 몇몇 SNS 계정을 통해 공유하는 게 전부였지만 그래도 스스로 목표한 마감 기한이 지켜졌다는 뿌듯함이 있었다.
어쨌든 이번에 공개한 솔루션의 이름은 데이토즈(DATOZ)로,
이름에서 유추할 수 있듯이 데이터에 대한 모든 것, A to Z라는 의미를 담고 있다. 이 솔루션의 가장 큰 특징은 무료라는 점이다. 회원가입도 필요 없다. PC에 설치할 필요도 없다. 공유한 URL을 클릭해서 이용할 수 있으며, 다만, 데이터가 포함되지 않은 ‘분석 전용 프로그램’이기 때문에 자신이 가지고 있는 데이터를 업로드 해서 이용해야 한다. 또 모든 데이터가 다 되는 것도 아니고 한글 텍스트로 된 엑셀 포맷의 데이터를 업로드 해야 분석 결과를 내준다.
온라인 환경에서 기록되는 쇼핑 구매 후기나 Q&A 내용, SNS 게시물, 댓글, 라이브쇼핑 반응, 혹은 기업이 다양한 형태로 보유하고 있는 각종 VOC(고객 불만) 자료들을 분석할 수 있는 솔루션이다.
‘데이토즈’라는 이름에 걸맞게 텍스트 데이터를 통해 대표적으로 분석할 수 있는 기법들을 담았다. 가장 기본이 되는 키워드를 쪼개고 쪼개진 키워드가 몇 번이나 언급되었는지, 그리고 키워드 언급 빈도를 워드클라우드(WordCloud)라는 시각화 자료로 보여주는 기능 등의 기초 분석부터 SNA, LDA, TF-IDF, N-gram 등 이름만 들어도 머리가 아픈 복잡한 분석 기법까지 클릭 몇 번으로 손쉽게 분석할 수 있다.
통계 지식이 없어도, 코딩에 대해 전혀 몰라도 누구나 쉽게 다양한 분석을 수행할 수 있는 솔루션, 그게 우리가 론칭한 데이토즈(DATOZ)다.
2016년 구글 딥마인드의 알파고가 이세돌 9단을 이기며 인공지능(AI)의 가능성을 전 세계에 알렸지만, 전문가들은 오히려 2023년이 “인공지능 대중화의 첫 해”로 기억될 것이라며 입을 모은다. 출시 2달 만에 월간 이용자 수(MAU) 1억 명을 달성했던 챗GPT의 등장 때문이다.
챗GPT의 성공은 데이터 분석 분야에도 이미 적지 않은 파급효과를 일으키고 있다. 빅데이터가 촉발한 “코딩 열풍”도 이제부터는 서서히 잦아들지 않겠느냐는 분석까지 나온다. 실제로 이미 챗GPT는 코드 작성부터 오류 수정까지, 비전문가도 데이터 분석에 쉽게 접근하는 길을 조금씩 열고 있다.
AI의 등장으로 데이터 분석 분야는 본격적인 노코딩(No Coding) 시대로 접어들고 있으며, 데이터를 분석하고 활용하는 시장이 활성화되기 위해서는 데이터를 다루는 기술적인 장벽이 지금보다 훨씬 낮아져야 한다. 코딩을 잘하고 통계를 잘하는 사람만 할 수 있는 데이터 분석, 즉 전문 영역에서 대중들이 쉽게 이용하는 길로 조금씩 넓혀져야 한다. 그리고 만연해 있는 “코딩 is 데이터 분석”이라는 이상한 공식은 데이터 분석의 활성화에 아무런 도움이 되지 않는다.
빅데이터 등장 이전에는 인문학 등 소위 비전공자들의 직무 진입이 지금보다 훨씬 수월했다. 광고홍보학, 심리학, 사회학 등의 비전공자들을 분석가로 채용하는 것에 아무도 거리낌이 없었다. 데이터를 분석하는 기술만큼 데이터에 접근하고 해석하는 소양 역시 중요하다는 것을 알고 있었기 때문이다.
데이터의 형태가 달라지고 분석해야 하는 규모가 커졌다고 해서, 또 분석 기술이 엑셀이나 SPSS 같은 통계 프로그램에서 코딩으로 바뀌었다고 해서 가설이나 해석의 역할이 줄어들었을까. 데이터는 데이터다.
이제 데이터 분석 역량이 뛰어나다는 평가는 데이터를 쪼개고 가공하고 버리는 방법을 알고 있다는 것을 넘어, 데이터를 바라보는 관점을 시작으로 데이터의 특성이나 한계를 정의하고 분석을 통해 얻고자 하는 여러 개의 가설을 세우며 몇십 번, 몇백 번이라도 반복할 수 있는 치열한 의지, 그리고 정돈된 결과에 대한 해석과 제안에 나의 견해를 담을 수 있는지, 마지막으로 코딩도 모르고 통계도 모르는 다른 분야의 전문가들에게 설득력 있게 전달할 수 있는지 등으로 평가받아야 한다.
그런 시장으로 진입하기 위해서는 ‘코딩의 대중화’가 아닌 ‘데이터 분석’의 대중화가 필요하다. 데이터를 분석하기 위한 이론이나 방법에 대한 기본적인 이해가 있어야 한다. 그래야 과정이 아닌 결과를 놓고 소통할 수 있기 때문이다.
많이들, 전문가일수록 쉽게 얘기하는 능력이 필요하다고 하며 기술적인 용어 자체도 무조건 쉽게 전달해 달라고 한다. 물론 필요하다. 불특정 다수를 대상으로 강연을 진행한다면 말이다. 하지만 기업의 흥망성쇠를 데이터로 결정해야 한다면 얘기는 달라진다. 쉽게 이야기하고 듣는다고 해서 어려운 결정을 쉽게 할 리 만무하다. 분석 결과의 의미를 심도 있게 이해하기 위해서는 분석이라는 과정과 용어와, 기법에 대한 기본적인 이해가 필요하다.
데이토즈의 목적은, 단순히 분석 결과를 확인하는 것을 넘어 스스로 데이터를 심도 있게 분석할 기회를 주는 것이다. 그리고 우리는 이러한 분석 솔루션을 다양하게 만들 생각이다. 그중 하나로 광고 운영 데이터 분석 솔루션을 개발 중이다.
데이토즈에 대한 자세한 정보는 엠포스 데이터랩 사이트에서 확인할 수 있다.
출처 : 매드타임스(MADTimes)(http://www.madtimes.org)