구글에서 제공하는 웹 애널리틱스(Google Analytics, 통칭 GA)가 지난 2023년 7월 1일부터 GA4로 업그레이드 되어 사용자들의 움직임이 분주하다. 내가 속한 부서에서도 광고 데이터를 통계적으로 분석하는 연구가 진행 중이라 유심히 들여다볼 기회가 더러 있는데, 이참에 겸사겸사, 데이터 분석가로서 느낀 몇 가지를 나눠 보려 한다.
참고로, 애널리틱스(Analytics)는 ‘분석’이라는 뜻이다. 개인적으로 궁금해서 Analytics와 Analysis의 차이를 찾아본 적이 있는데, 이해할 만한 답을 얻지는 못했다. 그러나 경험 상 Analytics라는 용어는, 빅데이터라는 개념이 대중화되면서 함께 회자 되는 것 같고, 분석하는 ‘행위’ 그 자체보다는 “날 것의 데이터(Raw Data)를 (차트 등의) 시각적으로 구현해주는 솔루션”으로 불리는 것 같다.
(GA에 능숙한 동료의 가르침에 따르면,) GA의 본질은 “웹사이트 트래픽 추적 및 보고 툴”이고, 풀어보면 “우리가 운영하는 웹사이트 방문자들의 행동을 추적하고 보고하는 기능이 핵심이며, 이를 간단히 시각화하여 보여주기도 하는 툴”이라고 한다. 내 미숙한 입장에서 보면, 태블로(Tableau)나 GA나 또 구글에서 별도로 제공하는 루커 스튜디오(Looker Studio)나 결국 데이터를 시각적으로 표현한다는 점에서 한 묶음이지만, 어쨌든 세부 특성과 역할의 차이는 존재하니 일단 넘어가자.
빅데이터 등장 이후로 다양하게 쏟아지는 소위 ‘분석 툴’은 진화 된 기술의 산물이다. 데이터에 관해 깊이 공부하지 않은 사람이라도 우리가 가진 데이터의 특성이나 구조를 개략적으로 이해할 수 있으며, 일부 지표 변화를 통해 간단한 의사 결정도 가능하다. 더욱이 실제 광고가 집행되는 포털사이트에서 개발하고 제공하는 솔루션이라면, (방문자들의 거시적 온라인 행동 패턴 데이터를 제공하는 등의) 여러 부가 기능도 있으니 딱히 쓰지 않을 이유도 없다. 그런데 반면, 우리가 가진 데이터를 최대한 보편화한 솔루션의 정해진 규칙대로, 너무 단순하게 압축시켜 보는 것은 아닌지, 경계가 필요하다.
사견이지만, 데이터 분석 관점에서 빅데이터 시대를 세 가지로 요약하면 ‘테크(Tech) 천착’과 ‘시각화의 범람’, ‘자유도의 부재’라고 본다. 이 세 가지는 하나로 관통될 수 있는데, “기술(테크)에만 집착하다가 난립하는 시각화에 치여 분석의 자유도가 자꾸만 사라진다”는 것이다.
당연한 얘기지만, 빅데이터의 등장은 기술의 발전과 연관되어 있다. 사람이 일일이 확인하기 어려운 규모의 데이터를 기술적으로 단순화시켜 표현해 주는 것으로 시작했다. SNS 상에서 우리 제품에 대해 몇 명이 “좋다”고 언급했는지를 보여주거나 사이트 방문자들이 어떤 채널로 가장 많이 들어왔는지를 간단히 보여주는 것이다. 빅데이터가 막 등장했던 초기에는 이런 자료들이 굉장히 유용했을 것이다. 그리고 만약 여전히 우리 회사만 이런 솔루션을 이용하고 있다면 매우 강력한 퍼포먼스를 ‘매번’ 낼 수 있을 것이다. 그런데 같은 솔루션들을 누구나 이용하고 있는 지금은 어떨까? 얼마나 많은 데이터를 보는지 보다 어떻게 데이터를 보는 지가 경쟁력이 된다.
GA에서 제공하는 분석 항목 중에 ‘관심도 카테고리’라는 게 있다. 우리 사이트 방문객들이, 구글을 통해 다른 어떤 사이트들을 방문했는지를 추적하여, 그들의 평소 관심 영역을 보여주는 데이터다. 예를 들어 우리 사이트에 주로 방문하는 유저들의 관심 성향이 News/Department Store/Pet이라고 하면 ‘언론 기사를 주로 보면서 백화점을 통한 소비가 빈번하고 반려동물을 키우고 있나 보다’ 라는 식으로 추정할 수 있게 해주는 데이터다.
그런데 이 데이터를 사용하는 기업은 많이 없다. 왜냐하면 GA 상에서 제공하는 고객의 관심도 결과가, 이미 알고 있는 고객 특성과 유사해서 딱히 새롭게 느껴지지 않거나, 포털사이트 특성상 한 사람이 방문하는 사이트 종류가 워낙 광범위해서 관심이 높은 분야와 그렇지 않은 분야의 간극이 크지 않다는 생각 때문이다.
그래서 이럴 때 ‘심층 분석’이 필요하다. GA가 이미 ‘심층’ 분석된 결과이지 않느냐고 반문할지 모르겠지만 GA 상에서 표현된 결과는 단편적인 현상에 가깝다. 2차, 3차의 추가 분석이 필요하다.
실제로 몇 년 전에 우리가 이 관심도 데이터를 활용해서, 매년 동시기에 진행하는 이벤트(프로모션) 기간에 유입된 고객의 특성을 연 단위로 프로파일링 해보았는데, 특정 시기에 유입된 고객의 특성이 기존과 달라진 사실을 발견했다. 극단적으로 예로 들면, ‘가성비’ 중심에서 ‘프리미엄’ 중심 소비층으로 이동한 것이다. 그런데 재미있는 건, 늘 그렇듯 당 시기에도 기존 대비 매출의 변동이 적었기 때문에, 유입 고객의 특성이 변했다는 사실을 아무도 눈치채지 못했다는 것이다.
예를 들어, 4050대가 주로 방문하는 오프라인 매장에 어느 날 갑자기 수십 명의 2030대가 들이닥쳤다고 생각해 보자. 전체 매출이 동일했다고 그냥 지나쳤을까? 아마 매장 직원은 바로 본사에 전화를 넣었을 것이다.
물론 이런 발견은 흔치 않다. 그리고 관심도 항목이 늘 이런 역할을 해주지도 않을 것이다. 하지만 기존에 파리만 날리던 데이터라도 다른 관점으로 보면 혁혁한 결과를 줄 수 있다. 빅데이터는 항상 융합 관점에서 고민 되어야 하고, 주어진 데이터 중 유의미한 변수를 선별해야 하며, 그리고 나서야 비로소 우리가 속한 산업의 특성이나 브랜드 제공 가치, KPI를 기준으로 분석 체계가 정립되어야 한다.
이왕 GA4로 분주해졌을 때, 기존 버전을 그대로 이관하기보다 한 번쯤 작정하고 들여다보는 것은 어떨까?
출처 : 매드타임스(MADTimes)(http://www.madtimes.org)