사용자 행동 데이터를 분석할 때 주의할 점
서비스 안에서 사용자가 어떤 행동을 하는지 파악하는 건 매우 중요하다. 이탈 지점은 어디인지, 클릭은 어느 정도 발생했는지, 장바구니까지 담고 왜 구매로 이어지지 않았는지. 이런 질문에 답하기 위해 많은 팀들이 사용자 행동 로그(User Activity Log) 를 기반으로 분석을 진행한다.
하지만 로그 데이터를 다룬다는 건 단순히 수치를 꺼내보는 일이 아니다. 사용자의 행동, 로그의 구조, 수집 방식, 그리고 조회 방법까지 모두 고려해야 분석이 가능하다. 아래는 사용자 행동 로그를 분석하기 전에 반드시 알고 있어야 할 네 가지 핵심 사항이다.
1. 사용자들은 우리가 원하는 대로 서비스를 쓰지 않는다
기획자는 대개 이상적인 사용자 흐름을 상정하고 서비스 구조를 설계한다. 하지만 실제 사용자들은 그 시나리오대로 행동하지 않는다.
- 상품 상세를 보지 않고 바로 장바구니에 담기도 하고
- 중간에 페이지를 새로고침하거나
- 특정 기능을 의도하지 않은 방식으로 활용하기도 한다
이처럼 예상하지 못한 행동도 실제 데이터로 남는다. 그렇기 때문에 로그 분석 시에는 ‘비정상적인 행동’이라고 단정짓기보다는,
다양한 행동 패턴의 가능성을 열어두고 분석에 반영하는 태도가 필요하다. 특정 지표가 낮다고 해서 곧바로 UX 문제로 단정 짓기보다는, 사용자가 의도와 다른 방식으로 행동했을 가능성도 함께 고려해야 한다.
2. 데이터가 기록되는 방식을 정확하게 이해해야 한다
사용자 행동 로그는 대부분 자동으로 수집되지만, 어떤 이벤트가 어떤 시점에 기록되는지 정확히 이해하지 못하면 분석이 왜곡될 수 있다.
예를 들어 ‘장바구니 담기’ 이벤트가
- 버튼 클릭 시점에 수집되는지
- 실제 서버 요청이 완료된 시점에 기록되는지
- 혹은 실패 여부와 관계없이 일단 이벤트가 전송되는지에 따라 해석이 완전히 달라진다.
또, 같은 기능이라도 웹과 앱에서 수집 방식이 다르거나, 브라우저나 디바이스 환경에 따라 특정 필드가 누락되는 경우도 있다.
정확한 분석을 위해서는 이벤트 정의서를 꼼꼼히 확인하고, 데이터가 어떤 구조와 방식으로 수집되고 있는지를 먼저 파악해야 한다.
3. 데이터는 언제나 잘못 기록될 가능성이 있다
데이터는 항상 ‘정확할 것’이라는 가정 하에 분석을 시작하지만, 현실에서는 누락, 중복, 필드 오류, 버그 등이 빈번하게 발생한다.
예를 들어,
- 사용자의 네트워크 상태가 불안정해서 이벤트 전송이 누락되거나
- 새 기능 배포 과정에서 태깅이 누락되거나
- 같은 이벤트가 두 번씩 수집되는 경우도 있다
이런 문제는 수치만 보고는 쉽게 파악되지 않기 때문에, 분석을 시작하기 전에 반드시 데이터 품질 검토가 필요하다.
- 특정 이벤트 수치가 급격히 변하지는 않았는지
- 필수 필드 값이 Null로 비정상적으로 많이 들어오고 있진 않은지
- 수집 로직이 변경되거나 릴리즈가 있었던 시점과 맞물려 있진 않은지
이런 점검 과정을 거치지 않으면, 결과적으로 의미 없는 수치를 기반으로 결론을 도출할 위험이 높아진다.
4. 데이터를 조회할 때 주의가 필요하다
사용자 행동 로그는 짧은 시간 동안에도 매우 많은 양의 데이터가 쌓인다. 결제처럼 하루에 몇 번 일어나기 힘든 이벤트와 달리, 클릭, 스크롤, 페이지 이동 등은 한 명의 사용자가 수백 번 이상 발생시킬 수 있는 행동이기 때문이다.
- 불필요하게 많은 데이터를 불러오게 되고
- 이로 인해 쿼리 속도 저하, 리소스 낭비, 심할 경우 DB 과부하나 서버 장애로 이어질 수 있다.
실제로 단순한 클릭 로그 테이블이라 하더라도, WHERE 조건 없이 수개월치 데이터를 조회하거나, 전체 테이블 스캔이 일어나는 쿼리를 날리면 장애 상황이 발생할 수 있다.
때문에 사용자 로그 데이터는 다음과 같은 주의가 필요하다.
- 시간 필터를 포함한다
- 조회 대상 이벤트를 명확히 지정한다 (불필요한 이벤트까지 포함하지 않도록)
- 집계 단위를 사전에 정한다 (사용자 기준인지, 세션 기준인지, 이벤트 기준인지)
- 샘플링을 활용하거나, 사전 집계 테이블을 사용하는 전략도 고려한다
참고
https://datarian.io/blog/4things-you-should-know-for-user-activity-log-analysis
'etc' 카테고리의 다른 글
UTM 파라미터 (0) | 2025.02.25 |
---|---|
리텐션 차트(Retention Chrat)와 리텐션 커브(Retention Curve) (0) | 2025.02.16 |
사용자 고착도 (Stickiness) (0) | 2025.02.16 |
범위 리텐션 (Range Retention) (0) | 2025.02.16 |
롤링 리텐션 (Rolling Retention) (0) | 2025.02.16 |