참조

https://papago9211.tistory.com/145

 

기초 프로젝트: 분석 방법론

Google이 말하는 데이터 분석의 6단계기존 전통적인 데이터 분석(클리닝, 변환, 시각화, 모델링)과 달리, Google은 의사결정 중심으로 데이터 분석을 정의한다.아래 6단계를 제대로 수행하면 더 나은

papago9211.tistory.com

 

 

Step 1. Ask. 질문하기

Background. 배경 이해하기

분석이 필요하게 된 맥락을 정리한다.
언제부터 문제가 발생했는지, 어떤 고객층에서 나타났는지, 경쟁사·계절성 등 외부 요인이 있는지를 함께 파악한다.

 

예시

"최근 3개월간 신규 고객 수가 20% 감소하였고, 같은 시기에 경쟁사가 대규모 신규 고객 프로모션을 진행하였다."


Business Goal. 비즈니스 목표 이해하기

배경에서 드러난 상황을 바탕으로 분석 목적을 구체적인 질문이나 해결 과제로 정의한다.
“왜 발생했는가”, “어떻게 개선할 수 있는가” 형태로 명확히 정리한다.

 

예시

“신규 고객 감소의 원인을 파악하고, 회복을 위해 어떤 채널을 강화해야 하는지 도출한다.”


Scope of Collaboratio. 협업 범위 정의하기

프로젝트에 참여하는 구성원과 각자의 역할을 명확히 구분한다.
분석, 데이터 제공, 의사결정 등 책임 영역을 사전에 정리한다.

 

예시

• 분석가: 최근 데이터 정리 및 분석

• 마케팅팀: 캠페인 내역 제공

• 경영진: 분석 결과 기반 의사결정


Scope & Limitation. 분석 범위 및 제한 이해하기

분석에서 다룰 수 있는 범위와 다룰 수 없는 한계를 명확히 정의한다.
사용할 기간, 지표, 데이터 수준을 사전에 합의한다.

 

예시

• 범위: 최근 1년간 고객 가입 데이터를 채널별로 분석

• 제한: 고객 개인의 세부 행동 데이터는 포함되지 않음


 

Deliverables. 산출물 정의하기

분석 결과를 어떤 형태로 제공할 것인지를 사전에 결정한다.
대시보드, 보고서, 프레젠테이션 등 결과물의 형식을 명확히 한다.

 

예시

“ 채널별 신규 고객 추이를 보여주는 시각화 차트와 요약 보고서를 제공한다.”


Step 2. Prepare

Identify Sources. 데이터 출처 파악하기

분석에 필요한 데이터가 어디에서 생성되고 수집되는지 확인한다.
내부 시스템, 설문조사, 공개 데이터, 외부 API 등 출처를 명확히 기록한다.

 

예시

“내부 CRM 시스템에서 고객 가입 데이터를 가져오고, 외부 통계청에서 인구 데이터를 추가로 수집했다.”


Understand Format & Structure. 데이터 형식과 구조 이해하기

데이터가 파일인지 데이터베이스 테이블인지 확인하고, 각 컬럼의 의미와 단위, 기준을 파악한다.
한 행과 한 열이 무엇을 의미하는지를 명확히 이해한다.

 

예시

“고객 데이터는 CSV 파일 형식이며, 한 행은 한 명의 고객, 열은 고객 속성(나이, 성별, 지역, 구매금액)을 나타낸다.”


Assess Data Quality. 데이터 품질 검토하기 (다음에)

결측치, 중복, 이상값, 불일치 여부를 개략적으로 확인하여 데이터 상태를 파악한다.

 

예시

“고객 데이터 중 15%는 이메일 주소가 비어 있으며, 지역 코드가 중복 입력된 사례가 있다.”


Check Accessibility & Permissions. 데이터 접근성 및 권한 확인하기 (다음에)

데이터 접근 권한, 저장 위치, 보안 요건 및 개인정보 포함 여부를 사전에 확인한다.

 

예시

“개인정보 컬럼은 비식별화 후 사용해야 하며, 데이터는 사내 보안 서버에만 저장 가능하다.”


Step 3. Process

결측치 처리 = 값이 비어 있는 경우(NaN)

이상치 처리 = 현실적으로 불가능하거나 입력 오류로 보이는 값 (ex: 영화 3000분, TV Show 0 Season)

정제(Cleaning) = 값은 있으나 형식이 제각각인 경우 구조를 통일 (ex: 2026.09.04 ↔ 26년9월4일)

 

Exploratory Data Analysis, EDA탐색적 데이터 분석

요약 통계와 시각화를 활용해 데이터를 전반적으로 탐색한다.
변수의 분포, 변수 간 관계, 시간에 따른 변화 추이를 파악하여 인사이트의 단서를 찾는다.

 

예시

“고객 연령대별 구매 금액 평균을 살펴보니, 20대 후반에서 가장 높은 지출을 보였다.”


Handle Missing Values. 결측치 처리하기

데이터에서 빠진 값을 식별하고, 상황에 맞는 방식으로 처리한다.
삭제, 평균·중앙값 대체, 다른 변수를 활용한 예측값 대체 등의 방법을 사용한다.

예시

“고객 나이 컬럼에서 비어 있는 값은 동일 연령대 평균으로 채웠다.”


Handle Outliers. 이상치 처리하기

다른 데이터와 비교했을 때 지나치게 크거나 작은 비정상적인 값을 탐지하고 조정한다.
필요에 따라 제거하거나 합리적인 범위로 수정한다.

 

예시

“구매 금액이 1억 원으로 기록된 값은 오류로 판단해 제거했다.”


Clean Data. 데이터 정제하기

중복 데이터 제거, 잘못된 입력값 수정, 날짜·숫자·문자 형식을 통일한다.
데이터를 일관된 구조로 정리하여 분석이 가능하도록 만든다.

 

예시

“중복 가입된 고객 ID를 제거하고, 날짜 포맷을 YYYY-MM-DD로 통일했다.”


Transform Data. 데이터 변환하기

분석 목적에 맞게 변수를 변환하거나 새로운 변수를 생성한다.
로그 변환, 범주형 변수 인코딩, 파생 변수 생성 등이 포함된다.

 

예시

“구매 금액을 로그 변환해 분포를 안정화하고, 고객 연령을 10대/20대/30대 등으로 묶어 새로운 변수로 만들었다.”


Sampling / Resampling. 데이터 샘플링·리샘플링하기 (다음에)

데이터 크기 축소나 클래스 불균형 해소를 위해 일부 데이터를 추출하거나 비율을 조정한다.

예시

전체 구매 고객 중 10%를 무작위로 샘플링하여 테스트 분석을 진행하였다.


Step 4. Analyze

Identify Patterns & Trends. 패턴 및 트렌드 분석

시간에 따른 변화, 집단 간 차이, 변수 간 상관관계를 분석한다.
데이터 속에 반복되는 규칙성과 전반적인 흐름을 파악한다.

 

예시

월간 신규 고객 수는 꾸준히 감소 추세였고, 특히 모바일 채널에서 하락 폭이 두드러졌다.”


 

Hypothesis Testing / Statistical Analysis. 가설 검정 및 통계 분석  (다음에)

데이터를 기반으로 설정한 가설이 통계적으로 유의미한지 검증한다.

 

예시

"남성 고객과 여성 고객의 평균 구매 금액 차이를 t-test로 검정한 결과, 통계적으로 유의한 차이가 존재하였다."


Prediction & Modeling. 예측 및 모델링  (다음에)

머신러닝, 회귀분석, 분류·군집 모델 등을 활용해 미래를 예측하거나 고객을 세분화한다.

 

예시

구매 이력 데이터를 활용해 재구매 가능성이 높은 고객을 예측하는 로지스틱 회귀 모델을 구축하였다.

 


Generate Insights. 인사이트 도출

분석을 통해 발견한 사실을 정리하고, 비즈니스 문제 해결에 연결되는 해석을 제시한다.
데이터가 의미하는 바를 의사결정 관점에서 명확히 설명한다.

 

예시

“20대 고객의 모바일 구매 감소는 경쟁사의 앱 전용 할인 이벤트와 시점이 일치한다. 따라서 자사도 앱 한정 프로모션을 기획할 필요가 있다.”


Step 5. Share

Visualize Results. 결과 시각화하기

분석 결과를 차트, 그래프, 대시보드 등 시각적 형태로 표현한다.
전달하고자 하는 메시지에 가장 적합한 시각화 방식을 선택한다.

 

예시

“신규 고객 수 변화를 막대그래프로, 매출 추세는 선그래프로 표현해 전반적인 흐름을 쉽게 보여주었다.”


Tell a Story with Data. 스토리로 전달하기

분석 결과를 단순히 나열하지 않고, 문제 제기부터 제안까지 흐름 있게 구성한다.
분석의 맥락과 의미를 이야기 구조로 전달한다.

 

예시

“지난 6개월간 고객 감소 → 모바일 채널 중심 하락 → 경쟁사 프로모션 영향 → 대응 전략 필요”라는 흐름으로 설명했다.”


Audience-tailored Reporting . 청중 맞춤형 보고 (다음에)

보고 대상에 맞춰 결과의 깊이와 표현 방식을 조정한다.

 

예시

“경영진에게는 1페이지 요약본을, 마케팅팀에게는 채널별 세부 분석 리포트를 제공했다.”


Use Collaboration Tools. 협업 도구 활용하기 (다음에)

협업 도구를 활용해 분석 결과를 공유하고 접근성을 높인다.

 

예시

“대시보드를 Tableau에 업로드해 실시간으로 확인 가능하게 했다.”


결과 검증 및 피드백 수집하기 (Validate & Collect Feedback) (다음에)

분석 결과에 대한 피드백을 수집해 보완하고 개선한다.

 

예시

“마케팅팀으로부터 ‘최근 SNS 캠페인 영향도 고려해야 한다’는 피드백을 받고 추가 분석을 진행했다.”


Step 6. Act (다음에)

Plan Action. 실행 계획 수립하기 (다음에)

분석 결과를 바탕으로 구체적인 실행 전략을 수립하고 실행 주체와 방식을 정리한다.

 

예시

신규 고객 확보를 위해 다음 달부터 SNS 채널 광고 예산을 20% 증액하기로 결정하였다.


Execute Strategy. 전략 실행하기 (다음에)

수립한 실행 계획을 실제 업무와 현장에 적용한다.

 

예시

"분석 결과를 바탕으로 신규 회원을 대상으로 첫 구매 할인 쿠폰을 발행하였다."


Measure Impact. 성과 측정하기 (다음에)

실행한 전략이 목표 달성에 얼마나 기여했는지를 지표를 통해 평가한다.

 

예시

"쿠폰 발행 이후 신규 회원 가입률이 15% 증가하였고, 재구매율 또한 개선되었다."


Continuous Improvement. 지속적 개선하기 (다음에)

성과 측정 결과를 바탕으로 전략을 조정하거나 보완한다.

 

예시

"SNS 광고는 높은 성과를 보였으나 이메일 마케팅 효과는 미미하여, 다음 분기에는 이메일 캠페인 대신 인플루언서 마케팅을 강화하기로 결정하였다."

'C. 프로젝트 > 기초 프로젝트' 카테고리의 다른 글

APPASA: Analyze. 분석하기  (0) 2026.01.25
APPASA: Process. 처리하기  (0) 2026.01.25
APPASA: Prepare. 준비하기  (0) 2026.01.25
APPASA: Ask. 질문하기  (0) 2026.01.25
기초 프로젝트: 분석 방법론  (1) 2026.01.25

+ Recent posts