출처
https://yozm.wishket.com/magazine/detail/1123/
양질의 데이터를 판별하는 5가지 방법 : 5 목적에 적합한 데이터인가? | 요즘IT
사실 좋은 데이터라고 매번 쓰이는 것은 아니며 좋지 않은 데이터라고 절대 사용되지 않는 것은 아닙니다. 양질의 데이터라는 것은 상황에 따라, 분석 목적에 따라 변화하기 마련입니다. 결국
yozm.wishket.com
요약
이 아티클은
데이터가 양질의 데이터인지 판단하려면 분석 목적에 적합한 데이터인지 확인해야 한다는 내용을 설명한다.
좋은 데이터인지 단순히 양, 신뢰도, 구조만 보는 것이 아니라 현실적인 분석 목적에 맞는 정보가 담겨 있는지가 중요하다고 말한다.
주요포인트
1. 양질의 데이터란?
어떤 데이터가 좋은지 절대적인 기준은 없다.
데이터가 분석하려는 목적에 맞게 정보가 있는지가 가장 중요하다.
2. 데이터에 원하는 정보가 있는가 확인하기
DIKW 피라미드 이론을 통해 데이터 → 정보 → 지식 → 지혜로 갈수록 실제로 사용할 수 있는 데이터가 된다.
단순히 많이 수집된 데이터라 하더라도 원하는 정보가 없으면 분석에 쓸모가 없다.
3. 같은 데이터라도 사람에 따라 다르게 평가될 수 있다
데이터의 가치 판단은 사람에 따라 달라질 수 있다
숙련된 분석가는 작은 패턴도 찾아낼 수 있지만, 덜 숙련된 분석가는 놓칠 수 있다
4. 분석 방법에 적합한 데이터인가
분석 방법이 무엇인지에 따라 필요한 데이터가 달라진다.
5. 인사이트 도출용 데이터
단순 데이터만 있는 것보다 지수처럼 가공된 데이터가 인사이트를 찾는 데 유리하다.
6. 결론
분석 목적이 명확하지 않으면 “좋은 데이터”라 평가할 수 없다.
핵심개념&용어정리
양질의 데이터: 분석 목적에 부합하는, 실제 필요한 정보가 들어 있는 데이터
DIKW 피라미드: Data → Information → Knowledge → Wisdom의 계층 구조
종속 변수: 머신러닝에서 예측하려는 대상 데이터
인사이트
좋은 데이터란 분석 목적에 맞는 데이터란 점과 단순히 많은 데이터가 있다고 해서 좋은 데이터가 되지는 않는점을 배울수 있었다. 특히 가장 중요한것은 분석 목적을 먼저 정해야 데이터의 질을 판단할 수 있다는 점이였다
'D.직무 분석 > 아티클 스터디' 카테고리의 다른 글
| 양질의 데이터를 판별하는 5가지 방법 4: 데이터형식을 파악했는가? (0) | 2026.02.03 |
|---|---|
| 양질의 데이터를 판별하는 5가지 방법 3: 관계형 데이터베이스인가? (1) | 2026.01.24 |
| 양질의 데이터를 판별하는 5가지 방법 2: 믿을 수 있는 데이터인가? (0) | 2026.01.20 |
| 양질의 데이터를 판별하는 5가지 방법 1: 데이터 양은 충분한가? (0) | 2026.01.15 |
| 실험 조직으로 거듭나기: 2 검증할 '만'한 가설은? (1) | 2026.01.13 |
