숫자를 쉼표나 공백으로 구분해 입력하면 평균(mean)·중앙값(median)·최빈값(mode)·표준편차·분산을 한 번에 계산합니다. 데이터 개수에 제한이 없어 시험 성적 전체를 그대로 붙여넣어도 됩니다.
대푯값 — 평균·중앙값·최빈값 차이
같은 데이터를 설명하는 세 가지 대푯값이 어떻게 다른지 비교표로 확인하세요.
| 대푯값 | 정의 | 강점 | 약점 |
|---|---|---|---|
| 평균 (mean) | 모든 값의 합 ÷ 개수 | 직관적, 계산 쉬움 | 이상치(outlier)에 취약 |
| 중앙값 (median) | 정렬 후 가운데 값 | 이상치에 강함 | 값의 크기를 반영 못함 |
| 최빈값 (mode) | 가장 자주 등장하는 값 | 범주형 데이터에 유용 | 데이터 분포가 고르면 무의미 |
예를 들어 연봉 데이터 [3천, 3천, 3.5천, 4천, 20천]이 있을 때 평균은 6.7천만원이지만 중앙값은 3.5천만원입니다. 20천이라는 이상치 하나가 평균을 크게 왜곡합니다. 부동산 가격, 소득 통계처럼 극단값이 있는 데이터는 중앙값이 실상을 더 잘 반영합니다.
표준편차·분산 공식
표준편차는 데이터가 평균에서 얼마나 흩어져 있는지를 나타냅니다.
| 통계량 | 공식 | 의미 |
|---|---|---|
| 모분산 σ² | Σ(xᵢ − x̄)² / N | 전체 집단 기준 |
| 표본분산 s² | Σ(xᵢ − x̄)² / (N−1) | 표본으로 모집단 추정 |
| 모표준편차 σ | √(모분산) | 원래 단위로 흩어짐 표현 |
| 표본표준편차 s | √(표본분산) | 엑셀 STDEV 함수 기본값 |
이 계산기는 모분산(N으로 나누기)을 사용합니다. 엑셀 STDEV 함수(표본표준편차, N−1)와는 값이 약간 다를 수 있습니다. 반 전체 성적처럼 데이터가 모집단 자체이면 모표준편차가 맞고, 전교생 중 일부를 샘플로 뽑았다면 표본표준편차를 써야 합니다.
정규분포와 68-95-99.7 규칙
데이터가 정규분포를 따를 때, 표준편차로 분포 범위를 예측할 수 있습니다.
| 범위 | 포함 비율 | 예시 (평균 70, 표준편차 10) |
|---|---|---|
| 평균 ± 1σ | 약 68.3% | 60~80점 구간 |
| 평균 ± 2σ | 약 95.4% | 50~90점 구간 |
| 평균 ± 3σ | 약 99.7% | 40~100점 구간 |
표준편차가 작으면 데이터가 평균 근처에 몰려 있고(점수 차이가 적음), 크면 데이터가 넓게 퍼져 있습니다(점수 격차가 큼). 수능 표준점수도 이 원리로 계산됩니다.