평균·표준편차 계산기 — 중앙값·최빈값·분산 한번에

📊 평균·표준편차 계산기

시험 점수 목록 붙여넣으면 평균·표준편차 바로 나오는 계산기. 데이터 분석 수업, 통계 과제, 성적 분포 확인할 때.

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

숫자를 쉼표나 공백으로 구분해 입력하면 평균(mean)·중앙값(median)·최빈값(mode)·표준편차·분산을 한 번에 계산합니다. 데이터 개수에 제한이 없어 시험 성적 전체를 그대로 붙여넣어도 됩니다.

대푯값 — 평균·중앙값·최빈값 차이

같은 데이터를 설명하는 세 가지 대푯값이 어떻게 다른지 비교표로 확인하세요.

대푯값	정의	강점	약점
평균 (mean)	모든 값의 합 ÷ 개수	직관적, 계산 쉬움	이상치(outlier)에 취약
중앙값 (median)	정렬 후 가운데 값	이상치에 강함	값의 크기를 반영 못함
최빈값 (mode)	가장 자주 등장하는 값	범주형 데이터에 유용	데이터 분포가 고르면 무의미

예를 들어 연봉 데이터 [3천, 3천, 3.5천, 4천, 20천]이 있을 때 평균은 6.7천만원이지만 중앙값은 3.5천만원입니다. 20천이라는 이상치 하나가 평균을 크게 왜곡합니다. 부동산 가격, 소득 통계처럼 극단값이 있는 데이터는 중앙값이 실상을 더 잘 반영합니다.

표준편차·분산 공식

표준편차는 데이터가 평균에서 얼마나 흩어져 있는지를 나타냅니다.

통계량	공식	의미
모분산 σ²	Σ(xᵢ − x̄)² / N	전체 집단 기준
표본분산 s²	Σ(xᵢ − x̄)² / (N−1)	표본으로 모집단 추정
모표준편차 σ	√(모분산)	원래 단위로 흩어짐 표현
표본표준편차 s	√(표본분산)	엑셀 STDEV 함수 기본값

이 계산기는 모분산(N으로 나누기)을 사용합니다. 엑셀 STDEV 함수(표본표준편차, N−1)와는 값이 약간 다를 수 있습니다. 반 전체 성적처럼 데이터가 모집단 자체이면 모표준편차가 맞고, 전교생 중 일부를 샘플로 뽑았다면 표본표준편차를 써야 합니다.

정규분포와 68-95-99.7 규칙

데이터가 정규분포를 따를 때, 표준편차로 분포 범위를 예측할 수 있습니다.

범위	포함 비율	예시 (평균 70, 표준편차 10)
평균 ± 1σ	약 68.3%	60~80점 구간
평균 ± 2σ	약 95.4%	50~90점 구간
평균 ± 3σ	약 99.7%	40~100점 구간

표준편차가 작으면 데이터가 평균 근처에 몰려 있고(점수 차이가 적음), 크면 데이터가 넓게 퍼져 있습니다(점수 격차가 큼). 수능 표준점수도 이 원리로 계산됩니다.

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

자주 묻는 질문

평균과 중앙값 중 어느 쪽이 대표값으로 더 좋나요?

이상치(매우 크거나 작은 값)가 있으면 중앙값이 더 대표성이 높습니다. 대한민국 가구 소득 평균이 높게 나오는 이유는 소수 고소득층이 평균을 끌어올리기 때문입니다. 이때 중앙값은 평균보다 수백만원 낮게 나와 '보통 가구'의 실상을 더 잘 반영합니다. 반면 데이터가 고르게 분포되어 있으면 평균이 계산이 쉽고 충분합니다.

표준편차가 크면 어떤 의미인가요?

표준편차가 크면 데이터가 평균에서 멀리 퍼져 있다는 뜻입니다. 시험 점수로 예를 들면, 평균 70점에 표준편차 5이면 대부분 65~75점에 몰려 있고, 표준편차 20이면 50~90점까지 점수 폭이 넓습니다. 투자 수익률에서 표준편차는 리스크(변동성)를 나타내며, 표준편차가 클수록 수익이 들쭉날쭉합니다.

모분산과 표본분산은 언제 각각 써야 하나요?

조사 대상 전체(모집단)의 데이터를 갖고 있으면 모분산(N으로 나누기)을 씁니다. 반 전체 학생 성적처럼요. 반면 전체 중 일부만 뽑아서(표본) 전체를 추정하려면 표본분산(N−1로 나누기)을 씁니다. N−1로 나누는 이유는 표본이 모집단의 변동을 실제보다 작게 추정하는 경향(편향)을 보정하기 위해서입니다. 엑셀 STDEV 함수는 표본표준편차를, STDEVP 함수는 모표준편차를 계산합니다.

데이터에 이상치(outlier)가 있으면 어떻게 처리하나요?

이상치는 평균과 표준편차를 크게 왜곡합니다. 처리 방법은 3가지입니다. 첫째, 평균 대신 중앙값을 대표값으로 사용합니다. 둘째, IQR(사분위범위) 기준으로 Q1−1.5×IQR 아래, Q3+1.5×IQR 위의 값을 제거합니다. 셋째, 도메인 지식으로 오류 데이터인지 확인해 제거합니다. 이상치를 제거할 때는 이유를 명시해야 합니다.

표준편차가 0이면 어떤 의미인가요?

표준편차가 0이면 모든 데이터 값이 동일하다는 의미입니다. 예를 들어 [5, 5, 5, 5]이면 평균도 5, 표준편차도 0입니다. 실제 데이터에서는 측정 오류가 없고 정확히 같은 값이 반복될 때만 가능합니다. 데이터 입력 오류나 중복 기록 가능성도 확인해보는 것이 좋습니다.

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

📊 평균·표준편차 계산기

대푯값 — 평균·중앙값·최빈값 차이

표준편차·분산 공식

정규분포와 68-95-99.7 규칙

자주 묻는 질문

평균과 중앙값 중 어느 쪽이 대표값으로 더 좋나요?

표준편차가 크면 어떤 의미인가요?

모분산과 표본분산은 언제 각각 써야 하나요?

데이터에 이상치(outlier)가 있으면 어떻게 처리하나요?

표준편차가 0이면 어떤 의미인가요?

관련 계산기