카테고리 없음

표준편차(Standard Deviation)란? 개념부터 계산법까지 쉽게 정리

v3535 2025. 2. 6. 13:12

데이터를 분석할 때 단순히 평균(Mean)만 보는 것보다 데이터가 얼마나 퍼져 있는지(산포도)를 아는 것이 더 중요하다. 예를 들어, 두 반의 수학 시험 평균 점수가 80점이라고 해도, 한 반은 모든 학생의 점수가 78~82점 사이에 몰려 있고, 다른 반은 50점부터 100점까지 널뛰기하는 경우가 있다. 이 두 반은 평균 점수는 같지만, 점수 분포의 차이가 크므로 동일한 수준이라고 보기 어렵다.

이처럼 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 수치로 나타낸 것이 표준편차(Standard Deviation)이다. 쉽게 말해, 표준편차가 작으면 데이터가 평균 근처에 몰려 있고, 크면 데이터가 평균에서 멀리 흩어져 있다는 의미이다.

 

📌 표준편차가 활용되는 분야

표준편차는 다양한 분야에서 활용되며, 대표적인 예는 다음과 같다.

  • 시험 성적 분석 📊: 학생들의 성적 분포를 확인하고, 특정 그룹의 편차를 분석하는 데 사용된다.
  • 제품 품질 관리 🏭: 공장에서 생산된 부품의 크기나 무게가 일정한지 확인하는 데 활용된다.
  • 주식 시장 변동성 분석 📈: 특정 주식의 가격 변동 폭이 크면 위험이 크다고 평가할 수 있다.
  • 스포츠 기록 분석 ⚽: 선수들의 경기력 일관성을 평가하는 데 도움을 준다.
  • 기후 변화 연구 🌡️: 지역별 온도 변동 폭을 비교하고 이상 기후 여부를 판단하는 데 사용된다.

이처럼 표준편차는 데이터의 일관성과 변동성을 파악하는 데 중요한 도구이다. 다음으로, 표준편차를 직접 계산하는 방법을 살펴보겠다.

 

표준편차(Standard Deviation)란?

표준편차(Standard Deviation)는 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 나타내는 값이다. 쉽게 말해, 데이터의 변동성이 크면 표준편차가 크고, 데이터가 평균 근처에 몰려 있으면 표준편차가 작다.

예를 들어, 두 개의 반에서 시험을 봤다고 가정하자.

  • A반 점수: 78, 79, 80, 81, 82 (모든 점수가 평균 80 근처에 몰려 있음)
  • B반 점수: 50, 60, 80, 90, 100 (점수가 널리 퍼져 있음)

이 경우, A반과 B반의 평균 점수는 동일하지만 B반의 점수 분포가 훨씬 넓다. 따라서 B반의 표준편차가 더 크다고 할 수 있다.

 

표준편차 공식

표준편차는 다음과 같은 공식으로 계산된다.

모집단 표준편차 (전체 데이터)

\( \sigma = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (X_i - \mu)^2} \)

  • \( \sigma \) = 모집단 표준편차
  • \( X_i \) = 각 데이터 값
  • \( \mu \) = 평균
  • \( = 전체 데이터 개수

표본 표준편차 (일부 데이터 샘플)

  • \(s\) = 표본 표준편차
  • \(\bar{X}\) = 표본 평균
  • \(n\) = 표본 크기

모집단 표준편차와 표본 표준편차의 차이는 분모에서 "N" 대신 "n-1"을 사용하는지 여부이다. 모집단 전체를 다루는 경우에는 \(N\)을 사용하지만, 일부 표본만을 분석하는 경우에는 표본 크기가 작을수록 불확실성이 증가하므로 \(n-1\)을 사용하여 보정한다.

 

표준편차의 특징

  1. 값이 작을수록 데이터가 평균 근처에 밀집되어 있다.
  2. 값이 클수록 데이터가 평균에서 멀리 퍼져 있다.
  3. 표준편차가 0이면 모든 데이터가 동일한 값을 가진다.
  4. 정규분포를 따르는 경우, 평균 ± 1표준편차 범위에 전체 데이터의 약 68%가 포함된다.

 

표준편차의 직관적 이해

예제 1: 두 반의 시험 점수 비교

반점수 목록평균표준편차

A반 78, 79, 80, 81, 82 80 작음
B반 50, 60, 80, 90, 100 80
  • 두 반 모두 평균이 80이지만, B반의 점수는 널리 퍼져 있어서 표준편차가 크다.
  • A반은 학생들의 점수가 평균 80 근처에 밀집되어 있어 표준편차가 작다.

예제 2: 주식 변동성

  • 주가 변동이 심한 종목: 표준편차가 크며, 리스크가 높다.
  • 안정적인 종목: 표준편차가 작아, 변동성이 낮고 안정적이다.

 

표준편차는 데이터의 변동성을 나타내는 중요한 지표로, 다양한 분야에서 활용된다. 다음으로는 표준편차를 직접 계산하는 방법을 알아보겠다.

 

1. 계산 예제 (손으로 계산하기)

다음과 같은 표본 데이터를 사용하여 표본 표준편차를 직접 계산해보자.

\( X = \{10, 12, 23, 23, 16\} \)

(1) 표본 평균 계산

표본 평균 \(\bar{X}\)는 다음과 같이 구한다.

\[ \bar{X} = \frac{\sum X_i}{n} \]

데이터를 대입하면,

\[ \bar{X} = \frac{10 + 12 + 23 + 23 + 16}{5} = \frac{84}{5} = 16.8 \]

(2) 각 데이터에서 평균을 뺀 후 제곱

\[ (X_i - \bar{X})^2 \]

데이터 \(X_i\) 평균과 차이 \(X_i - \bar{X}\) 제곱 \((X_i - \bar{X})^2\)
10 \(10 - 16.8 = -6.8\) \((-6.8)^2 = 46.24\)
12 \(12 - 16.8 = -4.8\) \((-4.8)^2 = 23.04\)
23 \(23 - 16.8 = 6.2\) \(6.2^2 = 38.44\)
23 \(23 - 16.8 = 6.2\) \(6.2^2 = 38.44\)
16 \(16 - 16.8 = -0.8\) \((-0.8)^2 = 0.64\)

2. Python을 활용한 표준편차 계산

위의 계산을 Python을 이용해 쉽게 수행할 수도 있다.

import numpy as np

data = [10, 12, 23, 23, 16]

# 모집단 표준편차
population_std = np.std(data)

# 표본 표준편차
sample_std = np.std(data, ddof=1)

print(f"모집단 표준편차: {population_std:.2f}")
print(f"표본 표준편차: {sample_std:.2f}")

결과

모집단 표준편차: 5.42
표본 표준편차: 6.06

 

이와 같이 Python을 활용하면 빠르고 정확하게 표준편차를 계산할 수 있다.

 

3. Excel을 이용한 표준편차 계산

Excel에서도 표준편차를 쉽게 계산할 수 있다.

  • 모집단 표준편차: =STDEVP(A1:A5)
  • 표본 표준편차: =STDEV(A1:A5)

이제 표준편차가 무엇인지, 어떻게 계산하는지, 그리고 다양한 도구를 활용하는 방법까지 알게 되었다. 이를 활용해 다양한 데이터 분석에 적용할 수 있다.

 

 

 

 

표준편차(Standard Deviation)는 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 나타내는 중요한 통계 지표이다. 표준편차가 작으면 데이터가 평균에 밀집되어 있고, 크면 데이터가 평균에서 멀리 퍼져 있음을 의미한다.

표준편차는 시험 성적 분석, 품질 관리, 주식 시장 변동성 평가, 스포츠 기록 분석, 기후 연구 등 다양한 분야에서 활용되며, 데이터의 일관성과 변동성을 파악하는 데 필수적인 도구이다.

표준편차를 계산하는 방법은 크게 손으로 직접 계산하는 방식, Python 같은 프로그래밍 언어를 활용하는 방법, Excel과 같은 소프트웨어를 이용하는 방법이 있다. 각 방법을 활용하면 실무에서 표준편차를 쉽게 구하고 분석할 수 있다.

이제 표준편차의 개념과 계산법을 이해했으므로, 이를 활용하여 데이터의 변동성을 분석하고 다양한 문제를 해결할 수 있을 것이다. 다음 단계로, 표준편차가 실생활에서 어떻게 활용되는지 더 구체적인 사례를 살펴보는 것도 좋은 방향이 될 것이다.