빠른 계산기 > 수학 > 표준편차

표준편차 계산기

데이터 개수 0
평균 (Mean)
0
모집단 (Population)
모분산 (σ²)
0
모표준편차 (σ)
0
표본 (Sample)
표본분산 (s²)
0
표본표준편차 (s)
0

표준편차 계산기 설명

입력한 데이터의 표준편차를 계산해 주는 계산기입니다. 계산에 필요한 데이터를 입력하면 평균(mean), 분산(variance), 표준편차(standard deviation)를 계산하여 표시해 줍니다.

표준편차 계산기는 두 가지 버전의 분산과 표준편차를 표시하는데요, 먼저 분산(정확한 이름은 모분산)과 표준편차(정확한 이름은 모표준편차)를 표시한 후 그 아래에 표본 분산과 표본 표준편차를 따로 표시합니다.

평균은 데이터가 어디를 중심으로 모여 있는가를 알려주고, 표준편차는 데이터의 흩어져 있는 정도를 표시해 주는 통계량으로 분산에 루트를 씌운 값입니다.

분산과 표준편차 계산 공식

분산을 계산할 데이터 값들을 x₁, x₂, x₃, … , xₙ이라 하고 데이터 개수를 n개, 이들 데이터의 평균을 m 이라하면, 분산 계산 공식과 표준편차 계산 공식은 다음과 같습니다.

분산 = Σ(xᵢ - m)² / n

표준편차 = √[Σ(xᵢ - m)² / n]

분산 대신 표준편차를 쓰는 이유

분산은 개별 데이터 값과 평균의 차이를 제곱한 값들을 모두 더한 후 이를 데이터 개수로 나누어 계산합니다. 이처럼 분산 계산 과정에서 개별 데이터 값이 제곱 되기 때문에 원래 데이터의 척도가 과대하게 계산되는 문제가 생깁니다.

예를 들어, 원래 데이터가 ㎝로 기록된 것이라면 분산은 ㎠ 이 되어 버립니다. 이처럼 척도가 과대하게 계산되는 문제는 분산에 루트를 씌워 주면 해결됩니다. 그리고 분산에 루트를 씌운 것이 바로 표준편차입니다.

따라서 데이터 특징을 파악하기 위한 통계량으로 분산 대신 표준편차를 쓰는 이유는 표준편차를 계산하기 위해서는 분산이 필요하지만, 분산 자체는 원래 데이터의 척도를 제곱함으로써 데이터의 특징을 제대로 설명해 주지 못하기 때문입니다.

분산 계산할 때 분모는 n, n-1, 둘 중의 어느 것을 써야 하나?

저희 표준편차 계산기를 통해 볼 수 있는 결과는 입력한 자료가 모집단에 대한 자료라고 가정하여 계산한 분산과 표준편차입니다. 이 경우 계산 과정에 쓰이는 분모는 입력한 자료의 개수(n)입니다.

고등학교 교과 과정까지의 계산 문제는 거의 대부분 모집단의 분산과 표준편차를 계산하는 것입니다. 또 특별한 설명 없이 1, 3, 5, 7, 9 의 분산을 계산하라고 하면 이를 (모집단의 분산이라고 보아) 분모는 자료의 개수가 5개이므로 5 이어야 합니다.

그런데, 주어진 자료가 모집단에서 일부를 뽑은 표본이라면 분모는 5가 아니라 5-1인 4이어야 합니다.

모집단의 분산을 계산할 때는 분모로 n을 이용해야 하고, 표본의 분산을 계산할 때의 분모는 n-1을 이용해야 한다고 기억하면 됩니다.

표본의 분산을 계산할 때 분모가 n-1 이어야 하는 이유

표본의 분산을 계산할 때 분모가 n-1이어야 하는 이유는 두 가지 차원에서 찾을 수 있습니다.

  1. 보정의 차원: 표본 분산은 항상 모분산 보다 작을 수 밖에 없으므로, 이를 보정하기 위해 더 작은 수인 n-1로 나누어 값을 키워줍니다. (베셀의 보정)
  2. 자유도의 차원: 표본 분산을 계산하기 위해 필요한 자료의 개수는 n개가 아니라 'n-1'개(자유도)이기 때문입니다.

표본의 표준편차가 모집단 표준편차 보다 작을 수 밖에 없는 이유

표본은 모집단의 일부이므로 계산할 자료의 개수는 모집단에 있는 자료의 개수보다 작을 수 밖에 없습니다. 모집단 전체에 대한 자료를 얻을 수 없기 때문에 표본을 추출한 후 표본의 표준편차를 계산하여 이를 통해 모집단의 편차를 추정하려는 것인데, 표본의 표준편차는 모집단의 표준편차보다 항상 작습니다.

따라서 표본의 분산에 수정을 해야 모집단 분산에 근접한 값이 나오는데, 수정 지수로 이용되는 것이 베셀(Bessel's) 보정 지수 n / (n-1)입니다. 결국 표본의 분산을 계산할 때 분모는 n-1이 됩니다.

자유도(degree of freedom)를 고려해야 하므로 n-1

자유도는 '표본 집단 내에서 모집단에 대한 정보를 주는 독립적인 자료의 수'입니다. 예를 들어 3명의 가족 몸무게 평균이 60kg인 경우, 2명의 몸무게를 알면 나머지 1명의 몸무게는 자동으로 정해집니다. 이 경우 자유도는 3-1인 2가 됩니다.

표본의 분산을 계산할 때 우리는 표본 평균을 사용하는데, 이 표본 평균이 모집단 평균의 추정치 역할을 하면서 하나의 제약 조건이 되어 자유도가 n-1이 되는 것입니다.

자주 묻는 질문 (FAQ)

Q: 입력 데이터에 숫자 외의 문자가 포함되면 어떻게 되나요?

A: 계산기는 입력된 텍스트에서 숫자 형태의 값들만 추출하여 계산합니다. 콤마, 공백, 줄바꿈 등으로 구분된 숫자들을 정확하게 인식합니다.

Q: 데이터가 1개뿐일 때 표본 표준편차는 어떻게 계산되나요?

A: 표본 분산과 표준편차는 분모가 n-1이므로, 데이터가 1개인 경우 계산할 수 없습니다 (0으로 나누기 오류). 이 경우 표본 관련 값은 '-' 또는 '계산 불가'로 표시됩니다.