데이터 과학

기술 통계학과 추론 통계학 본문

AP/AP Statistics

기술 통계학과 추론 통계학

티에스윤 2025. 1. 12. 18:54

기술(Descriptive)통계학 추론(Inferential)통계학에 대한 개념을 정의해 보면 다음과 같습니다. 

 

 

기술통계학

기술통계학은 데이터를 요약하고 그 특성을 명확히 표현하여 쉽게 이해할 수 있도록 하는 분야입니다.

주로 평균, 중앙값, 최빈값 등 대표값을 통해 데이터의 중심 경향성을 파악하고, 분산, 표준편차, 범위와 같은 산포도를 통해 데이터의 흩어진 정도를 측정합니다. 

데이터의 분포를 시각화하여 대칭성, 왜도, 첨도 등을 분석하고, 히스토그램, 상자 그림, 산점도와 같은 시각적 도구를 활용해 데이터를 효과적으로 전달합니다.

기술통계학은 데이터를 설명하고 정리하는 데 초점이 맞춰져 있으며, 데이터를 기반으로 결론을 도출하거나 예측하지는 않습니다. 도표를 보고 해석하는 분야이며 통계학을 공부 할 때 데이터에 대한 분석을 할때 사용합니다. 

 

 

추론통계학

 

추론통계학은 표본 데이터를 기반으로 모집단에 대한 결론을 도출하거나 미래를 예측하는데 중점을 둡니다.

추론통계학에서는 가설 검정을 통해 모집단에 대한 가설을 설정하고 이를 검증하며, 점추정과 구간추정을 통해 모집단의 평균이나 비율과 같은 모수를 추정합니다.

상관 분석과 회귀 분석을 통해 변수 간의 관계를 탐구하고 예측 모델을 구축하며, 신뢰 구간과 오차 분석을 통해 표본 데이터의 신뢰성과 불확실성을 평가합니다.

통계학을 추정의 학문이라고 할때 추론(추정)통계학을 통한 모수를 예측하는 분야라고 할 수 있겠죠.

 

 

기술통계학과 추론통계학의 주요 차이는 데이터 활용의 목적과 범위에서 드러납니다. 기술통계학이 데이터를 요약하고 구조를 파악하는데 중점을 두는 반면, 추론통계학은 표본 데이터를 통해 모집단에 대한 결론을 일반화하고 미래를 예측하는 데 초점이 맞춰져 있습니다. 따라서 기술통계학은 데이터를 이해하는 첫 단계로 활용되며, 추론통계학은 이를 바탕으로 심층적인 분석과 의사결정을 가능하게 합니다.

 
 
 
다시한번 간단히 설명해 보면

 

주어진 데이터를 보면 명확한 패턴이 보이지 않을 때가 많습니다. 어떤 값은 더 자주 나타나고, 일부 극단적인 값이 눈에 띌 수도 있으며, 값들의 범위가 대략적으로 파악될 수 있습니다.

데이터를 요약하고 설명하는 과정은 평균이나 중앙값 같은 대표값, 데이터의 산포도, 값의 상대적 위치, 분포의 형태 등을 다루며, 이를 기술통계학이라고 합니다. 기술통계학은 데이터를 이해하고 해석하기 쉽도록 정리하는 데 중점을 둡니다.

추론통계학은 데이터를 기반으로 모집단에 대한 결론을 도출하거나 미래를 예측하는 데 초점을 둡니다. 이는 제한된 표본 데이터를 사용하여 가설 검정, 신뢰 구간 계산, 상관관계 분석 등을 통해 통계적 결론을 내리는 과정을 포함합니다. 기술통계학은 데이터를 요약하여 전반적인 특징을 파악하는 데 유용하고, 추론통계학은 그 데이터를 바탕으로 더 깊이 있는 분석과 의사결정을 지원합니다.

 

 

 

 

'AP > AP Statistics' 카테고리의 다른 글

모수와 비모수  (0) 2025.01.12
정성적 데이터와 정량적 데이터  (0) 2025.01.12
신뢰구간 문제 풀이  (0) 2023.04.25
이항분포  (0) 2023.04.16
자유도  (0) 2023.03.31