일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 인공지능 수학
- 결정트리
- 인공지능
- AP
- ncbi
- 블록체인
- 서열정렬
- bioinformatics
- 행렬
- 생명정보학
- 바이오파이썬
- SVM
- 자바
- 알파폴드
- 파이썬
- CNN
- BLaST
- Kaggle
- COVID
- MERS
- 이항분포
- Java
- 인공신경망
- 생물정보학
- 딥러닝
- 시그모이드
- AP Computer Science A
- 바이오인포매틱스
- 오류역전파
- 캐글
- Today
- Total
목록AP/AP Statistics (15)
데이터 과학

이항분포는 discrete 분포에서 이항확률(Binomial)을 계산하는 방법입니다.N값이 커질 경우 이항확률로 계산하는 방법보다 정규분포 방법으로 계산하는 방법이 훨씬 더 쉬울 수 있습니다. 단지, 이항분포는 계산되는 이항식으로 계산하기에 수치적으로 분석할 수 있으나, 정규분포의 경우는 확률분포로 표현해서 면적을 가지고 확률값을 계산하기 때문에 연속 확률 구간에 대해 명시적으로 접근해야 합니다. 이항분포는 수치적인 접근으로 정규분포는 구간에 따른 면적으로 계산하는 방법으로 차이가 있습니다. 하나의 예제를 통해 이를 설명해 보겠습니다. 예제1) 어떤 공장에서 나오는 자동차 중 15%가 결함이 있다고 합니다.자동차 50대가 생산될 때, 6대의 자동차에 결함이 있을 확률은 얼마인지를 알아봅시다. ..
간단히 정의하면,모수(parameter)는 모집단의 대표값을 나타내는 것이고, 통계량 (statistic)은 표본의 대표값들입니다. 일반적으로 모집단과 표본을 기준으로 데이터 분석을 나눠서 설명하는데 여기서 나오는 평균과 표준편차를 구분할 때 모수와 통계량으로 구분합니다. 사용하는 공식과 용어도 다르게 사용합니다. 모집단에서 평균은 μ 기호를 사용합니다. 부를때 뮤(Mu)라고 합니다. 표준편차는 시그마로 표기합니다.차후에 모평균, 모분산이라는 용어를 사용합니다. 표본에서는 통계량이라고들 부르는데 이때 평균은 (xˉ)엑스 바라고 부릅니다. 차후에 모집단을 추정할 때 평균값으로 모수를 추정하기에 공식에서 차이는 없습니다. 단지, 표준편차에서는 기호를 s로 사용하는데 이때 자유도를 활용합니다...
우리가 분석하는 일반적인 데이터는 기본적으로 모수적 방법을 기반으로 하고 있습니다. AP stat.도 모수 통계학이 대부분이며 이 모수를 통해 데이터 분석하는 범위가 대부분입니다.그렇다면 모수와 비모수 통계학의 차이점은 무엇이며 어떤 방법으로 접근해야 하는지 살펴 봅시다. 모수적 방법 (Parametric Methods)이라고 하는 것은 분포가 모수(parameter)를 가지고 있기에 이를 바탕으로 추정할 수 있습니다. 예를 들면 정규분포의 경우에 평균과 표준편차를 기준으로 데이터 분포를 나타내고 있습니다. 장점은 대표값들인 평균과 표준편차를 기반으로 데이터를 분석하기에 패턴이 있으며 수학적 모델링이 가능합니다.AP stat. 내용 대부분이 모수적 방법으로 해결이 됩니다. t-분포와 ANOVA 분산..
정성적 데이터 (Qualitative Data)와 정량적 데이터 (Quantitative Data) 에 대한 설명을 하면 다음과 같습니다. 정성적 데이터 (Qualitative Data) 서술적인 의견이나 인터뷰, 주관적인 내용이 있는 비정량적 데이터를 정성적 데이터라고 합니다.서술된 데이터를 정량화 하는 방법이 필요한데 이에 대한 방법론이 여러가지 방향으로 연구되고 있습니다. 정량적 데이터 (Quantitative Data) 수치적이고 측정 가능한 데이터로 숫자로 표현이 되어 있는 데이터입니다. 일반적으로 우리가 데이터 분석을 할때 정량적 데이터를 사용합니다.셀 수 있는 데이터, 셀 수 없을 정도로 많은 데이터로 나뉩니다.셀 수 있는 데이터는 이산적(binomial) 데이터가 되고, 셀 수 없을 ..