| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 인공지능 수학
- 서열정렬
- 생물정보학
- ncbi
- 인공지능
- MERS
- 생명정보학
- Kaggle
- HMM
- Java
- CNN
- 자바
- 바이오파이썬
- 딥러닝
- 이항분포
- 오류역전파
- COVID
- BLaST
- AP Computer Science A
- 캐글
- 바이오인포매틱스
- 시그모이드
- 인공신경망
- 블록체인
- bioinformatics
- 파이썬
- RNN
- 결정트리
- SVM
- AP
- Today
- Total
목록AP/AP Statistics (15)
데이터 과학
이항분포는 discrete 분포에서 이항확률(Binomial)을 계산하는 방법입니다.N값이 커질 경우 이항확률로 계산하는 방법보다 정규분포 방법으로 계산하는 방법이 훨씬 더 쉬울 수 있습니다. 단지, 이항분포는 계산되는 이항식으로 계산하기에 수치적으로 분석할 수 있으나, 정규분포의 경우는 확률분포로 표현해서 면적을 가지고 확률값을 계산하기 때문에 연속 확률 구간에 대해 명시적으로 접근해야 합니다. 이항분포는 수치적인 접근으로 정규분포는 구간에 따른 면적으로 계산하는 방법으로 차이가 있습니다. 하나의 예제를 통해 이를 설명해 보겠습니다. 예제1) 어떤 공장에서 나오는 자동차 중 15%가 결함이 있다고 합니다.자동차 50대가 생산될 때, 6대의 자동차에 결함이 있을 확률은 얼마인지를 알아봅시다. ..
간단히 정의하면,모수(parameter)는 모집단의 대표값을 나타내는 것이고, 통계량 (statistic)은 표본의 대표값들입니다. 일반적으로 모집단과 표본을 기준으로 데이터 분석을 나눠서 설명하는데 여기서 나오는 평균과 표준편차를 구분할 때 모수와 통계량으로 구분합니다. 사용하는 공식과 용어도 다르게 사용합니다. 모집단에서 평균은 μ 기호를 사용합니다. 부를때 뮤(Mu)라고 합니다. 표준편차는 시그마로 표기합니다.차후에 모평균, 모분산이라는 용어를 사용합니다. 표본에서는 통계량이라고들 부르는데 이때 평균은 (xˉ)엑스 바라고 부릅니다. 차후에 모집단을 추정할 때 평균값으로 모수를 추정하기에 공식에서 차이는 없습니다. 단지, 표준편차에서는 기호를 s로 사용하는데 이때 자유도를 활용합니다...
우리가 분석하는 일반적인 데이터는 기본적으로 모수적 방법을 기반으로 하고 있습니다. AP stat.도 모수 통계학이 대부분이며 이 모수를 통해 데이터 분석하는 범위가 대부분입니다.그렇다면 모수와 비모수 통계학의 차이점은 무엇이며 어떤 방법으로 접근해야 하는지 살펴 봅시다. 모수적 방법 (Parametric Methods)이라고 하는 것은 분포가 모수(parameter)를 가지고 있기에 이를 바탕으로 추정할 수 있습니다. 예를 들면 정규분포의 경우에 평균과 표준편차를 기준으로 데이터 분포를 나타내고 있습니다. 장점은 대표값들인 평균과 표준편차를 기반으로 데이터를 분석하기에 패턴이 있으며 수학적 모델링이 가능합니다.AP stat. 내용 대부분이 모수적 방법으로 해결이 됩니다. t-분포와 ANOVA 분산..
정성적 데이터 (Qualitative Data)와 정량적 데이터 (Quantitative Data) 에 대한 설명을 하면 다음과 같습니다. 정성적 데이터 (Qualitative Data) 서술적인 의견이나 인터뷰, 주관적인 내용이 있는 비정량적 데이터를 정성적 데이터라고 합니다.서술된 데이터를 정량화 하는 방법이 필요한데 이에 대한 방법론이 여러가지 방향으로 연구되고 있습니다. 하나의 예를 들면 생활기록부에 있는 행동발달사항 같은 경우가 정성적 데이터이며 이를 데이터화 시키기는 방법이 있을 수 있습니다. 기록에 대한 내용은 일반화 시켜 데이터를 만들기가 쉽지 않은데 정량화 (Quantification) 하는 연구를 많이 하고 있습니다. 어떤 기준으로 서술식의 문장을 데이터화를 할까요? 그 방법에 대해 ..