| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- BLaST
- MERS
- AP
- 생물정보학
- 시그모이드
- SVM
- bioinformatics
- HMM
- 바이오인포매틱스
- 파이썬
- Java
- 캐글
- 인공지능
- 생명정보학
- 딥러닝
- 자바
- 블록체인
- 이항분포
- 결정트리
- ncbi
- 인공신경망
- 인공지능 수학
- 바이오파이썬
- Kaggle
- 오류역전파
- 서열정렬
- AP Computer Science A
- COVID
- CNN
- RNN
- Today
- Total
목록sars (3)
데이터 과학
NCBI에서 서열을 찾아서 블라스트에서 분석하는 방법에 대해 알아보겠습니다. 서열 검색방법은 NCBI를 접속 한 이후 학명(scientific name)으로 찾아야 합니다. 많이 쓰는 단어로 검색을 해도 되는데 학명으로 찾으면 좀 더 정확히 찾을 수 있습니다. 그리고, 비교 할 범위나 부위 같은 대상이 명확해야 서로 정확한 위치의 서열비교가 가능합니다. 코로나의 ORF와 메르스의 spike 서열을 비교하면 정확한 비교가 아니겠죠. NCBI 사이트에 접속합시다. https://www.ncbi.nlm.nih.gov/ National Center for Biotechnology Information UNITE A new NIH initiative to end structural racism and achiev..
바이오파이썬에서 계통수를 그리는 방법을 알아보겠습니다. 우선, 5개정도의 핵산 서열을 찾아서 실험을 위한 표본으로 만들어 놓습니다. MEGA-X에서 서열분석을 통해 정렬을 해 놓으면 좀 편합니다. sample0822.fasta는 정렬하기전에 NCBI에서 찾은 파일입니다. 5개의 spike 핵산을 다음과 같습니다. >AY463060.1 SARS coronavirus ShanghaiQXC2 >KJ650296.1 Middle East respiratory syndrome coronavirus isolate KFU-HKU 19Dam >NC_004718.3 SARS coronavirus Tor2 >MN996531.1 Severe acute respiratory syndrome coronavirus 2 isolat..
Kaggle에서 예제로 사용되는 MN908947.fasta는 2020년 코로나 바이러스 버전으로 변이가 일어난 2021년 데이터와는 다릅니다. 그래서 현재 변이를 주도하는 코로나 핵산서열을 가지고 간단히 실험을 진행해 보겠습니다. https://www.ncbi.nlm.nih.gov/nuccore/MZ021506.1 Severe acute respiratory syndrome coronavirus 2 isolate SARS-CoV-2/hum - Nucleotide - NCBI no features Feature First Previous Next Last Details www.ncbi.nlm.nih.gov 위 파일을 다운로드 받아 주피터 노트북에 업로드 해 봅시다. 이제는 SeqRecord 함수를 이용해서..