Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 행렬
- 딥러닝
- 파이썬
- 캐글
- SVM
- 자바
- BLaST
- 생명정보학
- bioinformatics
- 결정트리
- COVID
- ncbi
- 바이오인포매틱스
- 알파폴드
- Kaggle
- 오류역전파
- 인공지능 수학
- 바이오파이썬
- Java
- AP Computer Science A
- 블록체인
- CNN
- AP
- MERS
- 서열정렬
- 인공지능
- 시그모이드
- 생물정보학
- 이항분포
- 인공신경망
Archives
- Today
- Total
데이터 과학
블라스트와 MEGA-X 염기서열 분석 비교 관련 본문
블라스트에서 나오는 염기서열 비교결과와 Clustal-W에서 나오는 염기서열 비교 결과는 다른데 그 이유는 알고리즘이 다르기 때문이다. 니들만 브뉘쉬 알고리즘과 스미스 워터만 알고리즘의 차이라고 할까.
실험을 할 때 어느 것을 선택해야 하는지는 본인이 결정하면 된다.
코로나 바이러스를 비교한 블라스트 결과
코로나 바이러스를 비교한 Mega-X 에서 CLustal_W 결과
이후 실험할 때 window (절삭)에 대한 부분이 있는데 서열비교할 때 너무 긴 서열은 비교하기가 쉽지 않다. 윈도로 잘라서 비교 분석하는게 좋은 방법인데, 여러번 비교해야 편향성에서 자유롭다.
어떻게 윈도로 만들어 내는지도 실험자의 기준이 있어야 한다. 9window로 할지 아니면 17window로 할지 이렇게 잘라낸 파일을 결정트리 형식으로 만들어서 학습시킨 후에 관련된 규칙을 찾아낸다.
결정트리에서 실험 데이터는 다음과 같이 구성한 후 결정트리에서 규칙을 찾아내면 된다.
9window.data
0.07MB
9window.names
0.00MB
위와 같은 실험방법도 괜찮은 방법으로 최근에 게재된 페이퍼를 링크를 걸어 본다.
실험은 위 내용과는 다른 내용으로 진행했다.
https://link.springer.com/article/10.1186/s13104-021-05561-4
'생명정보학 & 화학정보학 > NCBI와 블라스트' 카테고리의 다른 글
바이오인포매틱스 개요 (0) | 2022.08.29 |
---|---|
H1N1 시리즈 분석 (0) | 2022.08.01 |
PAM과 BLOSUM (0) | 2021.11.01 |
서열분석 - Needleman Wunsch algorithm (0) | 2021.09.27 |
COVID19 는 어디에서 왔을까? (feat. NCBI와 블라스트 ) (0) | 2021.05.23 |