일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 자바
- 바이오파이썬
- 인공지능 수학
- 생명정보학
- CNN
- 시그모이드
- MERS
- 행렬
- 결정트리
- 블록체인
- 인공신경망
- Java
- COVID
- BLaST
- ncbi
- 바이오인포매틱스
- 오류역전파
- SVM
- Kaggle
- 인공지능
- 생물정보학
- AP Computer Science A
- 파이썬
- 캐글
- 서열정렬
- bioinformatics
- 이항분포
- AP
- 딥러닝
- 알파폴드
- Today
- Total
목록바이오파이썬 (8)
데이터 과학

Kaggle에서도 바이오파이썬에 대해 소개를 하고 있습니다.하지만, 아직은 바이오인포매틱스 관련 콘텐츠는 올라오고 있지는 않습니다. 바이오인포매틱스 커뮤니티 만들어 달라고 요청하는 분이 계시긴 합니다. 조만간 만들어지지 않을까 합니다. 아래 예제가 바이오파이썬에 대해 정리해 놓은 예제입니다. https://www.kaggle.com/code/shtrausslearning/biopython-bioinformatics-basics/notebook Biopython | Bioinformatics BasicsExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.co..
바이오파이썬 튜토리얼 6장 내용입니다. from Bio.Seq import Seq from Bio.SeqRecord import SeqRecord from Bio.Align import MultipleSeqAlignment alignment = MultipleSeqAlignment( [ SeqRecord(Seq("ACTCCTA"), id='seq1'), SeqRecord(Seq("AAT-CTA"), id='seq2'), SeqRecord(Seq("CCTACT-"), id='seq3'), SeqRecord(Seq("TCTCCTC"), id='seq4'), ] ) print(alignment) Alignment with 4 rows and 7 columns ACTCCTA seq1 AAT-CTA seq2 CC..

서열정렬 프로그램중 많이 알려진 프로그램이 BLAST가 있으며, HMMER 정도가 있습니다. HMMER은 은닉마르코프 모델 알고리즘을 사용하고 있고, 리눅스 기반이나 윈도우에서 콘솔에서 동작이 되기 때문에 처음 바이오인포매틱스로 서열정렬을 하는 입장에서는 접근이 편하지는 않습니다. 여기서는 바이오 파이썬에서 Bio.SearchIO 를 활용한 간단한 서열정렬에 대한 명령어를 살펴 보는 내용을 진행해 봅니다. XML 형식으로 만들어진 파일로 분석하겠습니다. 총 50개 데이터이며 id, def, accession 으로 데이터를 간단하게 나타냅니다. HSP 는 hig scoring pair의 약자로 a local alignment with no gaps that achieves one of the highest..
이번 내용은 바이오파이썬으로 단백질 분석하는 내용입니다. 파이썬 도크(https://github.com/kaggle/docker-python)에 대한 소개를 하면서 필요할 때는 numpy와 pandas 라이브러리를 이용해서 분석하는 방법인데 간단하고 COVID-19를 이해 할 수 있는 내용이어서 어떤 방향으로 분석했는지를 살펴보겠습니다. 원본 내용은 Kaggle에 있습니다. 링크는 아래 주소와 같습니다. https://www.kaggle.com/abishpius/covid-19-genome-proteins-analysis-with-biopython COVID-19 Genome: Proteins Analysis with BiopythonExplore and run machine learning code..