일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 서열정렬
- MERS
- COVID
- 알파폴드
- BLaST
- 시그모이드
- SVM
- Java
- 오류역전파
- 딥러닝
- 캐글
- 생명정보학
- 바이오인포매틱스
- bioinformatics
- Kaggle
- 인공지능
- AP Computer Science A
- CNN
- 파이썬
- 인공지능 수학
- 바이오파이썬
- 자바
- 행렬
- 이항분포
- ncbi
- 생물정보학
- 블록체인
- 결정트리
- 인공신경망
- AP
- Today
- Total
데이터 과학
RDkit 사용법 본문
RDkit은 파이썬 라이브러리를 활용하는 분자식 표현 프로그램입니다.
오픈소스이며 가장 많이 사용되고 있는 프로그램이며, 코랩에서 사용할 수 있기에 라이브러리만 설치하면 누구나 쉽게 사용할 수 있습니다.
RDKit
rdkit.org
파이썬 라이브러리를 사용하면 간단하게 사용할 수 있습니다. 파일형식은 SMILES를 사용하기에 SMILES 형식에 대한 이해를 해야 합니다.
코랩에서 다음과 같이 실행하면 됩니다.


SMILES 형식을 입력하면 그에 대한 분자식이 나타납니다.
mol_with_atom_index(mol)


옵션에 따라 나오는 결과가 다릅니다.
Highlight a Substructure in a Molecule

SMILES 형식에서 위치를 찾아 substructure 변수에 하이라이트 영역을 만들어 주면 그 영역에 대한 번호를 지정해서 색을 칠하게 해 줍니다.

하이라이트 위치를 바꿔 줄 수도 있습니다.
Highlight Entire Molecule

Neutralizing Molecules
이 예제는 배열을 활용한 예제로 여러가지 분자식을 표현할 수 있습니다.
아래 링크에 원소스가 있습니다.
https://baoilleach.blogspot.com/2019/12/no-charge-simple-approach-to.html

SMILES 표기를 리스트에 입력해서 표현하는 결과입니다.
def neutralize_atoms(mol):
Draw.MolsToGridImage(mols,molsPerRow=3, subImgSize=(200,200))

rdMolStandardize.Uncharger에 대한 결과를 비교해 봅시다.

지금까지 작성한 예제입니다.
위 예제는 cookbook에 있는 예제들입니다. 한번씩 읽어보면서 실습하고 SMILES 형식을 이용해서 구조식을 만들어 보는 것이 화학식을 학습하는데 많은 도움이 될 것입니다.
RDkit cookbook 입니다.
https://www.rdkit.org/docs/Cookbook.html
RDKit Cookbook — The RDKit 2023.09.1 documentation
If you have suggestions for how to improve the Cookbook and/or examples you would like included, please contribute directly in the source document (the .rst file). Alternatively, you can also send Cookbook revisions and addition requests to the mailing lis
www.rdkit.org
https://www.rdkit.org/docs/GettingStartedInPython.html
Getting Started with the RDKit in Python — The RDKit 2023.09.1 documentation
Acceptor [$([O,S;H1;v2;!$(*-*=[O,N,P,S])]),$([O,S;H0;v2]),$([O,S;-]),$([N;v3;!$(N-*=[O,N,P,S])]),n&H0&+0,$([o,s;+0;!$([o,s]:n);!$([o,s]:c:n)])] Basic [#7;+,$([N;H2&+0][$([C,a]);!$([C,a](=O))]),$([N;H1&+0]([$([C,a]);!$([C,a](=O))])[$([C,a]);!$([C,a](=O))]),
www.rdkit.org
https://molecularmodelingbasics.blogspot.com/2016/05/a-brief-introduction-to-smiles-and-inchi.html
A brief introduction to SMILES and InChI
SMILES and InChI are two notations that that can be used to compactly describe molecules. As molecules get complicated SMILES and InC...
molecularmodelingbasics.blogspot.com
https://buildmedia.readthedocs.org/media/pdf/rdkit/release_2017_03_1/rdkit.pdf
'생명정보학 & 화학정보학 > RDkit와 SMILES 형식' 카테고리의 다른 글
SMILES 데이터 만드는 방법 (0) | 2024.01.14 |
---|---|
Colab 데이터 open 방법 (0) | 2024.01.11 |
Pubchem과 Chembl 사용법 (4) | 2023.10.14 |
SMILES 형식 (0) | 2023.10.14 |