우리의 프로토콜은 오픈 소스 소프트웨어가 어떻게 모든 연구자가 계산 구조 라이브러리를 만들고 큐레이션 할 수 있는지 보여줍니다. 이 프로토콜의 매력은 개방성과 유연성에서 비롯됩니다. 누구나 그것을 사용하고 특정 연구 질문에 맞게 수정할 수 있습니다.
이 프로토콜의 버전은 약물 발견 응용 프로그램에 적용 할 수 있으며, 실리코 스크리닝을위한 특정 구조 라이브러리를 신속하게 만들 수 있습니다. 프로토콜은 단계별로 설명되지만 사용자가 Java 또는 기본 코딩에 익숙하지 않은 경우 프로토콜을 구현하기 전에 먼저 프로토콜을 살펴볼 수 있습니다. 먼저 프로젝트에 대한 새 디렉터리를 만듭니다.
쉽게 액세스 할 수 있도록이 디렉토리에 모든 파일과 실행 파일을 배치하십시오. Maygen의 최신 버전을 jar 파일과 패키지 관리 소프트웨어 Anaconda로 다운로드하십시오. Windows 시스템에서 Anaconda 프롬프트를 검색하고 결과 바로 가기를 클릭하여 실행하십시오.
아나콘다에서 RDKit 환경을 만들고 RDKit을 환경에 다운로드하려면 화면에 표시된 명령을 입력하고 Enter 키를 눌러 실행하고 설치 중에 발생하는 모든 질문에 예라고 대답합니다. 그런 다음 Jupyter 노트북과 기판 패턴의 텍스트 파일을 보충 파일에서 한 개에서 다섯 개까지 다운로드하십시오. 명령 프롬프트에서 maygen이 포함된 디렉토리로 이동합니다.
jar 실행 파일. 관심있는 각 화학 공식에 대해 화면에 표시된 명령을 사용하여 Maygen을 실행하십시오. 수식이 이산 수식 대신 퍼지 수식인 경우 하이픈 F 플래그를 하이픈 퍼지 플래그로 바꾸고 모든 요소 간격을 대괄호로 묶습니다.
아나콘다 프롬프트에서 Jupyter 노트북이 들어 있는 폴더로 이동하여 RDKit 환경을 활성화합니다. 다운로드한 노트북에는 RDKit이 필요합니다. 따라서이 프로토콜에서 나중에 사용하려면 RDKit 환경에서 열어야합니다.
그런 다음 하위 구조 필터링을 위해 Jupyter 노트북을 열고 공백이 포함 된 경우 파일 이름을 따옴표로 닫습니다. 노트북 시작 부분에 있는 지정된 셀에 입력 sdf 파일의 전체 파일 경로를 입력합니다. 원하는 sdf 출력 파일의 전체 파일 경로와 문자열로 잘못된 목록 파일의 파일 경로입니다.
필터링된 라이브러리의 일부 하위 구조 또는 좋은 목록을 유지해야 하는 경우 해당 하위 구조에 대한 SMARTS 패턴의 txt 파일을 만들고 노트북 시작 부분에 지정된 줄에 양호한 목록 파일 경로를 배치합니다. 상단의 메뉴에서 커널을 선택하고 다시 시작하고 모두 실행하여 노트북 커널을 다시 시작하고 모든 셀을 실행하십시오. 원하는 이름의 sdf 파일이 지정된 출력 폴더에 만들어집니다.
Maygen에서 생성된 각 구조 파일에 대해 이 단계를 반복합니다. 의사 원자 교체의 경우 아나콘다 프롬프트를 열고 Jupyter 노트북이 포함 된 폴더로 이동하여 RDKit 환경을 활성화하십시오. 그런 다음 의사 원자 교체를 위해 Jupyter 노트북을 엽니 다.
노트북 시작 부분의 지정된 셀에 입력 sdf 파일의 전체 파일 경로와 원하는 sdf 출력 파일의 전체 파일 경로를 문자열로 입력합니다. 노트북 커널을 다시 시작하고 모든 셀을 실행하여 지정된 출력 폴더에 원하는 이름의 sdf 파일을 가져옵니다. 마찬가지로, 아미노산 N 및 C 테르미니 캡핑에 대한 아나콘다 프롬프트를 엽니 다.
Jupyter 노트북이 포함된 폴더로 이동하여 RDKit 환경을 활성화합니다. 아미노산 캡핑을 위해 Jupyter 노트북을 엽니다. 노트북 시작 부분의 지정된 셀에 입력 sdf 파일의 전체 파일 경로와 원하는 sdf 출력 파일의 전체 파일 경로를 문자열로 입력합니다.
노트북 커널을 다시 시작하고 모든 셀을 실행하여 지정된 출력 폴더에 원하는 이름의 sdf 파일을 가져옵니다. 설명자 생성의 경우 설명자를 계산할 모든 sdf 파일을 단일 폴더에 배치합니다. 그런 다음 PaDEL 설명자를 다운로드하고 압축을 풀고 해당 폴더에 압축을 풉니 다.
명령 프롬프트를 열고 PaDEL 설명자 jar 파일이 들어 있는 폴더로 이동한 다음 수집된 sdf 파일에 대해 PaDEL 설명자를 실행합니다. 여과된 모든 아미노산 라이브러리의 화학적 공간이 여기에 표시됩니다. 검정 마커는 황이 없는 라이브러리의 아미노산을 나타내고 노란색 마커는 황이 풍부한 라이브러리의 아미노산을 나타냅니다.
여기서 VAIL과 VAIL_S 라이브러리는 원으로 표시됩니다. DEST 및 DEST_S 라이브러리는 사각형으로 표시됩니다. 프롤린과 Pro S 라이브러리는 삼각형으로 표시되며 별은 코딩 된 아미노산을 나타냅니다.
가능한 log P 값의 범위는 친수성 측쇄가 명시적으로 결여된 라이브러리 내에서도 분자 부피에 따라 증가한다. 탄화수소 측쇄를 갖는 코딩된 아미노산은 각각의 라이브러리로부터 대등한 부피의 대부분의 다른 아미노산보다 더 소수성이다. 이것은 또한 메티오닌이 비슷한 부피를 가진 VAILS 라이브러리의 다른 구성원과 비교하여 주장하는 경우이기도합니다.
히드록실 측쇄를 가진 코딩된 아미노산은 아스파르트산이 세 개의 아닌보다 약간 더 큰 DEST 라이브러리의 가장 작은 구성원 중 하나였다. 표현 된 이미지는 유황과 유황이없는 도서관의 평균 반 데르 발(Van der Waal) 부피를 보여줍니다. 황 치환은 모든 라이브러리에서 분자 부피의 약간의 증가를 가져왔다.
황이 있거나없는 라이브러리의 평균 분할 계수 값이 여기에 나와 있습니다. log P에 대한 황 치환의 효과는 부피에 대한 것만큼 균질하지 않다. 대표적인 이미지는 메이겐 구조 생성에 대한 삼가 유사원자의 효과를 보여준다.
구조 생성에 의사 원자를 사용하면 구조물을 생성하는 데 필요한 총 시간 동안 약 세 배의 크기로 생성 된 구조물의 수가 한 배에서 두 배나 줄어 들었습니다. 이 프로토콜에 따라 연구자의 요구에 따라 향후 추가 기능을 통합 할 수 있습니다. 예를 들어, 후처리 단계를 피하기 위해 하위 구조 필터를 Maygen에 통합 할 수 있습니다.
라이브러리 생성, 큐레이션 및 수정. 이 일반적인 과정은 일부 코딩 지식으로 다른 분자 구조와 변형을 수용 할 수 있으며, 이를 통해 연구원은 알파 아미노산 이상의 계산 라이브러리를 탐색 할 수 있습니다. 이 프로토콜은 연구자가 생명 분야의 기원에서 계산 작업을 향상시키는 데 도움이됩니다.
오픈 소스 툴킷은 이러한 노력에 크게 도움이 될 것입니다.