전체 글 57

[SQL] Docker 이용하여 postgres 설치하기

Docker hub에 접속(https://hub.docker.com/_/postgres) 다음과 같이 postgres 가 존재한다. 작업 환경은 linux(Ubuntu)이며 가장 최신 postgres를 가져왔다. 1. PostGres docker 가져오기 #명령어 docker pull postgres 위와같이 postgres를 불러왔으면 이미지가 생성이 되었는지 확인한다. #명령어 docker images 2. Postgres 컨테이너 생성하기 docker run -p 5432:5432 -e POSTGRES_PASSWORD="" --name PostgreSQL -d postgres ## 동일한 포트 번호 사용중인 경우 아래와 같은 오류 발생 : 이런 경우, 5432:5432 대신 5433:5432 로 변..

LINUX 2023.07.03

[Error Review] Oops! The 'vep' MultiQC module broke...

명령어: multiqc . 오류 내용: 아래와 같이 vep 관련 오류 발생. output파일이 제대로 생성이 안된다. 구글링 해보니까 다음과같은 해결책이 나와있다. https://github.com/ewels/MultiQC/issues/1446 Error when no variants on VEP stats file · Issue #1446 · ewels/MultiQC Description of bug: MultiQC gives an error when no variants are present in the VEP stats file. MultiQC Error log: ╭────────────────────────────────────────────── github.com 나랑 똑같은 오류를 가진 사람 ..

LINUX 2022.04.26

DNA Polymorphism이란?

DNA Polymorphism이란? DNA poly morphism(유전자 다형성)은 쉽게 말해 개인 간에서 나타나는 DNA의 일반적인 변이. 즉, 개인 간의 유전적 차이(Genetic difference)를 의미한다. 이를 구체적으로 말하면 chromosome의 locus에서 한개 혹은 여러개의 allele이 존재하거나, 또는 다양한 수의 반복적인 nucleotide units를 가지는 것을 의미한다. 이런 다형성은 과거엔 피부색, 머리카락, 대머리 등 외형적으로 나타나는 phenotype에 관심을 갖고 연구하였지만, 지금은 생리적인 특성, 병리학적 특성에 focus를 맞춰서 논의되고 있다. Genomic variations impact meiotic analysis Ji Qi, Yamao Chen, ..

카테고리 없음 2022.01.03

HLA(Human Leukocyte Antigen)란 무엇인가?

인간백혈구항원(HLA)은 주조직 적합성 복합체(Major Histocompatibility Complex, MHC)의 한 부분이다. HLA는 특정 전문화된 단백(항원)으로 신체의 모든 유핵 세포의 표면에 발현되어 있고, 이 단백들의 유전자들이 있다. 모든 사람들의 백혈구(leukocytes)와 다른 유핵세포 표면에 존재하는 HLA 항원의 조합은 유전이다. HLA 검사는 주요 HLA 유전자와 세포 표면에 발현하는 해당 유전자에 대한 항원을 확인한다. 이러한 항원과 MHC 시스템은 면역 시스템의 관리에 중요한 역할을 한다. 그들은 신체의 면역 체계가 어느 세포가 "자기(self)"인지, 어느 것이 "외부" 또는 “비자기(non-self)”인지 구별하는 데 도와준다. "비 자기"로 인식되는 모든 세포는 항체의..

CNVkit을 이용한 CNV 분석:: 중요 command 및 option 정리

저번 포스팅에 이어서 CNVkit 분석에 사용되는 중요 Command 및 option들에 대해 정리해보았다. tool 설치가 아직 되지 않은 분들이 있다면 이전 포스팅을 참고하길 바란다. CNVkit의 전체적인 Workflow CNVkit의 전체적인 Workflow는 다음과 같으며 크게 3단계로 나눌 수 있다. 1. Target bins와 Off-target bins (.bed)를 생성하는 부분 2. normal sample을 이용하여 reference를 생성하는 부분 3. 실제 sample을 분석하여 Copy number를 계산하는 부분 매우 다행히도 우리는 각각의 단계를 실행하기 위해 command를 하나씩 치지 않아도 된다. CNVkit에서 batch라는 명령어를 통하여서 3단계를 한번에 실행 할 ..

CNVkit을 이용한 CNV 분석:: 개념 및 설치방법

유전자복제수변이(Copy Number Variation, CNV) 유전자복제수 변이(CNV)란 유전체에서 관찰되는 구조적 변이(Structural variation, SV) 중 하나이며 reference genome에 비해 복제수의 변화를 보이는 DNA 조각이다. 통상적으로 2n의 형태로 존재하는 일반적인 서열들과는 달리 결실(0n, 1n 상태), 증폭(3n 이상의 상태)되는 등 인간의 표준 참조 게놈 (Reference Genome)와 비교해 반복되는 서열의 숫자의 차이를 보이는 1kb 이상의 DNA 조각을 주로 의미하며, 평균 크기는 29kb에서 523kb 정도로 예상된다고한다. CNV에서 Copy(복제수)란 염기서열의 반복횟수를 의미한다. CNVkit CNVkit 이란? CNVkit이란 2016년에..

Variant caller의 알고리즘

1. GATK HaplotypeCaller Haplotype은 다음과 같이 4가지 주요 과정을 통하여 variant를 찾아낸다. 1. Define active regions 2. Determine haplotypes by re-assembly of the active region 3. Determine likelihoods of the haplotypes given the read data 4. Assign sample genotypes 1. Define active regions 변이가 나올 것이라고 예측되는 active region을 정의한다. reference와 다른 allele들이 반복적으로 나오는 곳을 특정함. (count mismatches, indels and soft clips) 2. De..

카테고리 없음 2021.11.18

NGS 개념

SAV사용법 시퀀싱 LOW 파일이 존재하면 SAV 프로그램을 활용한다. Yield : 생산된 염기서열(base)의 수. 몇십기가라고 하면 그게 파일 크기가 아니라 염기서열 개수이다. error rate: percentage of bases called incorrectly. PhiX를 같이 섞어서 넣어주어야한다. Q30: 99.9%의 정확도이다. 염기서열 1000개중 1개가 정확한 것이다. Density: 프롤우셀에서 cluster가 제대로 형성되는지. 너무 빽빽하면 사진찍을 때 염기를 확인하기 어렵다. 적당히 깔아줘야한다. 너무 적게 깔면 Sequencing yield가 너무 적게 나온다. Cluster PF: 일루미나 장비에서 제대로 필터를 통과하였는지.(Passing Fileter) Raw Fast..

카테고리 없음 2021.11.17