Sample contamination ์ด๋ NGS ์คํํ๋ ์ฌ๋์ด๋ผ๋ฉด ๋๊ตฌ๋ ํ๋ฒ์ฏค ์๊ฐํด๋ณผ๋ฒํ ์ด์์ด๋ค.
์คํํ๋ค๊ฐ ์์ well์ contam ๋๊ธฐ๋ ๋งค์ฐ ์ฝ์ง๋ง, ์ด๋ค ์ํ์ ์ํด contam์ด ๋์๋์ง ์์๋ด๊ธฐ๋ ์ด๋ ต๋ค.
์ด๋ฌํ contamination issue๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ช๊ฐ์ง tool์ ์ฐพ์๋ณธ ๊ฒฐ๊ณผ ArtDeCo๋ผ๋ tool์ ๋ฐ๊ฒฌํ์๋ค.
1. ArtDeCo ๋?
NGS๋ฅผ ์ด์ฉํ DNA sample ์ฌ์ด์ cross-contamination์ ์์๋ผ ์ ์๋๋ก ๊ฐ๋ฐํ tool ์ด๋ค.
์๋ ๋ ผ๋ฌธ์ ๋ณด๋ฉด batch ๋ด ์ํ๋ค์๊ฒ์ ์ค๋ณต๋๋ SNV์ AR(Alleic ratio) ํ์ธํ์ฌ ์ํ๋ค์ Contamination์ ํ์ธํ๋ค.
https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-020-03551-0
ARTDeco: automatic readthrough transcription detection - BMC Bioinformatics
Background Mounting evidence suggests several diseases and biological processes target transcription termination to misregulate gene expression. Disruption of transcription termination leads to readthrough transcription past the 3′ end of genes, which ca
bmcbioinformatics.biomedcentral.com
์๊ณ ๋ฆฌ์ฆ์ ๋ํด ์ข ๋ ์์ธํ ์ค๋ช ํ์๋ฉด WCS ์ percentage of contaminaiton์ ํตํด contamiantion ์ ์ฐพ๋๋ค.
2. Tool ์ฌ์ฉ๋ฒ
ArtDeCo๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด์๋ ๋ช๊ฐ์ง input์ด ํ์ํ๋ค.
ํฌ๊ฒ 2๊ฐ์ง ํ์ผ์ด ํ์ํ๋ฐ, 1. SNP ์ ๋ณด๊ฐ ์๋ ํ์ผ, 2.coverage input ์ด๋ ๊ฒ ํ์ํ๋ค.
๊ทธ๋ฆฌ๊ณ ๋ง์ง๋ง์ output ํ์ผ ๊ฒฝ๋ก๋ ์จ์ฃผ๋ฉด ์ข๋ค.
1.SNP ์ ๋ณด ํ์ผ
SNP ์ ๋ณดํ์ผ์ 1000Genome, KRGDB์ ๊ฐ์ด reference๋ก ์ฌ์ฉํ ์ ์๋ SNP reference ํ์ผ์ด ํ์ํ๋ค.
๋ ผ๋ฌธ์์๋ 1000Genome database๋ฅผ ์ฌ์ฉํ์๋ค.
2.coverage input
coverage inputํ์ผ์ bamํ์ผ์ ์ด์ฉํ์ฌ depth ๋ฅผ ๊ณ์ฐํด์ ๊ฐ base์ coverage๋ฅผ ๋ง๋ค์ด์ค์ผํ๋ค.
์ด๋ GATK์ depth of coverage๋ฅผ ์ฌ์ฉํ์๋ค.
์์ ํ์ผ๋ค์ด ์ค๋น๋์์ผ๋ฉด ์๋์ ๊ฐ์ Command๋ก ArtDeCo๋ฅผ ์คํํ๋ฉด ๋๋ค.