Sample contamination ์ด๋ NGS ์คํํ๋ ์ฌ๋์ด๋ผ๋ฉด ๋๊ตฌ๋ ํ๋ฒ์ฏค ์๊ฐํด๋ณผ๋ฒํ ์ด์์ด๋ค.
์คํํ๋ค๊ฐ ์์ well์ contam ๋๊ธฐ๋ ๋งค์ฐ ์ฝ์ง๋ง, ์ด๋ค ์ํ์ ์ํด contam์ด ๋์๋์ง ์์๋ด๊ธฐ๋ ์ด๋ ต๋ค.
์ด๋ฌํ contamination issue๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ช๊ฐ์ง tool์ ์ฐพ์๋ณธ ๊ฒฐ๊ณผ ArtDeCo๋ผ๋ tool์ ๋ฐ๊ฒฌํ์๋ค.
1. ArtDeCo ๋?
NGS๋ฅผ ์ด์ฉํ DNA sample ์ฌ์ด์ cross-contamination์ ์์๋ผ ์ ์๋๋ก ๊ฐ๋ฐํ tool ์ด๋ค.
์๋ ๋ ผ๋ฌธ์ ๋ณด๋ฉด batch ๋ด ์ํ๋ค์๊ฒ์ ์ค๋ณต๋๋ SNV์ AR(Alleic ratio) ํ์ธํ์ฌ ์ํ๋ค์ Contamination์ ํ์ธํ๋ค.
https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-020-03551-0
์๊ณ ๋ฆฌ์ฆ์ ๋ํด ์ข ๋ ์์ธํ ์ค๋ช ํ์๋ฉด WCS ์ percentage of contaminaiton์ ํตํด contamiantion ์ ์ฐพ๋๋ค.
2. Tool ์ฌ์ฉ๋ฒ
ArtDeCo๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด์๋ ๋ช๊ฐ์ง input์ด ํ์ํ๋ค.
ํฌ๊ฒ 2๊ฐ์ง ํ์ผ์ด ํ์ํ๋ฐ, 1. SNP ์ ๋ณด๊ฐ ์๋ ํ์ผ, 2.coverage input ์ด๋ ๊ฒ ํ์ํ๋ค.
๊ทธ๋ฆฌ๊ณ ๋ง์ง๋ง์ output ํ์ผ ๊ฒฝ๋ก๋ ์จ์ฃผ๋ฉด ์ข๋ค.
1.SNP ์ ๋ณด ํ์ผ
SNP ์ ๋ณดํ์ผ์ 1000Genome, KRGDB์ ๊ฐ์ด reference๋ก ์ฌ์ฉํ ์ ์๋ SNP reference ํ์ผ์ด ํ์ํ๋ค.
๋ ผ๋ฌธ์์๋ 1000Genome database๋ฅผ ์ฌ์ฉํ์๋ค.
2.coverage input
coverage inputํ์ผ์ bamํ์ผ์ ์ด์ฉํ์ฌ depth ๋ฅผ ๊ณ์ฐํด์ ๊ฐ base์ coverage๋ฅผ ๋ง๋ค์ด์ค์ผํ๋ค.
์ด๋ GATK์ depth of coverage๋ฅผ ์ฌ์ฉํ์๋ค.
์์ ํ์ผ๋ค์ด ์ค๋น๋์์ผ๋ฉด ์๋์ ๊ฐ์ Command๋ก ArtDeCo๋ฅผ ์คํํ๋ฉด ๋๋ค.