์ค๋์ NGS ๋ถ์๊ณผ ๊ด๋ จํ์ฌ ์ธ์ฝ๋ ํ์ด๋ผ๋ ์๋ฌผ์ ๋ณด ๋ถ์ ์๋ฃจ์ ๋จ๊ธฐ ์๋ ์๋น์ค์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค. ํ์์ NGS ๋ฐ์ดํฐ๋ฅผ ํตํด ์ฐ๊ตฌํ๊ฑฐ๋ ๋ถ์์ ์งํํ๋ ๋ถ๋ค๊ป ์ ์ฉํ ์๋น์ค์ผ ๊ฒ ๊ฐ์ ์๊ฐํ๊ฒ ๋์์ต๋๋ค.
1. ์ธ์ฝ๋ ํ์ด๋?
ใ์ธ์ค๋ฆฌ์ฝ์ ์์๋ ์ฐ๊ตฌ์๋ค์ด ์๋ฌผ์ ๋ณด๋ฅผ ๋์ฑ ํธ๋ฆฌํ๊ฒ ๋ถ์ํ ์ ์๋๋ก ๋์์ฃผ๋ ์๋ฌผ์ ๋ณด ๋ถ์ ์๋ฃจ์ (IPA with Analysis Match, CLC Genomics Workbench ๋ฑ)์ ๊ณต๊ธํ๊ณ ์์ต๋๋ค.
์ธ์ฝ๋ ํ์ ์๋ฌผ์ ๋ณด ๋ถ์ ์๋ฃจ์ ์ ์ํ๋ ๋งํผ ์ ์ฐํ๊ฒ ๋์ฌํ ์ ์๋ ์๋น์ค๋ก ์ง์ ์ฝ๋ฉํ์ง ๋ชปํ๋๋ผ๋ GUI ํ๊ฒฝ์์ ๊ฐํธํ๊ฒ ์ฌ์ฉํ ์ ์๋ค๋ ๊ฒ ์ ๋ง ํฐ ์ฅ์ ์ ๋๋ค.
2. ์ธ์ฝ๋ ํ์ ์ด์ฉํ RNA seq ๋ถ์ ๋ฐ ๊ฒฐ๊ณผ Review
์ธ์ฝ๋ ํ์ ์ด์ฉํ์ฌ ๋ถ์ํ ๋ฐ์ดํฐ๋ SRA์ ๋ฑ์ฌ๋ RNA Seq ๋ฐ์ดํฐ์ ๋๋ค. Ovarian cancer tumor ๋ฐ์ดํฐ๋ก Fastq ๋ฐ์ดํฐ๋ก ๋ค์ด๋ก๋ ๋ฐ์์ ์ด๋ฒ ๋ถ์์ ์ฌ์ฉํ์ต๋๋ค.
- ๋ค์ด๋ก๋ ๋งํฌ: https://trace.ncbi.nlm.nih.gov/Traces/?view=run_browser&acc=SRR28167404&display=download
SRA Archive: NCBI
Updated: Wed Dec 6 10:54:10 EST 2023
trace.ncbi.nlm.nih.gov
์ค๋ ์งํํ ๋ถ์์ RNA ๋ถ์์ผ๋ก ํด๋น ๋ฐ์ดํฐ์ ์ด๋ค ์ ์ ์๋ค์ด ๋ฐํ๋๊ณ ์๋์ง ํ์ธํด๋ณผ ์์ ์ ๋๋ค.
RNA seq ๋ถ์์ ์๊ฐ๋ณด๋ค ๋ฐ์ดํฐ๊ฐ ์์์ ์๊ฐ์ด ์ ๊ฒ ์์๋๋๋ฐ ์ธ์ฝ๋ ํ์ ๋จ๊ธฐ ์ฌ์ฉ๋ ๊ฐ๋ฅํ๋ฏ๋ก ํ์ํ ๋ถ์์ ํจ์จ์ ์ผ๋ก ์ด์ฉํ ์ ์๋ค๋ ์ ์ด ์ข์ ๊ฒ ๊ฐ๋ค๊ณ ๋๊ผ์ต๋๋ค.
3. RNA seq ๋ถ์ ์งํ ๋ฐฉ๋ฒ
<๋ถ์ ๋ฐ์ดํฐ ์ค๋นํ๊ธฐ>
๋จผ์ ๋ถ์ํ๊ธฐ ์ํด ์์ ๊ฐ์ด Fastq ๊ฐ์ raw ๋ฐ์ดํฐ๋ฅผ ์ ๋ก๋ ํด์ผ ํฉ๋๋ค.
ํ์ผ ์ ๋ก๋๋ฅผ ์ํด์๋ FileZilla๋ผ๋ ํ๋ก๊ทธ๋จ์ ๋จผ์ ์ค์นํด์ผ ํฉ๋๋ค.
1) Remote Ripple ๋ค์ด๋ก๋
2) CLC Genomics Workbench ์คํ
โ CLC Genomics Workbench๋?
: QIAGEN์์ ๋ง๋ Next Generation Sequencing (NGS) ๋ฐ์ดํฐ ๋ถ์์ ์ํ GUI ๊ธฐ๋ฐ์ ์ํํธ์จ์ด ์ ๋๋ค. Sanger/ Illumina/ Ion Torrent/ PacBio/ Nanopore ๋ฑ ๋ค์ํ NGS ํฌ๋งท์ ์ง์ํ๊ณ ์๋ค๋ ์ฅ์ ์ด ์์ผ๋ฉฐ SIMD ๊ธฐ์ ์ ์ ์ฉํ ์ด๊ณ ์ NGS ๋ฐ์ดํฐ ๋ถ์์ด ๊ฐ๋ฅํฉ๋๋ค.
์์ ๊ฐ์ด ๋ค์ํ ์ฐ๊ตฌ์ ํตํฉ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ Tool์ ์ ๊ณตํ๋ฉฐ, Genomics/ Transcriptomics/ Epigenomics/ Metagenomics ๋ฑ ๋ค์ํ ๋ถ์ผ์ ์์ฉ์ด ๊ฐ๋ฅํฉ๋๋ค.
3) FileZilla ์ค์น ๋ฐ ์คํ (๋ฐ์ดํฐ ์ ๋ก๋)
File Zilla๋ฅผ ์ค์นํด์ฃผ๊ณ ์๋์ ๊ฐ์ด ๋ถ์ฌ๋ฐ์ ID, PW๋ก ์๋ฒ์ ๋ก๊ทธ์ธํด์ ์ฌ์ฉํ ๋ฐ์ดํฐ๋ฅผ ์ ๋ก๋ ์์ผ์ค๋๋ค.
File Ziilla๋ฅผ ์ค์นํ๋ฉด ํ๋กํ ์ฝ ๋ฐ ํธ์คํธ ์ ๋ณด๋ฅผ ์ ๋ ฅํ๋ผ๊ณ ํ๋ ์ฐฝ์ด ๋จ๋๋ฐ, ์ด๋ ์ธ์ค๋ฆฌ์ฝ์ ์์ ๋ถ์ฌ๋ฐ์ ๊ณ์ ์ ์ ๋ ฅํด์ฃผ๋ฉด ๋ฉ๋๋ค.
์์ ๊ฐ์ด ๋ค์ ์ ์๋๋ฉด ์ฐ๊ฒฐ๋ ๊ฒ์ ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ ์ฌ์ดํธ์ ์ค์ ํด์ค ์ด๋ฆ์ ํด๋ฆญํฉ๋๋ค.
ํ์ํ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ธ ์ปดํจํฐ์์(์ผ์ชฝ ํ๋ฉด) /home/ubuntu ๋ก ๋๋๊ทธํ์ฌ ์ฎ๊ฒจ์ค๋๋ค.(์ค๋ฅธ์ชฝ)
์ด๋ ๊ฒ ๋ถ์์ ์ฌ์ฉ๋ data๋ฅผ ์๋ฒ์ ์ ๋ก๋ ํด์ฃผ์์ต๋๋ค.
4) CLC Genomics Workbench ๋ฐ์ดํฐ ๊ฐ์ ธ์ค๊ธฐ
โ ๋ถ์์ฉ data ์ ๋ก๋
โ ์ผ๋ฐ์ ์ธ data ์ ๋ก๋ ๋ฐฉ๋ฒ
CLC Genomics Workbench 24๋ฅผ ์ ํํด์ ์คํ์์ผ์ค๋๋ค.
์ ์ํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ฐฝ์ด ๋น๋๋ค.
Import ๋ฒํผ์ ํตํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ต๋๋ค.
Add files๋ฅผ ์ ํํ๊ณ
FileZilla๋ฅผ ํตํด ์ฎ๊ฒจ๋์๋ ๋ฐ์ดํฐ๋ฅผ ์ ํํด์ import ํด์ค๋๋ค.
Import๊ฐ ์๋ฃ๋๋ฉด ์ผ์ชฝ ์๋จ ๋ฐ์ค์ ์ ๋ก๋ ํด์ค ์ํ์ด ์๊ธด ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
โก Fastq ์ ๋ก๋ ๋ฐฉ๋ฒ
Fastq๋ฅผ ์ ๋ก๋ ํ๊ณ ์ถ๋ค๋ฉด ์๋์ ๊ฐ์ ๋ฐฉ๋ฒ์ผ๋ก ์ ๋ก๋ ํด์ฃผ๋ฉด ๋ฉ๋๋ค.
Import ํญ์์ Fastq๋ฅผ ๋ถ์ํ ์ํ์ ์ข ๋ฅ๋ฅผ ๊ณจ๋ผ์ค๋๋ค. ์ผ๋ฃจ๋ฏธ๋ ์ฅ๋น๋ฅผ ์ฌ์ฉํ์์ผ๋ฏ๋ก illumina๋ฅผ ์ ํํ์์ต๋๋ค.
Fastq์์๋ Quality score, ์์ด์ ๋ํ ์ ๋ณด๋ฅผ ์์ ๊ฐ์ ์ ๋ณด๋ค์ ํ์ธํ ์ ์์ต๋๋ค.
โข VCF ์ ๋ก๋ ๋ฐฉ๋ฒ
VCF ์ ๋ก๋๋ฅผ ํตํ์ฌ Variant calling ๊ฒฐ๊ณผ๋ ํ์ธํ ์ ์์ต๋๋ค.
5) Reference Download
๊ทธ๋ค์ ๋ถ์์ ํ์ํ ๋ถ๊ฐ์ ์ธ ํ์ผ๋ค์ ๋ค์ด๋ก๋ ๋ฐ์๋ณด๊ฒ ์ต๋๋ค.
โ reference ๋ฐ๊ธฐ
์ฌ๋ RNA seq ๋ฐ์ดํฐ์ด๋ฏ๋ก human hg19๋ก reference genome์ ๋ฐ์์ค๋๋ค. CLC Genomics Workbench์์ ์ฐ์ธก ์๋จ์ References๋ผ๊ณ ๋์ด์๋ ๋ถ๋ถ์ ๋๋ฅด๋ฉด ์ฐ๊ตฌ์๋ค์ด ์ฃผ๋ก ์ฌ์ฉํ๋ human, mouse ๋ฑ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ฒ ๋ค์ด๋ก๋ ๋ฐ์ ์ ์์ต๋๋ค.
์ ๋ human ๋ฐ์ดํฐ์ด๋ฏ๋ก hg19 reference๋ฅผ ๋ฐ์์ต๋๋ค.
Homo sapiens-hg19๋ฅผ ์ ํํด์ human hg19 reference๋ฅผ ๋ฐ์์ต๋๋ค.
NCBI, UCSC ๋ฑ ๋ค์ํ DB๋ฅผ ๋ค์ด๋ก๋ ๋ฐ์ ์ ์์ต๋๋ค. ์ ํํ๋ค๋ฉด Download ๋ฒํผ์ ๋๋ฆ ๋๋ค.
์ด ์์ ์ ์๊ฐ์ด ์ค๋ ์์๋๋ ๊ผญ ํ์ํ DB๋ง ๋ค์ด๋ก๋ ๋ฐ์ผ๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค. ๋ฐ์ดํฐ๊ฐ ์ด๋ฏธ ์๋ฒ์์ ์ฌ๋ผ์ ์์ด reference๋ฅผ web ํ์ด์ง์์ ๋ฐ๋ก ์ฐพ์ ํ์๊ฐ ์์ด์ ์ข์์ต๋๋ค.
โก RNA-seq analysis with CLC Genomic Workbench ๋ถ์
RNA-seq์ ์ ๋ฐ์ ์ธ ๋ถ์ ๊ณผ์ ์ [Data import/ Reference] – [Preprocessing] – [RNA-seq analysis] – [Visualization] ์ ๋๋ค.
์์์ ํ์ํ Data ๋ค์ import ํด์๊ธฐ ๋๋ฌธ์ preprocessing๋ถํฐ ์์ํฉ๋๋ค.
6) Preprocessing
Preprocessing ๋จ๊ณ๋ trimming ํ๋ ๋จ๊ณ๋ก NGS ๋ถ์ ์, contamination ๋๊ฑฐ๋ ๋ฎ์ ํ๋ฆฌํฐ์ ๋ฐ์ดํฐ๋ฅผ ์ ๊ฑฐํ๋ ์์ ์ ์๋ฏธํฉ๋๋ค.
์ฆ, ์ํ์ฑ ํ raw ๋ฐ์ดํฐ๋ trimming ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ์ clean ํ ๋ฐ์ดํฐ๋ก ์์ฑ๋ฉ๋๋ค.
Trimmingํ ๋ฐ์ดํฐ๋ฅผ ๊ณจ๋ผ์ค๋๋ค.
์ดํ Quality trimming ์ ์งํ๋ก ์ฌ์ฉํ score๋ฅผ ์ ํด์ค๋๋ค.
๊ทธ๋ฆฌ๊ณ ์ต์ข ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ์ ์ฅํ ์ง ์ง์ ํด์ฃผ๋ฉด trimming ๋ถ์์ด ์งํ๋ฉ๋๋ค.
7) Trimming Result
Trimming ๊ฒฐ๊ณผ๋ Trim summary, Read length, Trim setting, Detailed trim result, Automatic adapter read-through trimming์ ๋ํ ์ ๋ณด๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
์ด๋ฒ์ ์ฌ์ฉํ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ, Read ์๊ฐ 312,402๊ฐ์๋๋ฐ trimming์ด ๋ sequence ๋ค์ด 16654์๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค.
trimming์ดํ์ total read ์๋ 21,007๊ฐ๋ก ๊ฐ์ํ ๊ฒ์ ํ์ธํ ์ ์์์ต๋๋ค.
์ด๋ ๊ฒ Trimming ์ ์ธํ ํ์๋ limit ๊ธฐ์ค๋ ํ์ธํ ์ ์์ต๋๋ค. ์ ๋ low quality sequence limit์ ๊ธฐ๋ณธ ๊ฐ์ด์๋ 0.05๋ก ์ค์ ํ์์ต๋๋ค.
์์ธํ trim result๋ ํ์ธํ ์ ์๋๋ฐ์, quality๋ก ์ธํด์ trimming ๋ read์ ๊ฐ์๋ ์ ์ ์์ผ๋ฉฐ ์ด๋ฒ์ 5,466๊ฐ๊ฐ quality fail๋ก ์ธํด์ trimming ๋์์ต๋๋ค.
์ด์ ๊ฐ์ด trimming์ด ์ผ๋ง๋ ๋์๊ณ , trimming ๋ ์ด์ ๊ณผ ์ดํ๋ฅผ ๋น๊ตํด๋ณผ ์ ์์ต๋๋ค.
8) RNA-seq analysis
Trimming ์๋ฃ ํ trimming ๋ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ RNA-seq ๋ถ์์ ์งํํฉ๋๋ค.
๋ถ์์ ์ฌ์ฉํ Trimming ๋ ๋ฐ์ดํฐ๋ฅผ ์ ํํด์ค๋๋ค.
์ฌ์ฉํ๋ ๋ฐ์ดํฐ์ reference ๋ฐ์ดํฐ, Gene track, mRNA track ๋ฐ์ดํฐ๋ฅผ ํจ๊ป ์ง์ ํด์ค๋๋ค. ์ ๋ reference ๋ฐ์ดํฐ๋ก hg19๋ฅผ ์ฌ์ฉํ์์ต๋๋ค. Gene track, mRNA track ๋ฐ์ดํฐ๋ reference ๋ค์ด๋ก๋ ์ ํจ๊ป ๋ค์ด๋ก๋ ๋๋ ๋ฐ๋ก ์ค๋นํ ํ์๋ ์์์ต๋๋ค.
Read ๊ฐ reference ์ํ์ค์ ๊ฐ์์ผ ํ๋ ์ต์๊ธธ์ด๋ฅผ ์ง์ ํด์ฃผ๊ณ similarity fraction๋ ์ค์ ํด์ค๋๋ค. CLC Genomics Workbench์์ ๊ถ์ฅํ๊ณ ์๋ ๊ธฐ๋ณธ๊ฐ์ผ๋ก ๋ถ์ ์งํํ์์ต๋๋ค.
๋ง์ง๋ง์ผ๋ก Strand setting์ ํด์ฃผ๋ฉฐ Expression level๋ RPKM์ผ๋ก ์ค์ ํด์คฌ์ต๋๋ค.
9) RNA-Seq Result
RNA-Seq ๊ฒฐ๊ณผ๋ฌผ์ Selected input sequence, References, Read Quality control, mapping statistics, fragment statistics, Distribution, Transcript length coverage ๊ด๋ จํ ๊ฒฐ๊ณผ๋ค์ ํ์ธํ ์ ์์ต๋๋ค.
๋ถ์์ด ์ ๋๋ก ๋์๋์ง ํ์ธํ๊ธฐ ์ํด read quality control์ ํ์ธํ์์ต๋๋ค.
Trimming์ ํ๊ณ ๋ถ์์ ์งํํ์๊ธฐ์ ๋ถ์ quality๋ ์ข์ ์์น๋ฅผ ๋ณด์์ต๋๋ค.
๊ทธ๋ฆฌ๊ณ ๊ฒฐ๊ณผ๋ฌผ๋ก Gene expression, Transcript expression ๊ฒฐ๊ณผ์ ๊ด๋ จํ์ฌ์๋ ์์ฑ๋ฉ๋๋ค.
RNA Seq์ ํ๋ ๋ชฉ์ ๋๋ถ๋ถ์ Gene expression์ ๋ณด๊ธฐ ์ํจ์ผ๋ก mRNA์ ๋ฐํ๋์ ์ธก์ ํ ์ ์์ต๋๋ค. ์ด๋ RPKM(Reads per kilobase per million reads) ๋๋ FPKM(Fragments Per Kilobase per Million reads) ๋ฑ์ ์งํ๋ฅผ ์ฌ์ฉํฉ๋๋ค.
Transcription expression๋ ํ์ธํ ์ ์์ต๋๋ค.
ํ์ง๋ง ์ด๋ฒ ๋ถ์์ ๋ชฉ์ ์ RNA Fusion ํ์ธ์ด๊ธฐ ๋๋ฌธ์ gene expression์ ๋ํด์๋ ์์ธํ๊ฒ ํ์ธํ์ง๋ ์์์ต๋๋ค.
Mapping ๋ ๊ฒฐ๊ณผ๋ฌผ์ ๋ํ ์ ๋ฐ์ ์ธ ์์์ ๋ํด์๋ visualization ํด์ค๋๋ค. ์ด๋ฅผ ํตํด ์ด๋ค ์์ญ์ Depth๊ฐ ๋ง์ด ์์๋์ง ๋ณผ ์ ์์ต๋๋ค.
10) Fusion gene detection
RNA Fusion์ด๋ ์ ์ ์ ์ฌ์กฐํฉ์ผ๋ก ์ธํด ๋ ๊ฐ์ ์ ์ ์์ ์ผ๋ถ๊ฐ ํ์ด๋ธ๋ฆฌ๋ ํํ๋ก ํฉ์ณ์ง ์ตํฉ(Fusion) RNA๋ฅผ ์์ฑํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ๊ธ์ฑ ๋ฐฑํ๋ณ, ํ์ ๋ฑ ์ผ๋ถ ์์ข ์์ ์ ์ ์ ์ฌ์กฐํฉ(rearrangement)์ด ์ข ์๋ฐ์์ ์ค์ํ ์ญํ ์ ํ๋ฏ๋ก ์ด๋ฅผ ๊ฒ์ถํ๋ ๊ฒ์ด ์ง๋จ๊ณผ ์น๋ฃ์ ํ์์ ์ ๋๋ค.
11) Fusion gene detection ๋ฐฉ๋ฒ
โ ์ผ์ชฝ ํ๋จ์ Toolbox์์ RNA-Seq tool์ธ Detection and Refine Fusion Genes๋ฅผ ํด๋ฆญํฉ๋๋ค. ์ด๋ฒ์ ํ์ธํ ๋ฐ์ดํฐ๋ human์ solid tumor data์ ๋๋ค.
โก ์ฌ์ฉํ Solid tumor data๋ฅผ ์ ํํฉ๋๋ค. ์ด๋ RNA seq mapping data๋ฅผ ์ฌ์ฉํ์ต๋๋ค.
โข ์๋์ ๊ฐ์ด ๋ถ์์ ํ์ํ RNA mapping data, reference, mRNA track data, Gene track data๋ฅผ ํจ๊ป ๋ฃ์ด์ค๋๋ค.
โฃ ๋ถ์ ์, maximum number of fusion, read count ๋ฑ cut-off๋ฅผ ์ค์ ํ ์ ์๋๋ฐ, ์๋์ ๊ฐ์ด ๊ธฐ๋ณธ์ ์ผ๋ก ์ ๊ณต๋๋ cut-off๋ฅผ ์ค์ ํ์์ต๋๋ค.
โค ๋ง์ง๋ง์ ๊ฒฐ๊ณผ๋ฌผ์ ๋ฐ๋ก ์ ์ฅํ๊ณ ์ถ์ผ๋ฉด, Save๋ฅผ ์ ํํ๊ณ ๊ฒฐ๊ณผ๋ฌผ ํ์ธ๋ง ํ๊ณ ์ถ์ผ๋ฉด Open์ ์ ํํ๋ฉด ๋ฉ๋๋ค.
12) RNA Fusion Result
์์ฑ๋ Fusion ๊ฒฐ๊ณผ๋ฌผ์ pdf๋ก๋ ๋ค์ด๋ก๋ ๋ฐ์ ์ ์์ต๋๋ค.
Fusion ๊ฒฐ๊ณผ pdf์์ ํ์ธํ ์ ์๋ ๋ด์ฉ์ Summary, Unaligned Ends, Fusion ์ ๋ณด๋ค์ด๋ฉฐ, ๊ฒ์ถ๋ Fusion ๋ค์ ๋ํ ์์ธํ ์ ๋ณด๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
ํด๋น ์ํ์์ GRM8-EXOC3๊ฐ fusion์ ์ด๋ฃจ๊ณ ์์์ ํ์ธํ ์ ์์์ต๋๋ค. Fusion annotation ์ ๋ณด๋ฅผ ๋ณด๋ฉด 5’ gene, 3’ gene ๊ทธ๋ฆฌ๊ณ ๊ฐ fusion์ exon ์ ๋ณด, Translocation name, read coverage ๋ฑ์ ํ์ธํ ์ ์์ต๋๋ค.
ํด๋น fusion์ read coverage๋ 2๋ก z-score๋ 31.61๋ก ๋์จ ๊ฒ์ผ๋ก ํ์ธ๋ฉ๋๋ค. Read coverage๊ฐ ๋๋ฌด ์์์ ํด๋น fusion์ false call์ด ์์ฌ๋ฉ๋๋ค.
๋ฐ๋ฉด์ ARFGEF2-EXOC3 Fusion ๊ฒฐ๊ณผ์ ๊ฒฝ์ฐ ARFGEF2 ์ ์ ์์ 20๋ฒ ์์๊ณผ EXOC3 ์ ์ ์์ 3๋ฒ ์์์ด Fusion ๋์์ผ๋ฉฐ, coverage depth๊ฐ 694๋ก ์ค์ BAM ํ์ผ๋ก ํ์ธํ์์ ๋๋ fusion์ด ํ์ธ๋ฉ๋๋ค.
4. ์ฌ์ฉ ํ๊ธฐ
<์ฅ์ >
ํ์์ ๋ค์ํ ์๋ฌผ์ ๋ณด ๋ถ์ Tool์ ์ฌ์ฉํ๊ณ ์๋๋ฐ, tool ์ค์น๋ถํฐ ํ์ดํ๋ผ์ธ ์ธํ ์ ๋ง์ ์๊ฐ์ด ์์๋์์ต๋๋ค. ์ธ์ฝ๋ ํ์ ์ด์ฉํ๋ ์ด๋ฌํ ์๊ฐ์ ๋จ์ถํด์ ๋์ฑ ์ฐ๊ตฌ์ ์ง์คํ ์ ์์์ด์. ๋ํ ์ง์ ์ฝ๋ฉํ์ง ์๊ณ ํด๋ฆญ๋ง์ผ๋ก๋ ์ฝ๊ฒ ๋ถ์ํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ ์ ์๋ค๋ ์ , ๊ทธ๋ฆฌ๊ณ ๋ถ์ ์๊ฐ์ด ๊ธฐ์กด์ ์๋ฒ๋ฅผ ํตํด ์ฌ์ฉํ๋ ์๊ฐ์ ๋นํด์ ์งง๋ค๋ ๊ฒ๋ ํฐ ์ฅ์ ์ด์์ต๋๋ค.
<๋จ์ >
์๋ฌด๋๋ ์ฒ์ ์ฌ์ฉํ ๋ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ์ ๋ก๋ํด์ผ ํ๋์ง, ์ด๋ค ๊ธฐ๋ฅ๋ค์ด ์ด๋์ ์กด์ฌํ๋์ง ์ต์ํด์ง๋ ๋ฐ๊น์ง ์๊ฐ์ด ๊ฑธ๋ฆฌ๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ฌ์ฉ์ ์นํ์ ์ผ๋ก ๊ตฌ์ฑ๋ ์๋น์ค์ด์ง๋ง ๋ถ์์ ์ฌ์ฉ๋๋ format์ ๋ง๋ค๊ฑฐ๋ ์์ฑ๋๋ ๊ฒฐ๊ณผ๋ฌผ์ด ์ด๋ค ๊ฒฐ๊ณผ๋ฅผ ํ๊ณ ์๋์ง ๋ฏธ๋ฆฌ ํ์ ํ๊ธฐ๊ฐ ์ด๋ ค์ด ๊ฒ ๊ฐ์ต๋๋ค.
๋ถ์ ์๊ฐ์ด ์งง๊ฒ ๊ฑธ๋ฆฐ๋ค๋ ์ฅ์ ์ ํตํ์ฌ ์ฐ๊ตฌ์ ๊ฑธ๋ฆฌ๋ ์๊ฐ์ ๋จ์ถํด์ค ๊ฒ ๊ฐ์ผ๋ฉฐ, RNA Fusion ๊ฒฐ๊ณผ๋ ํ๋์ ์์๋ณด๊ธฐ ์ฝ๊ฒ pdf๋ก ์๊ฐํ ๋ฐ ์ ๋ฆฌ๋์ด ์์ฑ๋์ด ์ํ๋ง๋ค ๋น๊ตํ๊ธฐ ์์ํ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ Fusion์ ๊ฒฝ์ฐ์ ์ด๋ค exon๋ผ๋ฆฌ ์ฐ๊ฒฐ๋์ด์๋์ง ํ์ธํ๋ ๊ฒ์ด ์ค์ํ๋ฐ ์ด ๋ถ๋ถ์ ์ฒ์๋ถํฐ ์๊ฐํ ํด์ค์ ๊ฒฐ๊ณผ ํด์ํ๊ธฐ์ ์ ์ฉํ์์ต๋๋ค. ์ด๋ ๊ฒ ์ธ์ฝ๋ ํ์ ์ด์ฉํ๊ฒ ๋๋ค๋ฉด ์๋ฌผ ์ ๋ณด ๋ฐ์ดํฐ ๋ถ์์ ์ข ๋ ๋์์ด ๋ ๊ฒ ๊ฐ์ต๋๋ค.
'ํด๋น ํฌ์คํ ์ ์ ์ฒด๋ก๋ถํฐ ์ ํ๊ณผ ์๊ณ ๋ฃ๋ฅผ ์ง์๋ฐ์ ์ค์ ์ฌ์ฉํ ํ๊ธฐ๋ฅผ ์์ฑํ์์ต๋๋ค.'
'Bioinformatics Issue๐งฌ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
NA12878 Download (FASTQ, VCF, BED) (0) | 2024.12.19 |
---|---|
[๊ฐ์ฐ]์ ์ ์ ๊ฐ์ ํ์ฉ ์ง๋ณ ์ง๋จ ๊ธฐ์ (0) | 2024.11.21 |
[DB]What is JAX ClinicalKnowledgebase DB? (JAX CKB) (0) | 2024.04.03 |
[BI]GATK HaplotyeCaller ์ฌ์ฉํด์ germline variant ํ์ธํ๊ธฐ (1) | 2024.02.07 |
HLA(Human Leukocyte Antigen)๋ ๋ฌด์์ธ๊ฐ? (0) | 2022.01.03 |