전체 글 99

[자격증] 정보처리기사 '비전공자' 독학

정보처리기사 자격증이 필요할것 같아서 이번에 신청하게 되었다.기존에 ADSP는 공부해본적 있지만, 컴공 출신은 아니라서 약간 걱정된다..비전공자 기준으로 1달은 공부해야 합격하던데..벌써 3주밖에 안남았다.gpt한테 공부 일정 만들어 달라고 했더니 아래와 같이 만들어줌...역시 최고당이대로 기출 쭉쭉 돌려보고 후기 낋여오겠습니다.기본 원칙평일: 2~3시간 (이론 1~1.5h + 기출 1~1.5h)설날 연휴: 4~6시간 (기출 비중 ↑)전략: 이론은 빠르게 1회독 → 기출 반복 + 오답 정리 중심기출: 최근 5~7개년 우선, 틀린 문제는 과목별 노트화2/10 (화)1과목 소프트웨어 설계 요약 정리기출 1회분 (1과목 위주)2/11 (수)2과목 소프트웨어 개발 요약 정리기출 1회분 (1~2과목)2/12 (목..

카테고리 없음 2026.02.10

[논문]Attention-based deep Multiple Instance Learning

이 논문은 기존 Multiple Instance Learning (MIL) 의 문제점을 bag 라벨의 베르누이 분포(Bernoulli distribution)를 학습하는 문제로 정의하고, 이를 해결하기위해 Attention이라는 알고리즘을 이용해서 각 인스턴스가 라벨에 기여하는 정도를 해석할 수 있는 MIL 방법을 제안한다. Instance (인스턴스) → 하나의 개별 데이터 포인트를 의미합니다. 예: 한 장의 이미지, 한 문장, 한 환자의 특정 검사 결과 등.Bag (가방, 묶음) → 여러 인스턴스들을 모아놓은 집합입니다. 예: 한 환자의 여러 장의 CT 이미지, 한 논문에 포함된 여러 문장, 한 유전자에 대한 여러 변이 기록.MIL에서의 특징 일반적인 지도학습(supervised learning..

카테고리 없음 2026.02.03

[GNN]Graph neural networks learn emergent tissue properties from spatial molecular profiles

1. Abstract + 논문을 읽기 전 배경지식Tissue phenotype은 metabolic state나 inflammation, tumor properties와 같은 분자적 상태와 세포의 공간적 구조에 따라서 달라진다. 이때 조직 표현형(Tissue Phenotype)이란 유전적 요인(genotype)과 환경적 요인의 상호작용에 의해 세포나 조직 수준에서 관찰 가능하게 나타나는 형태적, 기능적, 생화학적 특징의 집합을 의미한다.예를 들면,면역 표현형 (Immunophenotype): 백혈병이나 림프종 진단 시, 암세포 표면에 나타나는 특정 단백질 마커를 기준으로 분류하는 방식. 치주 조직 표현형 (Periodontal Phenotype): 잇몸의 두께, 너비(gingival phenotype)와 ..

논문 2026.01.20

[NGS]Single-cell RNAseq Dimensionality Reduction(2.t-SNE)

두번째 방법인 t-SNE에 대해 알아보겠다. t-SNE(t-Distributed Stochastic Neighbor Embedding)의미t-SNE는 고차원 데이터에서 가까운 점은 가깝게, 먼 점은 멀게 유지하면서 2–3차원으로 임베딩하는 비선형 차원 축소·시각화 기법이다. scRNA-seq에서는 PCA 이후 주로 시각화용으로 사용한다. t-SNE는 "t-distributed Stochastic Neighbor Embedding"의 줄임말인데 그 이름을 통해 의미를 유추해볼 수 있다. "t-SNE"라는 단어의 각 부분이 의미하는 바는 다음과 같다.t: 저차원 공간의 유사도는 t-분포를 사용해서 측정한다.SN: Stochastic Neighbor 다시 말해, 확률적 유사도로 인접성(이웃)을 결정한다.E: ..

[NGS]Single-cell RNAseq Dimensionality Reduction(1.PCA)

Dimensionality Reduction scRNA-seq 데이터는 수만 개의 유전자와 수만 개의 세포로 고차원(high-dimensional)이라 "차원의 저주(curse of dimensionality)" 문제가 발생한다. 차원이 높아질수록 noise와 중복 정보가 증가해 실제 정보는 적고 downstream 분석(클러스터링, 시각화)이 어려워진다. curse of dimensionality를 해결하기 위해 dimensionality reduction 을 이용한다.feature selection(예: deviance로 4000 gene) 후 추가 차원 축소 필요. 고차원 데이터를 저차원(2D/3D)으로 매핑하면서 데이터의 구조(세포 타입 간 거리)를 최대한 보존한다. dimensionality r..

[NGS]Single-cell RNAseq Feature selection(VST, Deviance)

Feature selection는 쉽게 말해 세포 간 의미 있는 생물학적 변이를 담고 있는 유전자만 남기자! 라는 목적을 갖고있다.즉, informative features를 선택하여 data set을 축소하는 과정이다.Feature selection 단계는 단일세포 데이터 세트에서 유의한 유전자를 선택하기 위한 중요한 단계이다. 이 단계는 셀 간 분산 차가 큰 유전자를 선택하여, 세포 유형 간의 차이점을 파악할 수 있도록 하는 것이다. 앞에서 normalization을 함으로 기술적 효과는 줄이고 세포간 생물학적 이질성은 보존하였다.하지만, 유전자 수가 너무 많고, 단순 필터링 만으로는 informative한 유전자를 확인하기 어렵다. 그러므로 meaningful biological variation을..

카테고리 없음 2025.12.17

[NGS]Single cell RNAseq Normalization 원리

Normalization 필요성과 원리1. 전처리 현황 및 문제점지금까지 QC 단계를 통하여서 저품질 세포, 주변 RNA 오염, Doublets 는 제거 되었다.현재 데이터는 세포 * 유전자 형태의 count 행렬로 존재한다. 여기서 문제점은, 이 count값들은 RNA분자의 Capture, Reverse Transcription, Sequencing 등 실험 단계마다 발생하는 변동성(Variability)이 누적된 결과이란 점이다.동일한 세포라도 측정된 count depth가 달라지는 Sampling Effects로 인해서 카운트 행렬은 매우 다양한 분산을 포함하게 된다. 즉, 유전자 발현량의 차이가 실제 생물학적 차이가 아닌, 단순히 실험과정의 noise 때문(sampling Effect)일수 있다 ..

카테고리 없음 2025.12.15

[NGS]single-cell RNAseq Quality Control 원리

scRNAseq에서 QC 단계를 수행할때 어떤 개념과 원리들로 진행하는지 소개하겠습니다. 1. QC(Quality Control)의 목적단일 세포 RNA 시퀀싱(scRNA-seq) 분석에서 수행하는 품질 관리(Quality Control, QC)는 데이터의 정확성과 신뢰성을 보장하는 중요한 과정입니다. scRNA-seq 데이터는 고도로 민감하고 복잡하기 때문에, QC 단계는 효율적인 데이터 분석과 정확한 생물학적 해석을 위해 필수적이다.세포별 유전자 수 및 총 RNA 분자 수 확인: 각 세포에서 발현된 유전자 수와 총 RNA 분자 수를 확인하여, 데이터의 품질과 세포의 건강 상태를 평가한다.미토콘드리아 유전자 발현 비율 검사: 미토콘드리아 유전자 발현 비율이 높은 세포는 손상되었거나 사멸 중일 가능성이 ..

카테고리 없음 2025.12.15

Single cell RNAseq 개념 및 원리

Single cell 분석이란?단일세포 (Single cell) 분석은 세포의 군집 (cell population)이 아닌 세포 하나 하나를 연구하는 방법으로써, 세포 각각의 고유한 생물학적 특성을 규명할 수 있다. 이는 줄기세포, 순환종양세포 (Circulating Tumor Cells; CTC), 조직생검 (tissue biopsy)과 같은 양이 아주 적고 귀중한 샘플을 분석하는 데 매우 중요하다.Single cell은 유전체학 (Genomics), 전사체학 (Transcriptomics), 단백질체학 (Proteomics)과 같이 다양한 학문에서 분석 적용될 수 있다. 특히, DNA 수준을 연구하는 유전체학과 RNA 수준을 연구하는 전사체학은 최신의 서열분석기법인 NGS (Next Generatio..