In current immune research, RNA sequencing has established itself as an essential technology for establishing, verifying, and refining hypotheses. Data-based hypothesis establishment and validation are essential as RNA sequencing data accumulation is increasing exponentially. Therefore, this educational session is intended to learn how to acquire, process, and utilize data related to research topics using Gene expression Omnibus (GEO), a public functional genomics data repository including RNA sequencing data. Throughout this education session, RNA sequencing data used in actual immune research will be obtained, and learn about how to conduct differentially expressed gene (DEG) analysis between the interested case group and the control group and visualization of results. In addition, we will introduce the concept of gene ontology and related tools, and learn gene ontology analysis for significant or interesting genes.
GEO 플랫폼에서 RNA seq count 데이터를 획득, 이를 처리 및 활용하여 하위 분석(DEG 분석, GO 분석, 시각화)을 수행할 수 있다.
GEO series dataset: GSE147035
논문: Primary germinal center-resident T follicular helper cells are a physiologically distinct subset of CXCR5hiPD-1hi T follicular helper cells. Yeh et al. Immunity. 2022. (링크)
각 시기 (Day 8,12,16,24) 마다 mouse (3마리) 에서 채취한 두가지 세포 타입 sorting 후, RNA sequencing data
- GCTFH cell (12): Primary germinal center-resident T follicular helper cell (CD90 negative/low T follicular helper cell)
- GCTFH-like cell (12): Germinal center-resident T follicular helper like cell (CD90 high T follicular helper cell)
위 두 세포 타입 간 유전자 발현량 차이, 시각화 및 Gene ontology 분석 진행
- GEO Data processing
- Data Description: PCA, Correlation analysis. (+ Quality check)
- Differentially Expressed Gene analysis: DESeq2
- Visualization: Volcano plot, Heatmap plot
- Gene Ontology analysis: DAVID, Toppgene
- 사전 다운로드
- 사전 설치 필요: 아래 순서대로 설치
- R: 다운로드 받은 압축파일의
0.Pre-install/1_R/
에 위치 - Rstudio: 아래 링크에서 직접 다운로드하여 설치
- 링크: 운영체제 (Mac or Windows) 에 맞는 Rstudio Desktop (free) 설치
- R packages 설치 (아래그림 참조):
0.Pre-install/installRpackages.R
스크립트 활용
- R: 다운로드 받은 압축파일의
- 실습생 기본 환경 세팅 확인
- GEO 소개 및 다운로드, 처리 방법 (in R)
- PCA 분석, 상관관계 그래프를 통한 데이터 확인 (in R)
- DESeq2를 활용한 Differentially expressed genes 분석 (in R)
- DEG 분석 시각화 (Volcano plot, Heatmap plot) (in R)
- Gene ontology 및 관련 도구 소개, Gene ontology 분석 (in Web)
- Q & A
서울대병원 의생명정보학 연구실 (링크)
정경훈, [email protected]
이동주, [email protected]
양선아, [email protected]