Skip to content

BBARRY-Lee/Spark

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

85 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Spark: The Definitive Guide(스파크 완벽 가이드) 정리

Part1: 빅데이터와 스파크 간단히 살펴보기

Chapter 1: 아파치 스파크란

Chapter 2: 스파크 간단히 살펴보기

Chapter 3: 스파크 기능 둘러보기


Part2: 구조적 API - DataFrame, SQL, Dataset

Chapter 4: 구조적 API 개요

Chapter 5: 구조적 API 기본 연산

Chapter 6: 다양한 데이터 타입 다루기

Chapter 7: 집계 연산

Chapter 8: 조인

Chapter 9: 데이터소스

Chapter 10: 스파크 SQL

Chapter 11: Dataset


Part3: 저수준 API

Chapter 12: RDD

Chapter 13: RDD 고급 개념

Chapter 14: 분산형 공유 변수


Part4: 운영용 애플리케이션

Chapter 15: 클러스터에서 스파크 실행하기

Chapter 16: 스파크 애플리케이션 개발하기

Chapter 17: 스파크 배포 환경

Chapter 18: 모니터링과 디버깅

Chapter 19: 성능 튜닝


Part5: 스트리밍

Chapter 20: 스트림 처리의 기초

Chapter 21: 구조적 스트리밍의 기초

Chapter 22: 이벤트 시간과 상태 기반 처리

Chapter 23: 운영 환경에서의 구조적 스트리밍


Part6: 고급 분석과 머신러닝

Chapter 24: 고급 분석과 머신러닝 개요

Chapter 25: 데이터 전처리 및 피처 엔지니어링

Chapter 26: 분류

Chapter 27: 회귀

Chapter 28: 추천

Chapter 29: 비지도 학습

Chapter 30: 그래프 분석

Chapter 31: 딥러닝

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%