Dae Woo Kim

PySpark cheat sheet 자료 — RDD, 데이터 처리

예전부터 잘 이용했던 Python의 여러 cheat sheet들이 있었다. PySpark도 좋은 cheat sheet 들이 있어서 정리 차원에서 포스팅.

PDF 문서 다운로드:

arif-cheatSheet_pyspark.pdf

pyspark-rdd-datacamp.pdf

PySpark cheat sheet — from Wenqiang

기존 pandas cheat sheet과 유사하고, 데이터 처리 부분 그림도 그려 주셔서 직관적으로 원하는 기능을 찾아 사용 가능하다.

Datacamp에서 제공하는 pyspark 문서

마찬가지로, 기본 컨셉과 코드를 꼭 필요한 부분만 간략히 제공한다.

--

--