728x90
반응형
Apache Spark는 대규모의 데이터를 처리할 수 있는 기능을 제공하는 빅데이터 처리용 플랫폼이다.
SQL, 기계학습, 딥러닝 및 그래프 처리를 위한 모델이 내장된 빅데이터 처리용 데이터 분석 엔진을 말한다.
pySpark는 빠른 데이터 처리를 위해 Spark와 Python 간의 인터페이스를 만들기 위해 출시 되었다.
pySpark는 Spark용 Python API를 말한다.
pySpark는 일관된 방식으로 여러 서버에서 실행할 수 있는 범용 분산 계산 엔진으로 분산 데이터 세트를 읽고
Spark 내에서 실행하도록 작성한 코드를 기반으로 해당 데이터를 처리할 수 있게 합니다.
스파크에 대한 설명 참고
pyspark 설명 참고
https://ichi.pro/ko/pysparke-daehan-wanjeonhan-sogae-137537062841545
728x90
반응형
'컴퓨터쟁이 > Python' 카테고리의 다른 글
python 패키징 하는 방법 1- Pyinstaller (1) | 2021.08.26 |
---|---|
pyinstaller 윈도우10 액세스 거부 오류 (0) | 2021.08.25 |
혼공학습단 5기_혼공파 6주차 미션 (0) | 2021.03.01 |
혼공학습단 5기_혼공파 5주차 미션 (0) | 2021.02.24 |
혼공학습단 5기_혼공파 4주차 미션 (1) | 2021.02.16 |