Uncategorized

Synapse에서 외부 스토리지 호출하여 Excel 파일 불러오기

Azure Synapse은 대규모 DW를 구축하거나 ETL 설계에서 필요한 통합 플랫폼이다. 특히 Spark환경에서 데이터를 효율적으로 불러오고, 쓸 때 자주사용하는 패키지가 mssparkutils…

2개월 ago

맥북에 PySpark 로컬 환경 설치 (feat. Brew)

맥북에서 PySpark 로컬 실행환경 설치를 해보기 위한 방법을 정리하였다. 데이터 엔지니어링을 공부하면 Spark는 꼭 다뤄야 하는 기술 중 하나이다. Jupyter…

2개월 ago