PySpark (Spark in Python) – technologia do przetwarzania i analizy danych typu „Big Data”
Potrzebne do udziału:
- omówienie najważniejszych zagadnień takich jak np. architektura, struktury danych, rodzaje problemów, do rozwiązywania których Spark ma najlepsze zastosowanie
- przykłady oraz warsztat w postaci pisania fragmentów kodu
- case study wykorzystania PySpark w dziale modelowania ekonometrycznego w NatWest
- opcjonalnie (w zależności od czasu): case study stworzenia prostego rozwiązania ML z użyciem PySpark
Potrzebne do udziału:
- Laptop z dostępem do internetu i Google Colab (Google Colab to bezpłatne i ogólnodostępne IDE do pisania kodu m.in. w Python)