PySpark (Spark in Python) – technologia do przetwarzania i analizy danych typu „Big Data”

Potrzebne do udziału:

  • omówienie najważniejszych zagadnień takich jak np. architektura, struktury danych, rodzaje problemów, do rozwiązywania których Spark ma najlepsze zastosowanie
  • przykłady oraz warsztat w postaci pisania fragmentów kodu
  • case study wykorzystania PySpark w dziale modelowania ekonometrycznego w NatWest
  • opcjonalnie (w zależności od czasu): case study stworzenia prostego rozwiązania ML z użyciem PySpark

Potrzebne do udziału:

  • Laptop z dostępem do internetu i Google Colab (Google Colab to bezpłatne i ogólnodostępne IDE do pisania kodu m.in. w Python)

role models

mentors

trainers