Salta el contingut

Recursos

Documentació oficial

Apache Spark i ecosistema Hadoop

Streaming i orquestració

Bases de dades no relacionals

Cloud per a Big Data

Formats de dades

Visualització i BI


Eines gràfiques i d'administració

DBeaver Community Edition

DBeaver és l'eina universal recomanada per al curs per a les fonts relacionals i MongoDB. És gratuïta i suporta pràcticament tots els motors treballats al mòdul.

MongoDB Compass

Eina gràfica oficial de MongoDB per explorar col·leccions, executar consultes i pipelines d'agregació visualment.

pgAdmin 4

Eina oficial de PostgreSQL per a l'administració de les bases de dades relacionals treballades al Bloc 2.

Astro CLI (Airflow)

Eina oficial d'Astronomer per executar Apache Airflow en local amb Docker sense haver de configurar-lo manualment.


Imatges Docker recomanades

Eina Imatge Versió recomanada
PostgreSQL postgres postgres:17
MongoDB mongo mongo:7
Apache Kafka apache/kafka apache/kafka:3.7.0
Apache Airflow apache/airflow apache/airflow:2.9.0
Apache Superset apache/superset latest
Metabase metabase/metabase v0.50
Grafana grafana/grafana 10.3.0
InfluxDB influxdb 2.7
pgAdmin 4 dpage/pgadmin4 latest
MongoDB Compass aplicació d'escriptori, no Docker

Una xarxa Docker per pràctica

Quan una pràctica necessita diversos serveis (per exemple, PostgreSQL + Metabase, o Airflow + PostgreSQL), defineix-los al mateix docker-compose.yml perquè comparteixin la xarxa interna de Docker i es puguin adreçar pel nom del contenidor, tal com es mostra a les pràctiques de cada bloc.


Entorns en línia sense instal·lació


Llibres recomanats

Títol Autor/s Notes
Spark: The Definitive Guide Bill Chambers, Matei Zaharia La referència per a Apache Spark, escrita pels creadors del projecte.
Designing Data-Intensive Applications Martin Kleppmann El llibre de capçalera per entendre arquitectures de dades distribuïdes.
Fundamentals of Data Engineering Joe Reis, Matt Housley Visió moderna i completa de l'enginyeria de dades el 2025.
MongoDB: The Definitive Guide Shannon Bradshaw et al. Referència completa de MongoDB, des de CRUD fins a sharding.
The Big Book of Data Engineering Databricks Gratuït (PDF), centrat en Lakehouse, Delta Lake i Spark.
Storytelling with Data Cole Nussbaumer Knaflic El llibre de referència per a la comunicació visual de dades.

Recursos en català i castellà


Comunitats i fòrums