Visualització de dades
Resultats d'Aprenentatge
RA2: Configura quadres de comandament en entorns computacionals utilitzant tècniques predictives.
RA4: Aplica eines per a la visualització de dades valorant les tipologies i aplicacions de BI.
Criteris d'Avaluació (CA)
| CA | Descripció |
|---|---|
| CA2.1 | Classifica biblioteques i implementacions de representació d'informació. |
| CA2.2 | Creua informació sobre l'objectiu i la naturalesa de les dades per triar la visualització adequada. |
| CA2.3 | Fa un quadre de comandament amb tècniques adequades i visualitzacions interactives. |
| CA2.5 | Avalua l'impacte de l'anàlisi de dades i el comunica de manera efectiva. |
| CA4.2 | Implanta una aplicació de BI per a l'extracció de valor a partir de les dades. |
| CA4.6 | Valora les maneres de visualitzar les dades i selecciona la més adequada a cada context. |
Continguts del Bloc 7
Totes les dades del món no serveixen de res si no es poden comunicar de manera efectiva. La visualització de dades és el pont entre l'anàlisi tècnica i la presa de decisions empresarials. Un bon dashboard permet a un directiu entendre en trenta segons el que un analista ha trigat setmanes a calcular.
En aquest bloc s'estudia la visualització de dades des dels principis fonamentals fins a la implementació professional amb Power BI:
- Principis de visualització de Tufte: el data-ink ratio, com evitar el chartjunk, les mentides estadístiques més freqüents i com detectar-les
- Selecció del tipus de gràfic adequat: comparació (barres), distribució (histogrames, violin plots), composició (pastel, àrea apilada), relació (dispersió, bulles)
- Biblioteques Python: Matplotlib per al control total, Seaborn per a gràfics estadístics elegants, Plotly per a interactivitat
- Power BI Desktop: model de dades i relacions, DAX bàsic i avançat (CALCULATE, FILTER, ALL, RELATED), disseny de dashboards professionals
- Metabase: l'alternativa open source per crear preguntes i dashboards directament sobre les bases de dades que hem desenvolupat nosaltres mateixos al mòdul (PostgreSQL del Bloc 2, MongoDB del Bloc 3)
- Storytelling amb dades: com estructurar una narrativa analítica, com adaptar el missatge a l'audiència, com generar acció a partir de dades
Qüestionari inicial
- Qué és la visualització de dades i per qué és important en Big Data?
- Quins tipus de gràfics coneixes? En quin cas usaries un gràfic de barres vs un de línies?
- Has usat alguna vegada Matplotlib o Seaborn? Qué has fet amb ells?
- Qué és Power BI? Has treballat mai amb ell o amb una eina similar (Tableau, Excel)?
- Qué és un dashboard de BI? Quins elements hauria de tenir?
- Qué és una mesura DAX en Power BI?
- Qué és el "data-ink ratio" de Tufte? Per qué és important per a un bon disseny?
- Quin gràfic triaries per mostrar la distribució de salaris d'una empresa? Per qué?
- Quina diferència hi ha entre un gràfic descriptiu i un gràfic persuasiu?
- Qué és el storytelling amb dades? Per qué és una habilitat valuosa per a un Data Analyst?
- Has vist alguna vegada una visualització de dades enganyosa? Com la identificaries?
- Qué és Plotly i en qué es diferencia de Matplotlib?
Organització dels continguts
-
Principis de visualització
Tufte i el data-ink ratio, chartjunk, mentides estadístiques, selecció del tipus de gràfic, colors i accessibilitat.
-
Biblioteques Python
Matplotlib (anatomia d'una figura, subplots), Seaborn (gràfics estadístics, heatmaps), Plotly (gràfics interactius, Dash).
-
Power BI
Model de dades i relacions, DAX bàsic i avançat, disseny de dashboards, bookmarks, drill-through i tooltip pages.
-
Tècniques de disseny de dashboards
Tipus de dashboard, jerarquia visual, graella, targetes KPI, color, anti-patrons habituals i webgrafia de referència.
-
Metabase
Instal·lació amb Docker, connexió a les bases de dades pròpies (PostgreSQL, MongoDB), preguntes amb SQL natiu i dashboards amb filtres compartits.
-
Storytelling
Narrativa analítica, estructura d'una presentació de dades efectiva, adaptació a l'audiència, generació d'acció a partir de dades.
Durada i avaluació
| Element | Valor |
|---|---|
| Hores | 15 hores (5 sessions de 3h) |
| Pes en la qualificació final | 15% del mòdul |
| Pràctica avaluable | PR507407 — Dashboard Power BI |
| Activitats | AC5074/07/01 fins a AC5074/07/04 |
Enfocament d'aquest bloc
La visualització de dades és part ciència i part art. La part de ciència (quin gràfic per a quin tipus de dades) es pot aprendre amb regles clares. La part d'art (aconseguir que el missatge arribi) requereix pràctica i feedback. Dedicar temps a analitzar visualitzacions bones i dolentes és tan valuós com aprendre la sintaxi d'una eina.