Salta el contingut

Visualització de dades

Resultats d'Aprenentatge

RA2: Configura quadres de comandament en entorns computacionals utilitzant tècniques predictives.

RA4: Aplica eines per a la visualització de dades valorant les tipologies i aplicacions de BI.

Criteris d'Avaluació (CA)

CA Descripció
CA2.1 Classifica biblioteques i implementacions de representació d'informació.
CA2.2 Creua informació sobre l'objectiu i la naturalesa de les dades per triar la visualització adequada.
CA2.3 Fa un quadre de comandament amb tècniques adequades i visualitzacions interactives.
CA2.5 Avalua l'impacte de l'anàlisi de dades i el comunica de manera efectiva.
CA4.2 Implanta una aplicació de BI per a l'extracció de valor a partir de les dades.
CA4.6 Valora les maneres de visualitzar les dades i selecciona la més adequada a cada context.

Continguts del Bloc 7

Totes les dades del món no serveixen de res si no es poden comunicar de manera efectiva. La visualització de dades és el pont entre l'anàlisi tècnica i la presa de decisions empresarials. Un bon dashboard permet a un directiu entendre en trenta segons el que un analista ha trigat setmanes a calcular.

En aquest bloc s'estudia la visualització de dades des dels principis fonamentals fins a la implementació professional amb Power BI:

  • Principis de visualització de Tufte: el data-ink ratio, com evitar el chartjunk, les mentides estadístiques més freqüents i com detectar-les
  • Selecció del tipus de gràfic adequat: comparació (barres), distribució (histogrames, violin plots), composició (pastel, àrea apilada), relació (dispersió, bulles)
  • Biblioteques Python: Matplotlib per al control total, Seaborn per a gràfics estadístics elegants, Plotly per a interactivitat
  • Power BI Desktop: model de dades i relacions, DAX bàsic i avançat (CALCULATE, FILTER, ALL, RELATED), disseny de dashboards professionals
  • Metabase: l'alternativa open source per crear preguntes i dashboards directament sobre les bases de dades que hem desenvolupat nosaltres mateixos al mòdul (PostgreSQL del Bloc 2, MongoDB del Bloc 3)
  • Storytelling amb dades: com estructurar una narrativa analítica, com adaptar el missatge a l'audiència, com generar acció a partir de dades

Qüestionari inicial

  1. Qué és la visualització de dades i per qué és important en Big Data?
  2. Quins tipus de gràfics coneixes? En quin cas usaries un gràfic de barres vs un de línies?
  3. Has usat alguna vegada Matplotlib o Seaborn? Qué has fet amb ells?
  4. Qué és Power BI? Has treballat mai amb ell o amb una eina similar (Tableau, Excel)?
  5. Qué és un dashboard de BI? Quins elements hauria de tenir?
  6. Qué és una mesura DAX en Power BI?
  7. Qué és el "data-ink ratio" de Tufte? Per qué és important per a un bon disseny?
  8. Quin gràfic triaries per mostrar la distribució de salaris d'una empresa? Per qué?
  9. Quina diferència hi ha entre un gràfic descriptiu i un gràfic persuasiu?
  10. Qué és el storytelling amb dades? Per qué és una habilitat valuosa per a un Data Analyst?
  11. Has vist alguna vegada una visualització de dades enganyosa? Com la identificaries?
  12. Qué és Plotly i en qué es diferencia de Matplotlib?

Organització dels continguts

  • Principis de visualització


    Tufte i el data-ink ratio, chartjunk, mentides estadístiques, selecció del tipus de gràfic, colors i accessibilitat.

    Principis de visualització

  • Biblioteques Python


    Matplotlib (anatomia d'una figura, subplots), Seaborn (gràfics estadístics, heatmaps), Plotly (gràfics interactius, Dash).

    Biblioteques Python

  • Power BI


    Model de dades i relacions, DAX bàsic i avançat, disseny de dashboards, bookmarks, drill-through i tooltip pages.

    Power BI

  • Tècniques de disseny de dashboards


    Tipus de dashboard, jerarquia visual, graella, targetes KPI, color, anti-patrons habituals i webgrafia de referència.

    Disseny de dashboards

  • Metabase


    Instal·lació amb Docker, connexió a les bases de dades pròpies (PostgreSQL, MongoDB), preguntes amb SQL natiu i dashboards amb filtres compartits.

    Metabase

  • Storytelling


    Narrativa analítica, estructura d'una presentació de dades efectiva, adaptació a l'audiència, generació d'acció a partir de dades.

    Storytelling

Durada i avaluació

Element Valor
Hores 15 hores (5 sessions de 3h)
Pes en la qualificació final 15% del mòdul
Pràctica avaluable PR507407 — Dashboard Power BI
Activitats AC5074/07/01 fins a AC5074/07/04

Enfocament d'aquest bloc

La visualització de dades és part ciència i part art. La part de ciència (quin gràfic per a quin tipus de dades) es pot aprendre amb regles clares. La part d'art (aconseguir que el missatge arribi) requereix pràctica i feedback. Dedicar temps a analitzar visualitzacions bones i dolentes és tan valuós com aprendre la sintaxi d'una eina.