Salta el contingut

Validació dels Criteris d'Avaluació

Mapa de cobertura RA-CA-Instruments

Aquesta pàgina documenta quins instruments d'avaluació cobreixen cadascun dels criteris d'avaluació (CA) dels quatre Resultats d'Aprenentatge (RA) oficials del mòdul 5074. El contingut del mòdul s'organitza en 7 blocs temàtics que distribueixen i reforcen aquests 4 RA al llarg del curs — la correspondència entre blocs i RA es mostra a cada taula.


RA1 — Aplica tècniques d'anàlisi de dades identificant conceptes fonamentals i construint conjunts de dades complexes

CA Descripció Blocs AC Pràctica Prova
CA1.1 Identifica conceptes bàsics de matemàtica discreta, lògica algorísmica i complexitat computacional. Bloc 1 AC5074/01/01 PE
CA1.2 Extreu informació de grans volums de dades. Bloc 1, Bloc 2 AC5074/01/01, AC5074/02/01 a 02/05 PR507402 PE
CA1.3 Combina diferents fonts i tipus de dades. Bloc 1, Bloc 6 AC5074/01/02, AC5074/06/01 PR507406 PE
CA1.4 Construeix conjunts de dades complexes. Bloc 1 AC5074/01/02 PR507401
CA1.5 Estableix objectius i prioritats, seqüenciació i organització del temps. Bloc 1 AC5074/01/03 PR507401
CA1.6 Selecciona i integra sistemes d'informació. Bloc 1, Bloc 6 AC5074/01/03, AC5074/06/01 PR507401, PR507406 PE
CA1.7 Determina criteris de cost i qualitat per a Big Data. Bloc 1, Bloc 2 AC5074/01/02, AC5074/02/01 PR507402 PE

Ponderació oficial RA1: 27%


RA2 — Configura quadres de comandament en entorns computacionals utilitzant tècniques predictives

CA Descripció Blocs AC Pràctica Prova
CA2.1 Classifica biblioteques i implementacions de representació d'informació. Bloc 7 AC5074/07/01, AC5074/07/02 PR507407
CA2.2 Creua informació sobre l'objectiu i la naturalesa de les dades. Bloc 7 AC5074/07/01 PR507407
CA2.3 Fa un quadre de comandament amb tècniques adequades. Bloc 7 AC5074/07/03, AC5074/07/04 PR507407
CA2.4 Utilitza tècniques predictives complexes.
CA2.5 Avalua l'impacte de l'anàlisi de dades. Bloc 7 AC5074/07/04 PR507407

Ponderació oficial RA2: 15%

CA2.4 pendent de cobertura explícita

Cap dels 7 blocs actuals etiqueta cap activitat amb CA2.4 (tècniques predictives complexes: regressió, forecasting). És el principal buit detectat en aquesta auditoria. Es recomana ampliar el Bloc 7 (Power BI/Metabase) amb una activitat de mesures predictives, o el Bloc 5 amb un cas de qualitat predictiva de dades.


RA3 — Gestiona i emmagatzema dades en grans conjunts extraient valor de diverses fonts

CA Descripció Blocs AC Pràctica Prova
CA3.1 Extreu i emmagatzema dades de diverses fonts. Bloc 3, Bloc 4, Bloc 5 AC5074/03/01, AC5074/04/01, AC5074/05/01 PR507403, PR507404, PR507405 PE
CA3.2 Fixa l'objectiu d'extreure valor de les dades. Bloc 3, Bloc 4, Bloc 5 AC5074/03/02, AC5074/04/03, AC5074/05/01 PR507403, PR507404, PR507405
CA3.3 Comprova requisits d'emmagatzematge massiu. Bloc 2, Bloc 3, Bloc 4, Bloc 6 AC5074/02/02, AC5074/03/04, AC5074/04/01, AC5074/06/02 PR507402, PR507403, PR507404, PR507406 PE
CA3.4 Desenvolupa sistemes de gestió i processament de grans volums. Bloc 2, Bloc 3, Bloc 4, Bloc 5 AC5074/02/03, AC5074/03/03, AC5074/04/02, AC5074/05/02 PR507402, PR507403, PR507404, PR507405 PE
CA3.5 Fa servir habilitats científiques en entorns multidisciplinars. Bloc 5 AC5074/05/03, AC5074/05/04 PR507405

Ponderació oficial RA3: 43%


RA4 — Aplica eines per a la visualització de dades valorant les tipologies i aplicacions de BI

CA Descripció Blocs AC Pràctica Prova
CA4.1 Examina escenaris i tipologies de dades no estructurades.
CA4.2 Implanta aplicació de BI per a l'extracció de valor. Bloc 7 AC5074/07/03, AC5074/07/04 PR507407
CA4.3 Reconeix la importància d'emmagatzemar de forma distribuïda. Bloc 4 AC5074/04/06, AC5074/04/07 PR507404 PE
CA4.4 Determina diferències entre aplicacions de processament de dades. Bloc 4 AC5074/04/04, AC5074/04/05 PR507404 PE
CA4.5 Comprova la manera de programar i processar l'estructura de dades. Bloc 6 AC5074/06/03 PR507406
CA4.6 Valora les maneres de visualitzar les dades. Bloc 7 AC5074/07/01, AC5074/07/02 PR507407

Ponderació oficial RA4: 15%

CA4.1 pendent de cobertura explícita

El Bloc 3 (MongoDB) treballa dades semiestructurades, però cap activitat etiqueta explícitament CA4.1 (escenaris i tipologies de dades no estructurades: text, imatge, àudio, logs). Es recomana afegir una activitat al Bloc 3 o al Bloc 6 que tracti explícitament aquesta tipologia.


Resum de ponderacions

RA Pes oficial Instruments principals
RA1 27% AC (Bloc 1, Bloc 2) + PR507401 + PR507402
RA2 15% AC (Bloc 7) + PR507407
RA3 43% AC (Bloc 2 a Bloc 6) + PR507402 a PR507406
RA4 15% AC (Bloc 4, Bloc 6, Bloc 7) + PR507404, PR507406, PR507407
TOTAL 100%

Condició de superació

Per superar el mòdul, cadascun dels 4 RA oficials ha d'obtenir una nota igual o superior a 5 sobre 10. No es pot compensar un RA suspès amb la nota alta d'un altre RA.


Pes per bloc temàtic

Aquesta és la distribució didàctica en 7 blocs que organitza el dia a dia de l'aula (vegeu Programació d'aula). Cada bloc reforça un o més RA oficials, tal com s'indica a les taules anteriors.

Bloc RA reforçats Pràctica avaluable Pes en la nota final
1 — Introducció al Big Data RA1 PR507401 9%
2 — Dades relacionals a gran escala RA1, RA3 PR507402 18%
3 — Dades no relacionals — MongoDB RA3 PR507403 15%
4 — Arquitectura de dades RA3, RA4 PR507404 21%
5 — ETL i pipelines RA3 PR507405 12%
6 — Formats de dades RA1, RA3, RA4 PR507406 9%
7 — Visualització de dades RA2, RA4 PR507407 15%

Taula d'activitats (AC)

Codi Bloc Fitxer Descripció breu
AC5074/01/01 Bloc 1 Les 5V del Big Data Cerca de tres casos reals de Big Data i presentació a l'aula
AC5074/01/02 Bloc 1 Arquitectures generals Anàlisi de tres ofertes de feina de Big Data i identificació de les eines més demandades
AC5074/01/03 Bloc 1 Perfils professionals Diagrama comparatiu d'arquitectures de dades
AC5074/02/01 Bloc 2 Índexs avançats Creació i comparativa d'índexs sobre una taula de 5 milions de registres en Docker
AC5074/02/02 Bloc 2 Particionament Lectura i interpretació de plans EXPLAIN ANALYZE sobre consultes reals
AC5074/02/03 Bloc 2 Optimització de queries Creació d'una taula de transaccions particionada per rang de data
AC5074/02/04 Bloc 2 Replicació Reescriptura de cinc queries lentes identificades amb pg_stat_statements
AC5074/02/05 Bloc 2 Replicació Muntatge d'un clúster primary-réplica amb Docker Compose
AC5074/03/01 Bloc 3 Fonaments de MongoDB Instal·lació i exploració de MongoDB en Docker; inserció del primer document
AC5074/03/02 Bloc 3 Queries i CRUD Consultes CRUD sobre una col·lecció de productes d'e-commerce amb 100.000 documents
AC5074/03/03 Bloc 3 Aggregation Pipeline Pipeline per calcular les vendes per categoria i les 10 ciutats amb més comandes
AC5074/03/04 Bloc 3 Índexs i rendiment Disseny de l'esquema per a una aplicació de gestió d'esdeveniments
AC5074/03/05 Bloc 3 Índexs i rendiment Creació d'índexs i mesura del seu impacte amb explain
AC5074/04/01 Bloc 4 AWS per a Big Data Exploració de la consola AWS: creació d'un bucket S3 i estimació de costos
AC5074/04/02 Bloc 4 Azure per a Big Data Configuració d'una instància RDS PostgreSQL i comparativa de costos amb EC2
AC5074/04/03 Bloc 4 Data Warehouse Disseny d'una arquitectura lakehouse per a una empresa de logística sobre AWS
AC5074/04/04 Bloc 4 Azure per a Big Data Exploració del portal Azure: creació d'un Storage Account
AC5074/04/05 Bloc 4 Azure per a Big Data Disseny d'una arquitectura de dades sobre Azure per a un cas d'ús retail
AC5074/04/06 Bloc 4 Data Warehouse Modelatge dimensional d'un DW de vendes: fets, dimensions i granularitat
AC5074/04/07 Bloc 4 Data Lake i Lakehouse Comparativa de costos i capacitats AWS vs Azure per a un cas real
AC5074/05/01 Bloc 5 ETL vs ELT Comparativa d'eines ETL/ELT: característiques, llicències i casos d'ús
AC5074/05/02 Bloc 5 Apache Airflow Primer DAG en Airflow: extracció i càrrega de dades meteorològiques
AC5074/05/03 Bloc 5 Qualitat de dades DAG amb branching condicionat i gestió d'errors
AC5074/05/04 Bloc 5 ETL i pipelines Implementació de checks de qualitat de dades sobre un dataset real
AC5074/06/01 Bloc 6 Formats tabulars Lectura i comparativa de rendiment entre CSV i JSON sobre 1 milió de files
AC5074/06/02 Bloc 6 Formats columnar Benchmark de lectura/escriptura CSV vs Parquet
AC5074/06/03 Bloc 6 Formats d'evolució Benchmark complet de formats: CSV, JSON, Parquet, Avro
AC5074/07/01 Bloc 7 Principis de visualització Anàlisi de cinc visualitzacions deficients i proposta de redisseny justificada
AC5074/07/02 Bloc 7 Biblioteques Python Galeria de 8 visualitzacions sobre un dataset de mobilitat urbana
AC5074/07/03 Bloc 7 Power BI Connexió de Power BI a un CSV i creació d'un informe bàsic amb 4 visualitzacions
AC5074/07/04 Bloc 7 Power BI Dashboard complet amb model de dades, KPIs i gràfics interactius