Rúbrica PR507408 — Auditoria de biaix i correcció de desequilibri

Aquesta rúbrica s'aplica a la pràctica PR507408 — Auditoria de biaix i correcció de desequilibri del Bloc 8 del mòdul M5074 Sistemes de Big Data.

Nota final de la pràctica = suma ponderada dels quatre criteris (total 100 punts → escala 0-10).

Criteris d'avaluació

Avalua la correcció del càlcul de CI i DPL i la qualitat de la interpretació (Part 2).

Nivell	Puntuació	Descriptor
Excel·lent	27-30 pts	El càlcul de CI i DPL és correcte i el codi és clar. La interpretació identifica amb precisió quin grup està infrarepresentat i quina és la diferència en la taxa de concessió, relacionant tots dos resultats amb el concepte de biaix explicat al bloc. La resposta argumenta de forma fonamentada quin dels dos problemes (CI o DPL) és més greu en aquest cas concret.
Bé	21-26 pts	El càlcul de CI i DPL és correcte. La interpretació identifica el grup infrarepresentat i la diferència de taxes, però l'argumentació de quin problema és més greu és superficial o no es fonamenta als valors obtinguts.
Suficient	15-20 pts	El càlcul de CI o DPL conté algun error menor, o la interpretació es limita a descriure els números sense relacionar-los amb el concepte de biaix.
Insuficient	0-14 pts	Els càlculs de CI i/o DPL són incorrectes o absents. No hi ha interpretació, o la interpretació és incorrecta.

Avalua la implementació correcta d'oversampling, undersampling i SMOTE (Part 3).

Nivell	Puntuació	Descriptor
Excel·lent	32-35 pts	Les tres tècniques (oversampling, undersampling, SMOTE) estan implementades correctament i produeixen la distribució de classes esperada. La codificació de variables categòriques prèvia a SMOTE és correcta. La taula comparativa final és completa, correcta i inclou una distinció clara entre dades duplicades, eliminades i sintètiques per a cada tècnica.
Bé	25-31 pts	Les tres tècniques estan implementades i funcionen correctament, però la taula comparativa té alguna mancança (per exemple, no distingeix clarament entre duplicació i generació sintètica).
Suficient	18-24 pts	Almenys dues de les tres tècniques estan implementades correctament. La taula comparativa existeix però és incompleta.
Insuficient	0-17 pts	Menys de dues tècniques implementades correctament, o el codi no s'executa. No hi ha taula comparativa.

Avalua l'organització, claredat i reproductibilitat del notebook o script.

Nivell	Puntuació	Descriptor
Excel·lent	14-15 pts	El codi està organitzat per parts, segueix l'estructura de la pràctica, s'executa de dalt a baix sense errors, i les sortides rellevants (taules, distribucions) són visibles al lliurament. S'usa una llavor aleatòria fixa (`random_state`) per garantir la reproductibilitat.
Bé	11-13 pts	El codi s'executa correctament i les sortides són visibles, però l'organització o els comentaris són millorables.
Suficient	8-10 pts	El codi funciona parcialment o requereix petites correccions per executar-se de dalt a baix.
Insuficient	0-7 pts	El codi no s'executa o falten parts substancials.

Avalua la qualitat comunicativa de l'informe final adreçat a un perfil de negoci (Part 4).

Nivell	Puntuació	Descriptor
Excel·lent	18-20 pts	L'informe respon les tres preguntes amb claredat, sense llenguatge tècnic innecessari. La recomanació de tècnica de correcció està justificada amb arguments específics (no genèrics) i el risc de no corregir el biaix es descriu de forma concreta i versemblant, no com una afirmació general.
Bé	14-17 pts	L'informe respon les tres preguntes correctament, però alguna resposta és genèrica o té encara massa llenguatge tècnic per al perfil de negoci indicat.
Suficient	10-13 pts	L'informe respon les preguntes de forma molt breu o incompleta.
Insuficient	0-9 pts	L'informe no respon les preguntes plantejades o és inexistent.

La nota mínima per superar la pràctica és 5,0 (50 punts sobre 100).

Causes d'avaluació com a no presentat (NP)

Les situacions següents comporten la qualificació de No Presentat (NP) independentment del contingut de la pràctica:

No lliurar el notebook/script dins el termini establert al Campus Virtual sense causa justificada prèvia.
No incloure cap de les tres tècniques de correcció (oversampling, undersampling, SMOTE).
No incloure l'informe de conclusions de la Part 4.

Política de plagi i ús d'IA generativa

Copiar codi o text d'altres treballs sense citar-los és plagi i comporta una nota de 0 i l'obertura d'un expedient acadèmic.
L'ús d'IA generativa com a assistent de codi (per exemple, per recordar la sintaxi d'una funció de imbalanced-learn) és permès. L'ús d'IA generativa per redactar l'informe de conclusions complet sense elaboració pròpia és equivalent al plagi.
El professorat pot convocar l'alumne a una defensa oral breu de la pràctica per verificar-ne la comprensió.

Element	Pes
PR507408 — Auditoria de biaix i correcció de desequilibri	A criteri del professorat (activitat de reforç/ampliació; el Bloc 8 no forma part del repartiment oficial de les 99h del currículum)

Consulta la Programació del mòdul per al repartiment oficial d'hores i pesos per RA.

Rúbrica PR507408 | Mòdul M5074 Sistemes de Big Data | Institut Sa Palomera (Blanes) | Curs CEIABD 2026-2027