Salta el contingut

Rúbrica PR507408 — Auditoria de biaix i correcció de desequilibri

Aquesta rúbrica s'aplica a la pràctica PR507408 — Auditoria de biaix i correcció de desequilibri del Bloc 8 del mòdul M5074 Sistemes de Big Data.

Nota final de la pràctica = suma ponderada dels quatre criteris (total 100 punts → escala 0-10).


Criteris d'avaluació

Criteri 1 — Mesura del biaix previ a l'entrenament (30%)

Avalua la correcció del càlcul de CI i DPL i la qualitat de la interpretació (Part 2).

Nivell Puntuació Descriptor
Excel·lent 27-30 pts El càlcul de CI i DPL és correcte i el codi és clar. La interpretació identifica amb precisió quin grup està infrarepresentat i quina és la diferència en la taxa de concessió, relacionant tots dos resultats amb el concepte de biaix explicat al bloc. La resposta argumenta de forma fonamentada quin dels dos problemes (CI o DPL) és més greu en aquest cas concret.
21-26 pts El càlcul de CI i DPL és correcte. La interpretació identifica el grup infrarepresentat i la diferència de taxes, però l'argumentació de quin problema és més greu és superficial o no es fonamenta als valors obtinguts.
Suficient 15-20 pts El càlcul de CI o DPL conté algun error menor, o la interpretació es limita a descriure els números sense relacionar-los amb el concepte de biaix.
Insuficient 0-14 pts Els càlculs de CI i/o DPL són incorrectes o absents. No hi ha interpretació, o la interpretació és incorrecta.

Criteri 2 — Aplicació de tècniques de correcció (35%)

Avalua la implementació correcta d'oversampling, undersampling i SMOTE (Part 3).

Nivell Puntuació Descriptor
Excel·lent 32-35 pts Les tres tècniques (oversampling, undersampling, SMOTE) estan implementades correctament i produeixen la distribució de classes esperada. La codificació de variables categòriques prèvia a SMOTE és correcta. La taula comparativa final és completa, correcta i inclou una distinció clara entre dades duplicades, eliminades i sintètiques per a cada tècnica.
25-31 pts Les tres tècniques estan implementades i funcionen correctament, però la taula comparativa té alguna mancança (per exemple, no distingeix clarament entre duplicació i generació sintètica).
Suficient 18-24 pts Almenys dues de les tres tècniques estan implementades correctament. La taula comparativa existeix però és incompleta.
Insuficient 0-17 pts Menys de dues tècniques implementades correctament, o el codi no s'executa. No hi ha taula comparativa.

Criteri 3 — Qualitat del codi i reproductibilitat (15%)

Avalua l'organització, claredat i reproductibilitat del notebook o script.

Nivell Puntuació Descriptor
Excel·lent 14-15 pts El codi està organitzat per parts, segueix l'estructura de la pràctica, s'executa de dalt a baix sense errors, i les sortides rellevants (taules, distribucions) són visibles al lliurament. S'usa una llavor aleatòria fixa (random_state) per garantir la reproductibilitat.
11-13 pts El codi s'executa correctament i les sortides són visibles, però l'organització o els comentaris són millorables.
Suficient 8-10 pts El codi funciona parcialment o requereix petites correccions per executar-se de dalt a baix.
Insuficient 0-7 pts El codi no s'executa o falten parts substancials.

Criteri 4 — Informe de conclusions (20%)

Avalua la qualitat comunicativa de l'informe final adreçat a un perfil de negoci (Part 4).

Nivell Puntuació Descriptor
Excel·lent 18-20 pts L'informe respon les tres preguntes amb claredat, sense llenguatge tècnic innecessari. La recomanació de tècnica de correcció està justificada amb arguments específics (no genèrics) i el risc de no corregir el biaix es descriu de forma concreta i versemblant, no com una afirmació general.
14-17 pts L'informe respon les tres preguntes correctament, però alguna resposta és genèrica o té encara massa llenguatge tècnic per al perfil de negoci indicat.
Suficient 10-13 pts L'informe respon les preguntes de forma molt breu o incompleta.
Insuficient 0-9 pts L'informe no respon les preguntes plantejades o és inexistent.

Taula de conversió de puntuació a nota

Puntuació (sobre 100) Nota (sobre 10) Qualificació
90 - 100 9,0 - 10 Excel·lent
80 - 89 8,0 - 8,9 Notable alt
70 - 79 7,0 - 7,9 Notable baix
60 - 69 6,0 - 6,9
50 - 59 5,0 - 5,9 Suficient
0 - 49 0 - 4,9 Insuficient (no superat)

La nota mínima per superar la pràctica és 5,0 (50 punts sobre 100).


Criteris de no presentació i plagi

Causes d'avaluació com a no presentat (NP)

Les situacions següents comporten la qualificació de No Presentat (NP) independentment del contingut de la pràctica:

  • No lliurar el notebook/script dins el termini establert al Campus Virtual sense causa justificada prèvia.
  • No incloure cap de les tres tècniques de correcció (oversampling, undersampling, SMOTE).
  • No incloure l'informe de conclusions de la Part 4.

Política de plagi i ús d'IA generativa

  • Copiar codi o text d'altres treballs sense citar-los és plagi i comporta una nota de 0 i l'obertura d'un expedient acadèmic.
  • L'ús d'IA generativa com a assistent de codi (per exemple, per recordar la sintaxi d'una funció de imbalanced-learn) és permès. L'ús d'IA generativa per redactar l'informe de conclusions complet sense elaboració pròpia és equivalent al plagi.
  • El professorat pot convocar l'alumne a una defensa oral breu de la pràctica per verificar-ne la comprensió.

Pes de la pràctica en la qualificació final del mòdul

Element Pes
PR507408 — Auditoria de biaix i correcció de desequilibri A criteri del professorat (activitat de reforç/ampliació; el Bloc 8 no forma part del repartiment oficial de les 99h del currículum)

Consulta la Programació del mòdul per al repartiment oficial d'hores i pesos per RA.


Rúbrica PR507408 | Mòdul M5074 Sistemes de Big Data | Institut Sa Palomera (Blanes) | Curs CEIABD 2026-2027