Rúbrica PR507408 — Auditoria de biaix i correcció de desequilibri
Aquesta rúbrica s'aplica a la pràctica PR507408 — Auditoria de biaix i correcció de desequilibri del Bloc 8 del mòdul M5074 Sistemes de Big Data.
Nota final de la pràctica = suma ponderada dels quatre criteris (total 100 punts → escala 0-10).
Criteris d'avaluació
Criteri 1 — Mesura del biaix previ a l'entrenament (30%)
Avalua la correcció del càlcul de CI i DPL i la qualitat de la interpretació (Part 2).
| Nivell | Puntuació | Descriptor |
|---|---|---|
| Excel·lent | 27-30 pts | El càlcul de CI i DPL és correcte i el codi és clar. La interpretació identifica amb precisió quin grup està infrarepresentat i quina és la diferència en la taxa de concessió, relacionant tots dos resultats amb el concepte de biaix explicat al bloc. La resposta argumenta de forma fonamentada quin dels dos problemes (CI o DPL) és més greu en aquest cas concret. |
| Bé | 21-26 pts | El càlcul de CI i DPL és correcte. La interpretació identifica el grup infrarepresentat i la diferència de taxes, però l'argumentació de quin problema és més greu és superficial o no es fonamenta als valors obtinguts. |
| Suficient | 15-20 pts | El càlcul de CI o DPL conté algun error menor, o la interpretació es limita a descriure els números sense relacionar-los amb el concepte de biaix. |
| Insuficient | 0-14 pts | Els càlculs de CI i/o DPL són incorrectes o absents. No hi ha interpretació, o la interpretació és incorrecta. |
Criteri 2 — Aplicació de tècniques de correcció (35%)
Avalua la implementació correcta d'oversampling, undersampling i SMOTE (Part 3).
| Nivell | Puntuació | Descriptor |
|---|---|---|
| Excel·lent | 32-35 pts | Les tres tècniques (oversampling, undersampling, SMOTE) estan implementades correctament i produeixen la distribució de classes esperada. La codificació de variables categòriques prèvia a SMOTE és correcta. La taula comparativa final és completa, correcta i inclou una distinció clara entre dades duplicades, eliminades i sintètiques per a cada tècnica. |
| Bé | 25-31 pts | Les tres tècniques estan implementades i funcionen correctament, però la taula comparativa té alguna mancança (per exemple, no distingeix clarament entre duplicació i generació sintètica). |
| Suficient | 18-24 pts | Almenys dues de les tres tècniques estan implementades correctament. La taula comparativa existeix però és incompleta. |
| Insuficient | 0-17 pts | Menys de dues tècniques implementades correctament, o el codi no s'executa. No hi ha taula comparativa. |
Criteri 3 — Qualitat del codi i reproductibilitat (15%)
Avalua l'organització, claredat i reproductibilitat del notebook o script.
| Nivell | Puntuació | Descriptor |
|---|---|---|
| Excel·lent | 14-15 pts | El codi està organitzat per parts, segueix l'estructura de la pràctica, s'executa de dalt a baix sense errors, i les sortides rellevants (taules, distribucions) són visibles al lliurament. S'usa una llavor aleatòria fixa (random_state) per garantir la reproductibilitat. |
| Bé | 11-13 pts | El codi s'executa correctament i les sortides són visibles, però l'organització o els comentaris són millorables. |
| Suficient | 8-10 pts | El codi funciona parcialment o requereix petites correccions per executar-se de dalt a baix. |
| Insuficient | 0-7 pts | El codi no s'executa o falten parts substancials. |
Criteri 4 — Informe de conclusions (20%)
Avalua la qualitat comunicativa de l'informe final adreçat a un perfil de negoci (Part 4).
| Nivell | Puntuació | Descriptor |
|---|---|---|
| Excel·lent | 18-20 pts | L'informe respon les tres preguntes amb claredat, sense llenguatge tècnic innecessari. La recomanació de tècnica de correcció està justificada amb arguments específics (no genèrics) i el risc de no corregir el biaix es descriu de forma concreta i versemblant, no com una afirmació general. |
| Bé | 14-17 pts | L'informe respon les tres preguntes correctament, però alguna resposta és genèrica o té encara massa llenguatge tècnic per al perfil de negoci indicat. |
| Suficient | 10-13 pts | L'informe respon les preguntes de forma molt breu o incompleta. |
| Insuficient | 0-9 pts | L'informe no respon les preguntes plantejades o és inexistent. |
Taula de conversió de puntuació a nota
| Puntuació (sobre 100) | Nota (sobre 10) | Qualificació |
|---|---|---|
| 90 - 100 | 9,0 - 10 | Excel·lent |
| 80 - 89 | 8,0 - 8,9 | Notable alt |
| 70 - 79 | 7,0 - 7,9 | Notable baix |
| 60 - 69 | 6,0 - 6,9 | Bé |
| 50 - 59 | 5,0 - 5,9 | Suficient |
| 0 - 49 | 0 - 4,9 | Insuficient (no superat) |
La nota mínima per superar la pràctica és 5,0 (50 punts sobre 100).
Criteris de no presentació i plagi
Causes d'avaluació com a no presentat (NP)
Les situacions següents comporten la qualificació de No Presentat (NP) independentment del contingut de la pràctica:
- No lliurar el notebook/script dins el termini establert al Campus Virtual sense causa justificada prèvia.
- No incloure cap de les tres tècniques de correcció (oversampling, undersampling, SMOTE).
- No incloure l'informe de conclusions de la Part 4.
Política de plagi i ús d'IA generativa
- Copiar codi o text d'altres treballs sense citar-los és plagi i comporta una nota de 0 i l'obertura d'un expedient acadèmic.
- L'ús d'IA generativa com a assistent de codi (per exemple, per recordar la sintaxi d'una funció de
imbalanced-learn) és permès. L'ús d'IA generativa per redactar l'informe de conclusions complet sense elaboració pròpia és equivalent al plagi. - El professorat pot convocar l'alumne a una defensa oral breu de la pràctica per verificar-ne la comprensió.
Pes de la pràctica en la qualificació final del mòdul
| Element | Pes |
|---|---|
| PR507408 — Auditoria de biaix i correcció de desequilibri | A criteri del professorat (activitat de reforç/ampliació; el Bloc 8 no forma part del repartiment oficial de les 99h del currículum) |
Consulta la Programació del mòdul per al repartiment oficial d'hores i pesos per RA.
Rúbrica PR507408 | Mòdul M5074 Sistemes de Big Data | Institut Sa Palomera (Blanes) | Curs CEIABD 2026-2027