Mòdul 5072 — Sistemes d'Aprenentatge Automàtic
Proposta didàctica
El mòdul 5072 - Sistemes d'Aprenentatge Automàtic (66 hores) introdueix l'alumnat en el cor de la intel·ligència artificial moderna: la capacitat que tenen les màquines d'aprendre a partir de dades sense ser explícitament programades per a cada tasca. En un món on GPT-4o genera text indistingible de l'humà, AlphaFold prediu estructures proteiques d'importància mèdica i els sistemes de recomanació de Netflix o Spotify influencien milions de decisions diàries, entendre els mecanismes d'aprenentatge automàtic és una competència professional imprescindible.
El mòdul cobreix des dels fonaments filosòfics —la distinció entre IA forta i feble— fins a la implementació pràctica de xarxes neuronals profundes amb PyTorch, passant per algoritmes clàssics de scikit-learn, tècniques d'avaluació rigoroses i eines MLOps de producció. L'enfocament és eminentment pràctic: cada concepte teòric s'il·lustra amb codi Python funcional i exemples del món professional real.
Resultats d'Aprenentatge coberts:
- RA1 — Caracteritza la IA forta i feble determinant usos i possibilitats
- RA2 — Determina tècniques i eines de ML testejant l'aplicabilitat
- RA3 — Aplica algoritmes a l'aprenentatge supervisat optimitzant el model
- RA4 — Aplica tècniques d'aprenentatge no supervisat
- RA5 — Aplica models computacionals de xarxes neuronals
- RA6 — Valora la qualitat dels resultats amb ML
Criteris d'avaluació
RA1 — IA Forta i Feble
- CA1.1 Determina les especificitats d'IA forta i feble
- CA1.2 Estableix les barreres entre IA i Machine Learning
- CA1.3 Diferencia àmbits d'aplicació de la IA forta i feble
- CA1.4 Identifica els problemes a què pot fer front la IA feble
- CA1.5 Identifica els problemes a què pot fer front la IA forta
- CA1.6 Reconeix els avantatges que proporciona cada tipus
RA2 — Tècniques i Eines de ML
- CA2.1 Identifica els principis de sistemes d'aprenentatge automàtic
- CA2.2 Determina tipus i usos de sistemes de ML
- CA2.3 Determina tècniques i eines de ML
- CA2.4 Troba diferències entre els tipus de ML
- CA2.5 Associa tècniques i eines a cada tipus de ML
RA3 — Aprenentatge Supervisat
- CA3.1 Proporciona les dades etiquetades al model
- CA3.2 Selecciona les dades d'entrada (entrenament, validació, test)
- CA3.3 Utilitza les dades a la fase d'entrenament
- CA3.4 Avalua el model amb les dades de validació
- CA3.5 Ajusta les dades d'aprenentatge supervisat
- CA3.6 Implementa el model per fer prediccions
- CA3.7 Detecta i minimitza els riscos associats al model
- CA3.8 Optimitza el model validant dades de prova
RA4 — Aprenentatge No Supervisat
- CA4.1 Caracteritza els tipus de problemes de l'aprenentatge no supervisat
- CA4.2 Caracteritza les tècniques d'aprenentatge no supervisat
- CA4.3 Avalua algoritmes d'aprenentatge no supervisat
- CA4.4 Optimitza el model no supervisat
RA5 — Xarxes Neuronals i Deep Learning
- CA5.1 Avalua els models neuronals per triar el més adequat
- CA5.2 Selecciona tècniques de deep learning
- CA5.3 Compara xarxes neuronals artificials amb altres mètodes
- CA5.4 Reconeix una xarxa de neurones entrenada
RA6 — Avaluació de la Qualitat
- CA6.1 Valora la conveniència dels algoritmes proposats
- CA6.2 Avalua l'aplicació pràctica dels principis de sistemes intel·ligents
- CA6.3 Integra principis fonamentals de la computació
- CA6.4 Desenvolupa sistemes i aplicacions que utilitzen tècniques intel·ligents
- CA6.5 Desenvolupa tècniques d'aprenentatge computacional per extreure informació de grans volums de dades
Continguts de referència
- Conceptes fonamentals d'IA: forta, feble, superintel·ligència
- Panorama del Machine Learning: evolució, estat de l'art 2025
- Ecosistema Python per a ML: scikit-learn, PyTorch, TensorFlow, XGBoost
- Aprenentatge supervisat: regressió, classificació, arbres, SVM
- Divisió de dades i validació creuada
- Overfitting, underfitting i regularització
- Optimització d'hiperparàmetres
- Feature engineering i preprocés de dades
- Aprenentatge no supervisat: clustering i reducció de dimensionalitat
- Detecció d'anomalies i sistemes de recomanació
- Xarxes neuronals artificials: perceptró, MLP, backpropagation
- Arquitectures deep learning: CNN, RNN, LSTM, Transformer
- Transfer learning i fine-tuning
- Mètriques d'avaluació per classificació, regressió i generació
- MLOps: monitorització, data drift i eines de gestió de models
Questionari inicial
Questionari inicial — Mòdul 5072
Respon aquestes preguntes per avaluar els teus coneixements previs. No és necessari encertar-les totes; serveixen per identificar on cal posar més atenció durant el mòdul.
- Quin és el principal element que distingeix el Machine Learning de la programació tradicional?
- Pots donar un exemple real d'IA feble (Narrow AI) que usis al dia a dia?
- Quin tipus d'aprenentatge es fa servir quan tenim dades etiquetades?
- Quina és la diferència entre un conjunt d'entrenament i un conjunt de test?
- Que significa que un model pateix d'overfitting?
- Quina biblioteca Python és el referent per a ML clàssic (no deep learning)?
- Quin framework domina la recerca en deep learning el 2025?
- Que és una neurona artificial i en quin concepte biològic s'inspira?
- Quin algoritme de clustering assigna cada punt al centroide més proper?
- Que significa AUC-ROC i per a quin tipus de problema s'utilitza?
- En quin context s'utilitza la reducció de dimensionalitat amb PCA?
- Quina diferència hi ha entre una CNN i una RNN en termes de tipus de dades que processen?
- Que és el transfer learning i per quin motiu és tan important a la pràctica?
- Que és la regularització L2 (Ridge) i com ajuda a evitar l'overfitting?
- Quina és la funció d'activació més usada a les capes ocultes de les xarxes neuronals modernes?
- Que és el gradient descent i quin paper té en l'entrenament de models?
- Pots explicar intuïtivament com funciona un arbre de decisió?
- Que és un hiperparàmetre? Posa'n dos exemples concrets.
- Que és el concept drift en un model en producció?
- Si haguessis de construir un sistema per detectar frau bancari, quin tipus d'aprenentatge escolliríes i per quin motiu?
Programació d'aula
| Sessió | Continguts | Activitats | CAs Treballats |
|---|---|---|---|
| 1 (3h) | Presentació del mòdul. IA forta vs feble. Panorama ML 2025 | Debat: casos d'ús reals. Test inicial | CA1.1, CA1.3 |
| 2 (3h) | IA feble: GPT-4, AlphaFold, sistemes de recomanació | Anàlisi de casos reals. Discussió AGI | CA1.2, CA1.4, CA1.6 |
| 3 (3h) | Tests de la IA: Turing, MMLU. Barreres IA-ML | Miniactivitat: comparar benchmarks actuals | CA1.5, CA1.6 |
| 4 (3h) | Ecosistema Python ML: scikit-learn, PyTorch. Tipus de ML | Instal·lació entorn. Primer notebook | CA2.1, CA2.3 |
| 5 (3h) | Supervisat vs no supervisat vs reforç | Exercici: classificar problemes per tipus de ML | CA2.2, CA2.4, CA2.5 |
| 6 (3h) | Pipeline supervisat: preprocés, entrenament, avaluació | AC5072/01: pipeline complet amb iris dataset | CA3.1, CA3.2, CA3.3 |
| 7 (3h) | Regressió lineal i logística. Matemàtica bàsica | Exercici: predicció de preus de cases | CA3.3, CA3.6 |
| 8 (3h) | Arbres de decisió, Random Forest, Gradient Boosting | AC5072/02: classificació de malalties cardíaques | CA3.3, CA3.5 |
| 9 (3h) | SVM, KNN. Comparativa d'algoritmes supervisats | Miniactivitat: benchmark de classificadors | CA2.5, CA3.4 |
| 10 (3h) | Overfitting i underfitting. Cross-validation | Diagnòstic visual. Corbes d'aprenentatge | CA3.7, CA3.8 |
| 11 (3h) | Feature engineering: escalat, encoding, imputació | Preprocés complet d'un dataset brut | CA3.5, CA6.3 |
| 12 (3h) | Optimització d'hiperparàmetres: GridSearch, Optuna | AC5072/03: optimització model fraude bancari | CA3.8, CA6.1 |
| 13 (3h) | Pràctica PR5072/01: ML amb scikit-learn i Docker | Sessió pràctica guiada (part 1) | CA3.1–CA3.8 |
| 14 (3h) | Pràctica PR5072/01: finalització i lliurament | Sessió pràctica guiada (part 2) | CA3.6, CA6.4 |
| 15 (3h) | Clustering: K-Means, DBSCAN, Hierarchical | AC5072/04: segmentació de clients | CA4.1, CA4.2 |
| 16 (3h) | Reducció de dimensionalitat: PCA, t-SNE, UMAP | Visualització de datasets d'alta dimensió | CA4.2, CA4.3 |
| 17 (3h) | Detecció d'anomalies. Self-supervised learning | Cas: detecció de frau no supervisada | CA4.3, CA4.4 |
| 18 (3h) | Xarxes neuronals: perceptró, MLP, backpropagation | Implementació MLP des de zero | CA5.1, CA5.3 |
| 19 (3h) | CNN, RNN, LSTM. Transformers i ViT | Comparativa arquitectures per tasca | CA5.1, CA5.2 |
| 20 (3h) | Transfer learning, LoRA, fine-tuning. PyTorch 2.2 | AC5072/05: fine-tuning ResNet per dataset propi | CA5.2, CA5.4 |
| 21 (3h) | Pràctica PR5072/02: Deep Learning amb Keras i Docker | Sessió pràctica guiada CNN | CA5.1–CA5.4 |
| 22 (3h) | Avaluació de models. MLOps. Repàs i síntesi | Projecte final: pipeline end-to-end | CA6.1–CA6.5 |
Panorama del ML el 2025
D'on venim: la revolució silenciosa
El Machine Learning ha passat de ser una disciplina acadèsmica esotèrica a una tecnologia que impregna cada aspecte de la vida moderna. El 2025, és difícil trobar un producte digital que no incorpori algun component d'aprenentatge automàtic, des del filtre de spam del correu electrònic fins als sistemes de conducció autònoma de Tesla o Waymo.
La revolució va tenir diverses etapes clau:
Dècada dels 90 — Els fonaments estadístics: Les màquines de vectors de suport (SVM) i les xarxes neuronals poc profundes oferien resultats competitius en classificació de text i imatge, però les limitacions computacionals i la manca de dades frenen el progrés.
2006-2012 — El renaixement del deep learning: Geoffrey Hinton, Yann LeCun i Yoshua Bengio (Premi Turing 2018) demostren que les xarxes neuronals profundes, preentrenades amb mètodes no supervisats, superen els algorismes clàssics. El 2012, AlexNet guanya ImageNet amb un marge sense precedents, iniciant la cursa armamentística de la visió per computador.
2017 — Attention Is All You Need: Google Brain publica l'arquitectura Transformer, que canvia per sempre el processament del llenguatge natural. La idea clau —el mecanisme d'atenció— permet processar seqüències en paral·lel i capturar dependències de llarg abast que les RNN no podien gestionar eficaçment.
2020-2023 — Els Large Language Models: GPT-3 (175B paràmetres), PaLM, LLaMA, Mistral i finalment GPT-4 i Claude 3 demostren capacitats emergents imprevistes: raonament matemàtic, programació, traducció multilingüe i comprensió de context llarg. El scaling law de Chinchilla estableix les proporcions òptimes entre mida del model i dades d'entrenament.
2024-2025 — Multimodalitat i agents: Els models actuals com GPT-4o, Gemini 1.5 Pro i Claude 3.5 Sonnet processen text, imatge, àudio i vídeo de manera integrada. Els sistemes d'agents IA, capaços d'executar seqüències d'accions autònomes, s'implementen en entorns de producció reals. La discussió sobre AGI s'intensifica a mesura que els benchmarks clàssics queden superats un darrere l'altre.
Estat de l'art 2025
timeline
title Evolució del Machine Learning
2012 : AlexNet guanya ImageNet
: GPU computing s'estabilitza
2017 : Transformer publicat
: BERT preentrenament
2020 : GPT-3 175B parametres
: Scaling laws descoberts
2022 : ChatGPT llancament
: Stable Diffusion difusio
2023 : GPT-4 multimodal
: LLaMA 2 open source
2024 : Gemini 1.5 Pro 1M context
: Claude 3.5 Sonnet
2025 : Models raonament (o1, R1)
: Agents autonoms en produccio
La relació entre IA, ML i Deep Learning
Una confusió habitual és tractar IA, ML i deep learning com a sinònims. En realitat, s'organitzen en cercles concèntrics:
graph TD
IA["Intel·ligència Artificial<br/>(qualsevol sistema que simula intel·ligencia)"]
ML["Machine Learning<br/>(aprèn de dades sense ser programat explícitament)"]
DL["Deep Learning<br/>(xarxes neuronals profundes)"]
GEN["IA Generativa<br/>(LLMs, Difusió, Multimodal)"]
IA --> ML
ML --> DL
DL --> GEN
style IA fill:#1a3a5c,color:#fff
style ML fill:#1a5c3a,color:#fff
style DL fill:#5c3a1a,color:#fff
style GEN fill:#5c1a3a,color:#fff
La Intel·ligència Artificial és el camp més ampli: abasta qualsevol sistema que imita comportaments intel·ligents, des dels sistemes experts basats en regles dels anys 80 fins als LLMs actuals.
El Machine Learning és un subconjunt de la IA que se centra en sistemes que aprenen patrons a partir de dades. En lloc de programar regles explícites, el model extreu automàticament les regularitats del dataset. Això inclou algoritmes com la regressió logística, els arbres de decisió, les màquines de vectors de suport i el clustering.
El Deep Learning és un subconjunt del ML basat en xarxes neuronals artificials amb moltes capes (d'aquí el "profund"). Permet aprendre representacions jeràrquiques de les dades: les primeres capes detecten patrons simples (vores en una imatge), les intermèdies combinen patrons (textures, formes) i les finals reconeixen conceptes d'alt nivell (objectes, persones, escenes).
La IA Generativa és el subconjunt del deep learning que ha dominat el 2023-2025: models que generen contingut nou —text, imatge, àudio, codi, vídeo— indistingible del contingut humà.
L'ecosistema Python per a ML
Python s'ha convertit en la lingua franca del Machine Learning per una confluència de factors: sintaxi clara, comunitat activa, ecosistema de biblioteques madur i integració excel·lent amb els frameworks de deep learning.
scikit-learn 1.4+ continua sent el referent per a ML clàssic. Ofereix una API consistent i ben documentada per a tots els algoritmes supervisats i no supervisats, amb integració nativa de pipelines, cross-validation i optimització d'hiperparàmetres. La versió 1.4 incorpora millores de rendiment significatives i nous estimadors com HistGradientBoostingRegressor.
PyTorch 2.2+ domina la recerca en deep learning amb una quota superior al 80% als papers d'arXiv. El seu paradigma d'execució dinàmica (eager mode) facilita el debugging, mentre que torch.compile() (introduït a la versió 2.0) permet optimitzar automàticament el codi per a producció sense sacrificar la flexibilitat. PyTorch és el backend de Hugging Face, FastAI i la majoria de frameworks d'agents IA.
TensorFlow/Keras 3.0 manté presència significativa en entorns de producció empresarial i desplegament en dispositius mòbils (TFLite). Keras 3.0 es torna agnòstica del backend: pot executar-se sobre PyTorch, TensorFlow o JAX, cosa que amplia considerablement la seva versatilitat.
XGBoost / LightGBM / CatBoost segueixen sent els algoritmes guanyadors de competicions Kaggle per a dades tabulars. El Gradient Boosting amb arbres de decisió supera freqüentment les xarxes neuronals en datasets de mida mitjana amb features tabulars.
Hugging Face Transformers proporciona accés a milers de models preentrenats —BERT, RoBERTa, GPT-2, LLaMA, Mistral, Falcon— amb una API unificada. La biblioteca datasets simplifica la càrrega i el preprocés de datasets estàndard.
# Exemple: comparació d'ecosistemes per tasca
tasques_i_eines = {
"Classificació tabular (fins 100K files)": ["XGBoost", "LightGBM", "scikit-learn RF"],
"Classificació tabular (>100K files)": ["XGBoost", "CatBoost", "PyTorch MLP"],
"Visió per computador": ["PyTorch + torchvision", "Keras + EfficientNet"],
"NLP - classificació text": ["Hugging Face BERT", "scikit-learn TF-IDF+LR"],
"NLP - generació text": ["PyTorch + Transformers", "llama.cpp (CPU)"],
"Clustering i reducció dim.": ["scikit-learn", "UMAP"],
"Detecció d'anomalies": ["scikit-learn IsolationForest", "PyOD"],
"Series temporals": ["statsmodels", "Prophet", "PyTorch + LSTM"],
}
for tasca, eines in tasques_i_eines.items():
print(f"\n{tasca}:")
for eina in eines:
print(f" - {eina}")
Quin framework has d'aprendre primer?
Si estàs a l'inici del teu camí en ML, la prioritat hauria de ser: scikit-learn per als fonaments i algoritmes clàssics, PyTorch per al deep learning, i Hugging Face per aprofitar models preentrenats d'estat de l'art. Aprendre scikit-learn t'ensenyarà els conceptes fonamentals (pipeline, cross-validation, mètriques) que s'apliquen a tots els frameworks.
Recursos recomanats per al mòdul
- Documentació oficial scikit-learn
- PyTorch Tutorials
- Hugging Face Course
- Kaggle Learn — cursos gratuïts amb notebooks interactius
- Papers With Code — papers amb codi reproducible i benchmarks
Estructura del mòdul
El mòdul s'organitza en cinc blocs temàtics interconnectats:
Bloc 1: Fonaments i panorama (sessions 1-5)
- IA Forta i Feble: distinció filosòfica i pràctica, casos reals 2025, la discussió AGI
- Tipus de Machine Learning i quan aplicar cadascun
Bloc 2: Aprenentatge Supervisat (sessions 6-14)
- Aprenentatge Supervisat: pipeline complet, algoritmes principals, overfitting, hiperparàmetres
- Pràctica PR5072/01: ML amb scikit-learn i Docker
Bloc 3: Aprenentatge No Supervisat (sessions 15-17)
- Aprenentatge No Supervisat: clustering, reducció de dimensionalitat, anomalies
Bloc 4: Xarxes Neuronals i Deep Learning (sessions 18-21)
- Xarxes Neuronals i Deep Learning: arquitectures actuals, PyTorch, transfer learning
- Pràctica PR5072/02: Deep Learning amb Keras i Docker
Bloc 5: Avaluació i qualitat (sessió 22)
- Avaluació de Models: mètriques, validació, MLOps, monitorització
Activitats del mòdul
| Codi | Activitat | Bloc | Hores estimades |
|---|---|---|---|
| AC5072/01 | Pipeline complet amb Iris i Wine datasets | Supervisat | 2h |
| AC5072/02 | Classificació malalties cardíaques (Heart Disease UCI) | Supervisat | 3h |
| AC5072/03 | Optimització d'hiperparàmetres amb Optuna | Supervisat | 2h |
| AC5072/04 | Segmentació de clients amb clustering | No supervisat | 3h |
| AC5072/05 | Fine-tuning ResNet50 per dataset personalitzat | Deep Learning | 4h |
| PR5072/01 | Pràctica Docker: ML amb scikit-learn | Supervisat | 6h |
| PR5072/02 | Pràctica Docker: Deep Learning amb Keras/PyTorch | Deep Learning | 6h |
Miniactivitat — Identificació de sistemes ML
Fes una llista de 10 aplicacions o serveis digitals que fas servir habitualment (telèfon mòbil, streaming, e-commerce, xarxes socials, banca...). Per a cada un, intenta identificar:
- Quina funcionalitat sembla basada en ML?
- Quin tipus d'aprenentatge (supervisat, no supervisat, reforç) creus que utilitzen?
- Quines dades hauran necessitat per entrenar el model?
Comparteix les teves respostes amb la classe per comparar hipòtesis.