Solucionari — Questionari inicial Mòdul 5071

Ús intern del docent — no publicar als alumnes.

Aquest document recull les respostes de referència del questionari inicial del Mòdul 5071. Les respostes estan redactades amb un nivell de detall suficient perquè el docent pugui avaluar el punt de partida de cada alumne i identificar conceptes que cal reforçar al llarg del curs. No s'espera que l'alumnat conegui tots els detalls en comenzar; el questionari té una finalitat diagnòstica.

Pregunta 1

Quan creus que es va encunyar per primera vegada el terme "intel·ligència artificial"? Qui ho va fer i en quin context?

El terme "intel·ligència artificial" va ser encunyat per John McCarthy l'any 1956 en el marc de la conferència de Dartmouth (Dartmouth Summer Research Project on Artificial Intelligence), celebrada al Dartmouth College de Hanover, New Hampshire. McCarthy, juntament amb Marvin Minsky, Nathaniel Rochester i Claude Shannon, va proposar l'estudi formal de la possibilitat que les màquines poguessin simular aspectes de la intel·ligència humana. Aquella conferència es considera l'acte fundacional de la IA com a disciplina científica independent. Anteriorment, Alan Turing ja havia plantejat la pregunta "Can machines think?" en el seu article de 1950, però sense usar l'etiqueta "artificial intelligence".

Pregunta 2

Quina diferència hi ha entre la IA forta (AGI) i la IA feble (Narrow AI)? Posa un exemple de cadascuna.

La IA feble o estreta (Narrow AI) és un sistema dissenyat per resoldre una tasca específica o un conjunt limitat de tasques, i no pot generalitzar les seves capacitats fora d'aquest àmbit. Exemples actuals d'IA feble inclouen els models de recomanació de Netflix, els filtres anti-spam o els assistents de veu com Siri. La IA forta o intel·ligència artificial general (AGI), en canvi, seria un sistema capaç d'entendre, aprendre i aplicar el coneixement de manera flexible en qualsevol domini intel·lectual, de la mateixa manera que ho fa un ésser humà. Fins avui, l'AGI no existeix: tots els sistemes desplegats comercialment, inclosos els LLMs actuals, pertanyen a la categoria de Narrow AI, malgrat l'amplitud aparent de les seves capacitats.

Pregunta 3

Explica amb les teves paraules en què consisteix el Test de Turing. Creus que superar-lo és suficient per demostrar que una màquina és "intel·ligent"?

El Test de Turing, proposat per Alan Turing el 1950 al seu article "Computing Machinery and Intelligence", consisteix en un joc d'imitació: un avaluador humà manté converses per text simultàniament amb un humà i amb una màquina, sense saber qui és qui; si l'avaluador no pot distingir de manera fiable quin dels dos interlocutors és la màquina, es considera que la màquina ha superat el test. Superar el test no és, però, una demostració suficient d'intel·ligència real: un sistema pot aprendre a imitar el llenguatge humà sense comprendre'n el significat (argument de l'Habitació Xinesa de Searle). De fet, models com GPT-4 han superat versions simplificades del test, però la comunitat científica continua debatent si això implica comprensió genuïna o únicament predicció estadística de text. El test mesura comportament observable, no processos cognitius interns.

Pregunta 4

Quins dels tres paradigmes principals de la IA — simbòlic, connexionista i evolucionari — et sembla més prometedor? Per què?

El paradigma simbòlic representa el coneixement com a regles i símbols manipulables lògicament (sistemes experts, lògica de predicats); és interpretable però fràgil davant la incertesa. El paradigma connexionista es basa en xarxes neuronals artificials que aprenen patrons a partir de dades; ha dominat la darrera dècada gràcies al deep learning i és al darrere dels LLMs actuals. El paradigma evolucionari utilitza mecanismes inspirats en l'evolució biològica (algorismes genètics, computació evolutiva) per optimitzar solucions. La resposta de l'alumne és oberta, però cal que justifiqui l'elecció: el connexionista és el més prevalent avui per la seva capacitat d'escalar amb dades, però l'enfocament híbrid neurosimbòlic (neuro-symbolic AI) és una aposta creixent per combinar la potència del deep learning amb la interpretabilitat dels sistemes simbòlics.

Pregunta 5

Esmenta tres aplicacions d'IA que hagis usat personalment en els darrers 7 dies.

La resposta és personal i varia per alumne. El docent ha de valorar que l'alumne reconegui la IA en el seu entorn quotidià. Exemples representatius inclouen: assistents de veu (Google Assistant, Siri, Alexa), recomanadors de contingut (YouTube, Spotify, Netflix), filtres de correu brossa, autocomplete del teclat mòbil, traducció automàtica (Google Translate, DeepL), assistents de codi (GitHub Copilot), chatbots (ChatGPT, Gemini, Claude), detecció de cares en aplicacions de càmera, o sistemes de navegació amb predicció de trànsit (Google Maps, Waze). L'objectiu és que l'alumne prengui consciència de la ubicuïtat actual de la IA.

Pregunta 6

Quina és la diferència entre aprenentatge supervisat i no supervisat? Posa un exemple pràctic de cada tipus.

En l'aprenentatge supervisat, el model s'entrena amb un conjunt de dades etiquetades, és a dir, cada exemple d'entrada té associada una sortida correcta coneguda; l'algoritme aprèn a predir l'etiqueta per a nous exemples. Un exemple típic és la classificació de correus com a "spam" o "no spam" a partir d'exemples prèviament etiquetats. En l'aprenentatge no supervisat, les dades no porten etiquetes i el model ha de descobrir per si sol estructures o patrons ocults. Un exemple habitual és la segmentació de clients (clustering) en màrqueting: l'algoritme agrupa clients amb comportaments similars sense que ningú li hagi indicat prèviament quins grups existeixen. La diferència fonamental rau en la presència o absència de supervisió humana durant l'entrenament.

Pregunta 7

Què enteneu per "model d'IA"? Quin és el paper de les dades en la creació d'un model?

Un model d'IA és una representació matemàtica apresa a partir de dades que captura patrons i relacions en un domini determinat, i que pot fer prediccions o prendre decisions sobre exemples nous. Es pot entendre com una funció parametritzada que, donada una entrada, produeix una sortida (una classificació, una predicció numèrica, un text generat, etc.). Les dades tenen un paper fonamental: la qualitat, la quantitat i la representativitat del conjunt d'entrenament determinen directament la capacitat de generalització del model. Un model entrenat amb dades esbiaixades o insuficients produirà prediccions incorrectes o discriminatòries. Per això es diu sovint que "les dades són el nou petroli" de la IA: sense dades adequades, ni l'arquitectura més avançada no pot produir un model útil.

Pregunta 8

Explica de forma senzilla com funciona una xarxa neuronal artificial. Quina relació té amb el cervell humà?

Una xarxa neuronal artificial (RNA) és un conjunt de nodes (neurones artificials) organitzats en capes — capa d'entrada, capes ocultes i capa de sortida — interconnectats per pesos ajustables. Cada neurona rep senyals d'entrada, les pondera, aplica una funció d'activació i transmet el resultat a la capa següent. L'entrenament consisteix a ajustar els pesos iterativament (mitjançant backpropagation i gradient descent) per minimitzar l'error entre les prediccions del model i les sortides esperades. La inspiració en el cervell humà és real però superficial: igual que les neurones biològiques transmeten impulsos elèctrics a través de sinapsis, les RNA transmeten valors numèrics a través de pesos. Tanmateix, les RNA actuals no reprodueixen la complexitat de la neurobiologia: no hi ha senyalització temporal, ni neurotransmissors, ni plasticitat sinàptica real. La metàfora és útil però no s'ha de prendre de manera literal.

Pregunta 9

Què és el "sobreajustament" (overfitting) en un model de Machine Learning? Per què és un problema?

El sobreajustament o overfitting es produeix quan un model aprèn massa bé els detalls i el soroll del conjunt d'entrenament i perd la capacitat de generalitzar a dades noves que no ha vist mai. En termes pràctics, el model "memoritza" els exemples d'entrenament en lloc d'aprendre'n els patrons subjacents. El problema és que en producció el model es trobarà amb dades reals que diferiran dels exemples d'entrenament, i el seu rendiment caurà dràsticament. Es detecta quan l'error en el conjunt de validació és molt superior al de l'entrenament. Per combatre'l s'usen tècniques com la regularització (L1, L2), el dropout en xarxes neuronals, la validació creuada (cross-validation) o simplement augmentar la mida del conjunt d'entrenament.

Pregunta 10

Quina diferència hi ha entre RPA (Robotic Process Automation) i la IA? Poden complementar-se?

L'RPA és una tecnologia que automatitza tasques repetitives i basades en regles fixes — com copiar dades entre sistemes, omplir formularis o processar factures — sense prendre decisions pròpies; segueix instruccions predefinides de manera determinista. La IA, en canvi, implica capacitat d'aprendre, adaptar-se i gestionar situacions no previstes explícitament a partir de dades. La combinació d'ambdues tecnologies s'anomena sovint "IA augmentada" o "hyperautomation": l'RPA s'encarrega de les tasques estructurades i repetitives, mentre que components d'IA (OCR intel·ligent, PLN, visió per computador) gestionen les parts no estructurades com la lectura de documents escanejats o la classificació de correus. Aquesta sinergia és molt present en la transformació digital de processos administratius i empresarials.

Pregunta 11

Com creus que un model com ChatGPT "entén" el text que li escrius? Descriu el procés tal com te l'imagines.

La resposta de l'alumne és exploratòria i el docent ha de valorar la intuïció i la reflexió crítica, no la precisió tècnica. La resposta correcta de referència és: els LLMs com ChatGPT no "entenen" el text en el sentit semàntic humà; processen el text convertint-lo en tokens (fragments de paraula), que es transformen en vectors numèrics (embeddings) en un espai de moltes dimensions. L'arquitectura Transformer aplica mecanismes d'atenció per capturar relacions entre tokens independentment de la seva distància en el text. El model predeix el token següent més probable donada la seqüència anterior, i ho fa de manera autoregressive fins a generar la resposta completa. El procés és estadístic i probabilístic: no hi ha comprensió en el sentit filosòfic, sinó una aproximació extremadament poderosa a la generació de text coherent i contextualitzat.

Pregunta 12

Què és un "token" en el context dels LLMs (Large Language Models)? Per què és important per al cost i el rendiment?

Un token és la unitat mínima de processament d'un LLM: no equival exactament a una paraula, sinó a un fragment de text que pot ser una paraula completa, una síl·laba, o fins i tot un caràcter, depenent del tokenitzador. Per exemple, la paraula "intel·ligència" pot descompondre's en 3-4 tokens. Els models processen i generen text token a token. La importància econòmica és directa: la majoria de proveïdors d'APIs (OpenAI, Anthropic, Google) facturen per token d'entrada i de sortida, de manera que un prompt molt llarg consumeix molts tokens i incrementa el cost. A nivell de rendiment, el nombre de tokens en el context (context window) limita la quantitat d'informació que el model pot tenir en compte simultàniament; superar aquesta finestra implica pèrdua d'informació o errors.

Pregunta 13

Has notat alguna vegada que un model d'IA "al·lucina" (genera informació falsa amb seguretat)? Descriu l'experiència.

La resposta és personal. El docent ha de valorar que l'alumne identifiqui el fenomen i en comprengui la causa. Al·lucinació (hallucination) és el terme tècnic per descriure quan un LLM genera informació factual incorrecta presentada amb confiança i fluïdesa lingüística. Exemples comuns: citar articles científics inexistents amb DOI i autors inventats, atribuir cites errònies a personalitats reals, afirmar dades numèriques o dates incorrectes, o descriure característiques de productes que no existeixen. La causa subjacent és que el model optimitza la fluïdesa i coherència del text, no la veracitat: si no té informació certa, "inventa" el que estadísticament és més probable en aquell context. Per mitigar-ho s'usen tècniques com RAG (Retrieval-Augmented Generation) o el grounding amb fonts verificables.

Pregunta 14

Quina creus que és la diferència principal entre GPT-4o d'OpenAI i LLaMA 3.1 de Meta? (Pista: model obert vs. propietari)

GPT-4o és un model propietari d'OpenAI: els pesos no es publiquen, l'arquitectura exacta no es divulga i l'accés és exclusivament mitjançant API de pagament o la interfície de ChatGPT. LLaMA 3.1 (i successors) de Meta és un model amb pesos publicats lliurement (open weights), cosa que permet descarregar-lo, executar-lo localment, modificar-lo i fins i tot redistribuir-lo sota les condicions de la llicència de Meta. Aquesta diferència té implicacions pràctiques importants: amb LLaMA es poden crear aplicacions sense cost per inferència, garantir la privadesa de les dades (el model s'executa localment) i fine-tunejar el model per a casos d'ús específics. GPT-4o, en canvi, ofereix generalment un rendiment superior en benchmarks estàndard i una experiència d'ús més polida, però a costa de dependència del proveïdor i costos per token.

Pregunta 15

Per a quines tasques professionals creus que el PLN té més potencial als propers 5 anys?

El Processament del Llenguatge Natural (PLN) té un potencial transformador en múltiples àmbits professionals. En el sector jurídic: revisió i redacció de contractes, cerca jurisprudencial i resum de documents legals. En medicina: extracció d'informació de registres clínics, suport al diagnòstic i generació d'informes. En atenció al client: agents conversacionals multilingües capaços de gestionar consultes complexes sense intervenció humana. En educació: tutors intel·ligents personalitzats i correcció automàtica de textos. En traducció i localització: traducció professional de qualitat quasi humana per a molts parells de llengües. En ciberseguretat: detecció de phishing i anàlisi de comunicacions malicioses. El docent ha de valorar la capacitat de l'alumne de concretar casos d'ús reals i d'argumentar per quina raó el PLN aporta valor en aquell context.

Pregunta 16

Quina diferència hi ha entre un robot industrial tradicional i un cobot (robot col·laboratiu)? On s'usa cada un?

Un robot industrial tradicional és una màquina rígida, potent i ràpida, dissenyada per treballar en espais tancats i separats físicament dels humans (gàbies de seguretat) per evitar accidents; és ideal per a tasques de soldadura, pintura o assemblatge repetitiu en cadenes de producció d'alta velocitat com les de l'automoció. Un cobot (robot col·laboratiu) és un robot dissenyat explícitament per treballar al costat de persones en el mateix espai, amb sensors de força i torque que li permeten detectar contacte humà i aturar-se o cedir per evitar danys. Els cobots són generalment més lents i menys potents, però molt més flexibles i fàcils de programar (sovint per demostració). S'usen en manufactura de volum baix i varietat alta, en logística, en medicina (assistència quirúrgica) i en entorns de treball on la interacció humà-robot constant és necessària.

Pregunta 17

Quan va ser l'última vegada que has interactuat amb un sistema expert? (Pensa en sistemes de diagnòstic, recomanació, configuradors de productes, etc.)

La resposta és personal. El docent ha de guiar l'alumne a reconèixer que els sistemes experts no han desaparegut, sinó que estan integrats en moltes eines quotidianes. Exemples que l'alumne probablement ha usat sense reconèixer-los com a sistemes experts: configuradors de vehicles o ordinadors a webs de fabricants (Dell, BMW), diagnòstics automatitzats de problemes tècnics (assistents de suport d'operadors de telefonia), sistemes de triatge simptomàtic en webs de salut, recomanadors de productes en e-commerce, o motors de regles en sistemes bancaris per a l'aprovació de préstecs. Els sistemes experts clàssics (basats en bases de coneixement i motors d'inferència) han evolucionat i s'han hibridat amb ML, però el concepte de raonament basat en regles és plenament vigent.

Pregunta 18

L'AI Act de la UE classifica els sistemes d'IA per nivells de risc. Quins nivells creus que existeixen? Posa un exemple de sistema d'alt risc.

L'AI Act de la Unió Europea (Reglament 2024/1689), aprovat el 2024, estableix quatre nivells de risc: risc inacceptable (sistemes prohibits, com la puntuació social generalitzada o la manipulació subliminal), risc alt (sistemes permesos però subjectes a requisits estrictes de transparència, auditoria i supervisió humana), risc limitat (obligació de transparència, com els chatbots que han d'identificar-se com a IA) i risc mínim (sense requisits addicionals, com els filtres anti-spam o els jocs amb IA). Exemples de sistemes d'alt risc: sistemes d'IA per a la selecció de personal, el diagnòstic mèdic, la concessió de crèdits, el reconeixement facial en espais públics per part de cossos de seguretat, o els sistemes de puntuació de solvència creditícia.

Pregunta 19

Has sentit a parlar del "biaix algorítmic"? Descriu un cas real (o imaginat) en el qual un sistema d'IA podria discriminar un col·lectiu.

El biaix algorítmic és la tendència d'un sistema d'IA a produir resultats sistemàticament desavantajosos per a determinats grups, sovint com a reflex de biaixos presents en les dades d'entrenament o en les decisions de disseny del sistema. Un cas real molt documentat és el sistema COMPAS, usat als EUA per predir la reincidència de presos en decisions de llibertat condicional: estudis independents (ProPublica, 2016) van demostrar que el sistema classificava els acusats negres com a "alt risc" el doble de vegades que els blancs amb perfils similars. Un altre exemple és el sistema de contratació d'Amazon (abandonat el 2018), que penalitzava currículums amb paraules associades a les dones perquè havia estat entrenat amb dades históricament dominades per homes. El biaix pot provenir de dades no representatives, d'etiquetes esbiaixades o de la tria de variables proxy discriminatòries.

Pregunta 20

Creus que la IA suposarà la destrucció neta de llocs de treball o la creació de nous perfils professionals? Argumenta la teva resposta amb dades si pots.

La resposta de l'alumne és oberta i el docent ha de valorar la capacitat d'argumentació i la referència a evidències. La posició de referència acadèmica és matisada: l'informe del World Economic Forum "Future of Jobs 2025" estima que la IA i l'automatització destruiran uns 85 milions de llocs de treball però en crearan 97 milions de nous al llarg del perióde 2025-2030, amb un balanç net positiu però amb una transició dolorosa per als treballadors de perfils repetitius i de baixa qualificació. Els rols amb més risc d'automatització inclouen operadors de dades, empleats administratius i alguns treballs de transport. Els nous perfils emergents inclouen especialistes en IA i ML, enginyers de prompts, analistes de dades, tècnics en ciberseguretat i roles que combinen habilitats tècniques amb competències interpersonals difícils d'automatitzar. La clau per als treballadors serà la requalificació (reskilling) i l'adaptació contínua.