In Sardegna

L'intelligenza artificiale supera il test di Medicina, da Cagliari lo studio su ChatGpt

Imagoeconomica1612540

CAGLIARI. Si chiama ChatGpt e se fosse umana ora sarebbe iscritta alla facoltà di Medicina e Odontoiatria. Il prototipo di intelligenza artificiale online che sta aprendo nuovi scenari e suscitando interrogativi, ha infatti superato il test di accesso che viene sottoposto ai futuri medici. 

L'esperimento è stato portato avanti da un team di ricercatori dell'Università di Cagliari esperti di logica, filosofia e machine learning allo scopo di esaminare le reali capacità dell'intelligenza artificiale. Secondo i risultati ottenuti da Marco GiuntiRoberto GiuntiniGiuseppe SergioliSimone Pinna e Fabrizia Giulia Garavaglia, ChatGpt è stata in grado di rispondere in modo corretto ad oltre il 60% dei quesiti, totalizzando complessivamente un punteggio di 46.3, tale da permettere il superamento del test.

L’analisi delle risposte alle 60 domande ha però evidenziato lacune sul piano della logica: “L'esperimento da un lato ha offerto indicazioni che confermano il possesso da parte di ChatGpt di sofisticate competenze linguistiche - fanno sapere i ricercatori -, sia a livello sintattico, sia semantico, e dall’altro ha evidenziato alcune lacune nell'effettuare inferenze logiche, soprattutto di fronte a problemi di natura formale. Anche in questo ambito, però, le prestazioni restano sorprendenti per un’intelligenza artificiale”.

Il gruppo di ricerca ora sta portando avanti una sperimentazione più approfondita e puntuale dei punti di forza e debolezza di ChatGpt, mediante un'osservazione dettagliata delle varie tipologie di quesiti che generano più frequentemente risposte errate rispetto a quelli che la Chat digerisce più facilmente. Tale analisi passerà attraverso la valutazione di un numero più ampio di problemi, tratti non solo dal test italiano per l'ingresso alle facoltà medico-sanitarie ma anche attraverso la comparazione con altri test in ambito internazionale, come, per esempio il Cambridge BioMedical Admission Test (Bmat). “Un altro punto di interesse - concludono - potrà riguardare lo studio degli esiti di un’interazione con ChatGpt a seguito di una sua risposta non corretta. Lo studio dell'interazione utente-Chat infatti potrà offrire ulteriori e interessanti spunti di riflessione e sviluppo”.