L'intelligenza artificiale può davvero sostituire il giudizio clinico di un medico esperto? La questione è tornata al centro del dibattito tecnologico dopo le provocatorie dichiarazioni di Marc Andreessen, co-founder di Andreessen Horowitz. Durante un'intervista al podcast di Joe Rogan, l'investitore ha affermato che "Doctor ChatGPT" sia già superiore al 99% dei medici umani, sostenendo di ricevere risposte più accurate dall'AI rispetto a quasi ogni esperto consultato.
Tra empatia e rischi clinici
Nonostante l'entusiasmo di Andreessen, i dati scientifici delineano un quadro molto più complesso. Secondo quanto riportato da TNW Neural, una ricerca pubblicata sul Journal of Medical Internet Research ha evidenziato un paradosso: sebbene i pazienti percepiscano il chatbot come più empatico e utile rispetto ai medici umani, gli specialisti hanno classificato diverse risposte dell'AI come potenzialmente dannose. Il rischio principale risiede nell'incapacità dell'utente comune di distinguere un suggerimento sicuro da uno pericoloso.
Il fallimento nelle emergenze
Il limite più critico emerge nella gestione delle urgenze. Uno studio condotto da ricercatori del Mount Sinai e pubblicato su Nature Medicine ha testato ChatGPT Health in 60 scenari clinici. I risultati sono allarmanti: lo strumento ha fallito nel riconoscere il 51,6% delle vere emergenze, suggerendo appuntamenti di routine anche in casi critici, come pazienti in insufficienza respiratoria. Questo conferma che, mentre l'AI eccelle nell'identificare una possibile diagnosi (compito in cui ha già mostrato risultati promettenti, similmente a quanto visto nei sistemi di supporto clinico della NASA), fatica enormemente a valutare il rischio reale e a scegliere il trattamento più idoneo.
Interessi economici e limiti tecnici
L'analisi di TNW Neural sottolinea inoltre come la posizione di Andreessen non sia neutrale: il suo fondo ha investito massicciamente in startup di health-AI come Hippocratic AI e Abridge. Parallelamente, esperti di ingegneria hanno criticato l'approccio dell'investitore all'uso dello strumento; Andreessen ha infatti condiviso un "super prompt" chiedendo all'AI di non allucinare mai, ignorando il fatto che le allucinazioni siano un limite strutturale dei modelli LLM e non possano essere disattivate con una semplice istruzione testuale.
In conclusione, sebbene l'AI possa democratizzare l'accesso a informazioni mediche di base per i milioni di persone che la utilizzano quotidianamente, il divario tra la capacità di elaborazione dati e il giudizio clinico critico resta un ostacolo fondamentale per la sicurezza dei pazienti.
