Questo sito prevede l‘utilizzo di cookie. Continuando a navigare si considera accettato il loro utilizzo. Ulteriori informazioniOK
Vai al contenuto

Telosaes.it

Direttore responsabile:
Maria Palazzolo

Editore: Telos A&S srl
Via del Plebiscito, 107
00186 Roma

Reg.: Trib. di Roma 295/2009 del 18 settembre 2009

Diffusione: protocolli
Internet - Isp: Eurologon srl

A member of the Fipra Network
Socio Corporate di American Chamber of Commerce in Italy

SocialTelos

Dicembre 2024, Anno XVI, n. 12

Daniele Panfilo

Intelligenza Artificiale che genera dati. A prova di privacy.

I dati sintetici mantengono inalterata l'utilità statistica del dato originale, ma poiché sono generati attraverso un algoritmo, sono privi di informazioni sensibili e quindi non sono più dati personali. Si eliminano così, in maniera definitiva, i rischi di re-identificazione.

Telos: L’intelligenza artificiale generativa è stata, per lei, prima materia di specializzazione accademica, poi una sfida imprenditoriale: ci racconta il suo percorso?

Daniele Panfilo: Mi sono laureato alla ‘Sapienza’ di Roma in Industrial and Management Engineering e dopo ho conseguito due master: il primo, sempre in Sapienza, in Optimization and Modelling; il secondo in ricerca operativa all’Università di Maastricht, Dipartimento di Knowledge Engineering and Data Science, una delle prime lauree specialistiche in Europa dedicate all’Intelligenza Artificiale (AI). Sono rimasto a lavorare come ricercatore presso il Bakken Research Center della Medtronic, dove ho iniziato come data scientist nel contesto biomedico. Mi occupavo di pacemaker e ottimizzazione di ritardo di pacing tra l’atrio e il ventricolo. Mentre studiavo e facevo ricerca in ambito AI, ho iniziato a sviluppare una curiosità verso le sue applicazioni al contesto industriale: ho sempre cercato di conciliare queste due anime, puntando a tradurre le ricerche accademiche in applicazioni pratiche che avessero impatto sul mondo industriale. Tornato in Italia, ho intrapreso un’esperienza di consulenza nell’ambito Med-Pharma; poi mi sono unito al gruppo di Data Scientists di Allianz Technology: proprio qui ho conosciuto Sebastiano Saccani, con il quale ho iniziato l’avventura di Aindo.
Contestualmente al lavoro in Allianz, ho intrapreso un dottorato all’Università degli Studi di Trieste in Artificial Intelligence, dove mi sono specializzato in modelli di machine learning generativi. Sin dall’inizio della mia carriera accademica, ho capito che l'intelligenza artificiale avrebbe avuto grandi applicazioni non solo nel campo della ricerca ma, soprattutto, in ambito industriale e di business. Quando ho iniziato a studiare, l’AI generativa era una tecnologia molto meno nota di quanto non lo sia oggi, un paradigma completamente diverso all’interno del campo dell’intelligenza artificiale: ho intuito che avrebbe portato svolte significative. Fino a quel momento, le applicazioni di intelligenza artificiale erano soprattutto pensate per classificare o per prevedere; i modelli generativi, invece, estendevano le capacità dell'AI a domini molto più ampi. L’idea di Aindo è nata tra me e Sebastiano mentre lavoravamo come sviluppatori di algoritmi di AI in vari settori (Finanza, Salute, Marketing e Commercio). Ci siamo resi conto che i tempi per avere accesso ai dati erano estremamente lunghi, e poiché ci occupavamo già di modelli generativi nella ricerca accademica, ci è venuta l’intuizione di estendere le capacità di questi modelli alla generazione di dati artificiali tabulari che mimano il comportamento statistico dei dati reali e quindi ne conservano l’utilità, ma che essendo appunto artificiali, non contengono più informazione personale, superando in maniera elegante il problema relativo alla privacy.
Nel 2020 abbiamo deciso di sottomettere l’idea ad un programma di accelerazione europeo, lo European Data Incubator, e siamo arrivati primi su 500 applicanti vincendo 100mila euro equity free [nrd un contributo che permette di mantenere il 100% delle quote societarie] per lo sviluppo del primo prodotto. Nel 2021 Aindo ha ottenuto il primo round di finanziamento con il fondo Vertis. Nel 2023 ha raccolto altri sei milioni con i fondi United Ventures e Vertis.

L’impiego ‘etico e responsabile’ dell’intelligenza artificiale è diventato un mantra nel dibattito pubblico, ma sospettiamo che pochi ne conoscano davvero il significato e le implicazioni. Aindo ne ha fatto invece la propria missione: ci descrive l’azienda e sulle sue prospettive?

Aindo è una scale-up [ndr una forma societaria evoluzione di una startup innovativa] fondata nel 2018 all’interno della Scuola Internazionale Superiore di Studi Avanzati (SISSA) a partire dall’idea che l’intelligenza artificiale possa apportare grande valore alla società, senza violare nessun tipo di diritto e libertà. Per questo, la nostra piattaforma di generazione di dati sintetici abilita l'uso di dati personali nel rispetto della privacy, conciliando l’innovazione nel campo dell’AI con la protezione, l’imparzialità e l’affidabilità dei dati. Si tratta di una soluzione frutto di ricerche che rappresentano lo stato dell’arte nell’ambito dei modelli di machine learning generativi: a partire dal dato reale, tali modelli sono in grado di generare dati artificiali capaci di replicare fedelmente schemi e comportamenti della popolazione dei dati reali. I dati sintetici, quindi, mantengono inalterata l'utilità statistica del dato originale, ma poiché sono generati attraverso un algoritmo, sono privi di informazioni sensibili e quindi non sono più dati personali. Si eliminano così, in maniera definitiva, i rischi di re-identificazione. La tecnologia brevettata da Aindo, prima in Europa ad aver ottenuto la certificazione Europrivacy, incentiva lo scambio sicuro dei dati, democratizza l’innovazione, facilita collaborazioni e progetti di Ricerca e Sviluppo, in linea con la spinta da parte dell’Europa alla creazione di open data spaces nel rispetto della normativa privacy. Ciò consente di sfruttare a pieno le potenzialità dell’Intelligenza Artificiale in ambiti strategici e ad alto impatto sociale e di business, come la ricerca in ambito sanitario e farmaceutico e lo sviluppo di tecnologie per i mercati finanziari e assicurativi.

Il Regolamento Europeo in materia di intelligenza artificiale ha dato un riconoscimento esplicito al dato sintetico. Può spiegare a un pubblico di non esperti che cos’è la sintetizzazione del dato e come questa tecnologia può essere impiegata a beneficio della ricerca scientifica e della programmazione delle politiche pubbliche?

L'intelligenza artificiale sta rivoluzionando tutti gli aspetti della nostra vita. Purtroppo, però, oltre l'85% dei progetti di AI non arriva mai alla fase di produzione. Questo avviene perché questi progetti, per poter essere avviati, hanno bisogno di grandi quantità di dati. Le organizzazioni devono avere accesso ai dati e assicurarsi che siano completi e sicuri. Si tratta di un processo costoso in termini di tempo e di denaro. La tecnologia dei dati sintetici si sta imponendo come elemento chiave per sviluppare con successo progetti di intelligenza artificiale e data analytics. I dati sintetici non sono riconducibili a persone reali, ma simulano il comportamento dei dati autentici. A oggi la richiesta di dati sintetici arriva da diversi settori. Un ospedale, ad esempio, potrebbe avere la necessità di condividere i dati dei propri pazienti per sviluppare strumenti utili a migliorare la diagnostica e la cura di determinate patologie. Ma le cartelle cliniche elettroniche sono riservate; questi dati sono sensibili e difficilmente utilizzabili, neppure per ragioni di ricerca e sviluppo o per collaborazioni tra enti pubblici. In questi casi, la piattaforma sviluppata da Aindo converte le informazioni e genera un database di dati sintetici utilizzabili per fini di ricerca e sviluppo, garantendo al tempo stesso i più elevati standard in termini di privacy. Un’altra applicazione dei dati sintetici è nell’ambito di ricerche e studi di settore, per aiutare la comprensione di fenomeni socio-culturali e contribuire a migliorare la vita delle persone. Quando non è possibile accedere alle informazioni, perché soggette a protocolli di privacy, questi ultimi, che sono compatibili con i sistemi di database internazionali, possono essere una fonte di preziose informazioni per le indagini scientifiche.

Come sempre di fronte a un cambio di paradigma tecnologico, l’intelligenza artificiale è spesso associata allo spettro di cambiamenti economici e sociali epocali. I catastrofisti hanno ragione ad avere paura o no? E perché?

L’innovazione si porta sempre dietro sfide che vanno superate, a poco a poco: innovare vuol dire lavorare su qualcosa che non c'è e che, molto spesso, non si può prevedere come verrà percepita. Si teme sempre ciò che non si conosce e, in genere, i catastrofisti sono persone poco informate o male informate. L'intelligenza artificiale, come altre tecnologie emergenti e dirompenti, può avere applicazioni importanti e utili, ma anche implicazioni e usi scorretti, che potrebbero generare conseguenze negative. Ciò non significa che l'innovazione vada fermata: piuttosto è importante studiarla, conoscerla, regolarla e applicarla correttamente. I catastrofisti, o complottisti, non credo siano funzionali a questi obiettivi. C'è bisogno di informazione di qualità e di formazione: quando si comprende qualcosa appieno, poi la paura svanisce.

Mariella Palazzolo

Editoriale

L’America innova, la Cina copia, l’Europa regola. Questo ritornello, abusato quanto si vuole, restituisce impietosamente l’immagine del declino del Vecchio Continente. Ma lascia aperta una questione cruciale: regolare significa necessariamente imporre un onere in capo a chi innova, oppure esistono le condizioni per un quadro normativo che incoraggi l’innovazione tecnologica e ne favorisca le ricadute positive sull’economia? L’avvento dell’intelligenza artificiale è un ottimo banco di prova, viste le sue applicazioni non soltanto in ambito industriale o finanziario, ma anche nella ricerca scientifica e nella programmazione delle politiche pubbliche. E tuttavia, come spiega Panfilo, lo sviluppo dei progetti di IA incontra un limite nell’insufficienza di dati. Può apparire un paradosso: la transizione digitale ha creato le premesse per un aumento esponenziale di dati disponibili, ma il loro potenziale rimane in buona misura inespresso, in particolare perché il loro utilizzo è vincolato al rispetto delle norme che tutelano la privacy. Facciamo un esempio pratico. La digitalizzazione delle cartelle cliniche permette la condivisione e la messa a sistema di una grande massa dati e quindi, potenzialmente, la costruzione di modelli predittivi che permetterebbero di fare un vero e proprio salto di qualità alla programmazione del Servizio Sanitario Nazionale. Ma si tratta di dati personali, e per di più sanitari, quindi di natura particolarmente sensibile: utilizzarli per addestrare sistemi di IA significa impiegarli per una finalità diversa da quella per la quale sono stati raccolti, attività che le norme in materia di tutela della privacy limitano drasticamente. Ecco la matassa che il legislatore è chiamato a sbrogliare: da un lato la libertà della ricerca e gli enormi benefici collettivi che ne derivano, dall’altro la salvaguardia dei diritti individuali. In Italia, l’utilizzo secondario dei dati personali relativi alla salute per finalità di ricerca scientifica era soggetto a limiti addirittura più stringenti di quelli del già non particolarmente elastico Regolamento europeo (il vituperato GDPR). Finalmente, quest’anno il Parlamento si è fatto carico di superare l’anomalia, anche grazie all’azione di advocacy che ha visto protagoniste società scientifiche, associazioni di manager sanitari ed altri stakeholder: l’obbligo di consultazione del Garante caso per caso è ora sostituito da quello di osservare le garanzie che il Garante è chiamato ad individuare in via generale. Ma il dilemma fondamentale rimane, ed è la stessa IA generativa a mettere a disposizione del legislatore la soluzione, attraverso la sintetizzazione dei dati: a partire dai dataset reali, si possono infatti generare dati artificiali che mimano le proprietà dei dati reali a partire dai quali sono stati generati, ma non sono più riconducibili ad essi. Ne deriva un vero e proprio cambio di paradigma: non si tratta di pseudonimizzare dati personali, e quindi a rischio di essere nuovamente attribuiti a una persona attraverso l'utilizzo di ulteriori informazioni, ma di generare dati sintetici e successivamente impiegarli per l’addestramento di sistemi di IA. Possiamo dire che non si tratta più di una semplice prospettiva, ma di una realtà, alla quale il legislatore europeo ha dato il suo pieno riconoscimento. Dapprima il Data Governance Act del 2022, che definisce le condizioni per la condivisione ed il riutilizzo da parte di terzi di dati detenuti da enti pubblici, ha inserito la sintetizzazione tra le garanzie giudicate idonee a prevenire la reidentificazione degli interessati. Quindi, il Regolamento sull’Intelligenza Artificiale del 2024 (più noto come AI Act) ha compiuto il passaggio decisivo: il trattamento secondario di dati personali per lo sviluppo e l’addestramento di sistemi di IA ad alto rischio è consentito soltanto laddove non sia possibile impiegare dati sintetici o anonimizzati. L’Europa, cioè il regolatore per antonomasia, ha fatto il suo dovere. Possiamo auspicare che il legislatore italiano, oggi impegnato nell’iter del disegno di legge delega in materia di intelligenza artificiale, ne raccolga il testimone.
Con questo numero si conclude la serie delle copertine 2024 di PRIMOPIANOSCALAc, ispirate alle opere di Romano Gazzera, pittore piemontese noto per i suoi fiori ‘giganti’, ‘parlanti’ e ‘volanti’ che, insieme ad altri temi iconografici legati alla memoria storica e collettiva, lo hanno caratterizzato e distinto come il caposcuola della corrente Neo-floreale italiana. Per Daniele abbiamo scelto il tulipano, quale omaggio ai suoi studi e primi passi professionali olandesi. Non avevamo la fotografia ad immagine intera che serviva per questa copertina e quindi non abbiamo resistito… e l’abbiamo ricostruita con la funzione Espansione generativa dell’IA generativa di un programma grafico, al quale abbiamo chiesto di completare l’immagine nella parte inferiore con gli elementi mancanti (pouf e parte inferiore delle gambe/piedi). Daniele non oserà lamentarsi!
Con questo numero di dicembre, tutti noi di Telos A&S vi auguriamo Buon Natale ed un sereno 2025. 

Marco Sonsini

Daniele Panfilo

Daniele Panfilo è uno scienziato, fondatore di Aindo, una scale-up che ha sviluppato e brevettato una tecnologia di generazione di dati sintetici attraverso l’Intelligenza Artificiale. Del suo percorso accademico/professionale e della storia di Aindo, Daniele ci racconta in modo approfondito nell’intervista, quindi il suo profilo, sarà molto diverso dal solito. Dedichiamo questo spazio a Daniele, non all’ing. Panfilo. Adora il buon cibo e apprezza particolarmente la cucina italiana, ma poiché è una persona molto curiosa, sperimenta spesso anche cucine più esotiche. Si interessa in maniera amatoriale al mondo del vino, che crede sia uno dei molti vanti dell’Italia, tanto che ultimamente sta “pensando di intraprendere un corso per capirne di più”.
Tra i suoi hobby c’è sicuramente la lettura: “mi piacciono molto i romanzi russi e tedeschi, da Tolstoj a Thomas Mann”. Nel tempo libero predilige le letture che non hanno a che fare con il suo lavoro “proprio per avere una distrazione dal mondo della tecnologia, che occupa gran parte della mia giornata”. Ovviamente si aggiorna costantemente su tutti i temi legati all’AI e alla scienza, ma “per questo tipo di letture preferisco la letteratura primaria e seleziono dunque articoli scientifici per evitare ‘opinioni’ non qualificate. La scienza è fatta di eventi dimostrabili e ripetibili e non di opinioni”. Infine cerca di ritagliarsi, ogni giorno un po’ di tempo per lo sport e la cura del benessere fisico, necessario a sostenere i suoi ritmi di vita particolarmente intensi. Nei momenti liberi va in palestra oppure in piscina. Negli ultimi anni, vivendo a Trieste, si è appassionato molto alla vela, tanto che con alcuni amici, ha acquistato una piccola barca: “da bambino mio padre mi ha trasmesso la passione per la pesca che, ancora oggi, seppure con qualche difficoltà in più, continuo a coltivare”.
Daniele è nato a Roma, ha 36 anni, ed è “figlio unico, molto legato alla mia famiglia e ai miei amici”.

Marco Sonsini