Si impara sempre dal Passato?

Un nuovo mondo è sempre creato dalle ceneri di uno vecchio…

Ne siamo sicuri?

DISCLAIMER: Tratteremo in modo molto sommario in questo articolo di Machine Learning; riservandoci una trattazione completa in altri interventi come A.I.LoveTourism.

Cosa è il Machine Learning e perchè è importante.

Il machine learning è un metodo di analisi dati che automatizza la costruzione di modelli analitici. È una branca dell’Intelligenza Artificiale e si basa sull’idea che i sistemi possono imparare dai dati, identificare modelli autonomamente e prendere decisioni con un intervento umano ridotto al minimo.

I primi ricercatori interessati all’intelligenza artificiale volevano scoprire se i computer potessero apprendere dai dati. Il machine learning, l’apprendimento automatico, nasce dalla teoria che i computer possono imparare ad eseguire compiti specifici senza essere programmati per farlo, grazie al riconoscimento di schemi tra i dati. Il machine learning utilizza algoritmi che imparano dai dati in modo iterativo. Permette, ad esempio, ai computer di individuare informazioni anche sconosciute senza che venga loro segnalato esplicitamente dove cercarle.

L’aspetto più importante del machine learning è la ripetitività, perchè più i modelli sono esposti ai dati, più sono in grado di adattarsi in modo autonomo. I computer imparano da elaborazioni precedenti per produrre risultati e prendere decisioni che siano affidabili e replicabili.

Per la nostra trattazione è importante segnalare un fattore importante: il Machine Learning ha bisogno, almeno, di (almeno) due set di dati per poter esprimere la sua forza predittiva; un Database set ed un Database test . Di solito, dati da uno storico di dati circa un dominio di applicazione.

Vecchi problemi, nuove soluzioni

E se non avessimo un Database di partenza? …Dati Sintetici

Cosa sono i dati sintetici?

La risposta è relativamente semplice. Mentre i dati originali vengono raccolti in tutte le tue interazioni con persone reali (es. clienti, pazienti, dipendenti ecc.) e tramite tutti i tuoi processi interni, i dati sintetici sono generati da un algoritmo informatico. Questo algoritmo informatico genera datapoint completamente nuovi e artificiali.

GDPR ed altri problemi

Risolvi le sfide relative alla privacy dei dati

I dati generati sinteticamente sono costituiti da datapoint completamente nuovi e artificiali senza alcuna relazione uno-a-uno con i dati originali. Pertanto, nessuno dei datapoint sintetici può essere ricondotto o decodificato sui dati originali. Di conseguenza, i dati sintetici sono esenti dalle normative sulla privacy, come il GDPR e servono come soluzione per risolvere e superare le sfide relative alla privacy dei dati.

Quali tipi di dati sintetici esistono?

Esistono tre tipi di dati sintetici all’interno dell’ombrello dei dati sintetici. Questi 3 tipi di dati sintetici sono: dati fittizi, dati sintetici generati in base a regole e dati sintetici generati dall’intelligenza artificiale (AI). Spieghiamo brevemente quali sono i 3 diversi tipi di dati sintetici.

Dati fittizi / dati fittizi

I dati fittizi sono dati generati casualmente (ad es. da un generatore di dati fittizi).

Di conseguenza, le caratteristiche, le relazioni e gli schemi statistici presenti nei dati originali non vengono conservati, acquisiti e riprodotti nei dati fittizi generati. Pertanto, la rappresentatività dei dati fittizi/dati fittizi è minima rispetto ai dati originali.

  • Quando usarlo: per sostituire gli identificatori diretti (PII) o quando non si hanno (ancora) dati e non si vuole spendere tempo ed energie nella definizione delle regole.

Dati sintetici generati basati su regole

I dati sintetici generati in base a regole sono dati sintetici generati da un insieme predefinito di regole. Esempi di queste regole predefinite potrebbero essere che vorresti avere dati sintetici con un certo valore minimo, valore massimo o valore medio. Tutte le caratteristiche, le relazioni e gli schemi statistici che si desidera siano riprodotti nei dati sintetici generati in base a regole, devono essere predefiniti.

Di conseguenza, la qualità dei dati sarà buona quanto l’insieme di regole predefinito. Ciò si traduce in sfide quando l’elevata qualità dei dati è essenziale. In primo luogo, è possibile definire solo un insieme limitato di regole da acquisire nei dati sintetici. Inoltre, l’impostazione di più regole comporta in genere regole sovrapposte e in conflitto. Inoltre, non coprirai mai completamente tutte le regole pertinenti. Inoltre, potrebbero esserci regole rilevanti di cui non sei nemmeno a conoscenza. E infine (e non dimenticare), questo ti richiederà molto tempo ed energia risultando in una soluzione non efficiente.

  • Quando usarlo: quando non hai (ancora) dati

Dati sintetici generati dall’intelligenza artificiale (AI)

Come ci si aspetta dal nome, i dati sintetici generati dall’intelligenza artificiale (AI) sono dati sintetici generati da un algoritmo di intelligenza artificiale (AI). Il modello AI viene addestrato sui dati originali per apprendere tutte le caratteristiche, le relazioni e i modelli statistici. Successivamente, questo algoritmo di intelligenza artificiale è in grado di generare punti dati completamente nuovi e modellarli in modo tale da riprodurre le caratteristiche, le relazioni e i modelli statistici del set di dati originale. Questo è ciò che chiamiamo un gemello di dati sintetici.

Il modello di intelligenza artificiale imita i dati originali per generare gemelli di dati sintetici che possono essere utilizzati come se fossero dati originali. Ciò sblocca vari casi d’uso in cui i dati sintetici generati dall’IA possono essere utilizzati come alternativa per l’utilizzo di dati (sensibili) originali, come l’uso di dati sintetici generati dall’IA come dati di test, dati demo o per analisi.

Rispetto ai dati sintetici generati basati su regole: invece di studiare e definire regole rilevanti, l’algoritmo AI lo fa automaticamente per te. Qui non verranno trattate solo le caratteristiche, le relazioni e gli schemi statistici di cui sei a conoscenza, ma anche le caratteristiche, le relazioni e gli schemi statistici di cui non sei nemmeno a conoscenza.

  • Quando usarlo: quando hai (alcuni) dati come input da imitare o da utilizzare come punto di partenza per la generazione di dati intelligenti e le funzionalità di aumento

Il punto di A.I.LoveTourism

In questo discorso come si “incastra” il settore del Turismo?

Un esempio, su tutti. In questi ultimi tre anni vi è un proliferare di gestionali alberghieri , chiamati P.S.M. ( Property Management System ), che si occupano della gestione e programamzione del lavoro di strutture ricettive. Una delle funzioni pubblicizzate è quella di prevdere tramite machine learning gli arrivi nelle prossima stagione turistica nella struttura stessa. Molti di questi programmi utilizzano i dati delle presenze della stagione precedente.

 E se non avessi questi dati? Oppure se non fossero struturati in modo da intragire con il P.S.M. 
In questo caso ci verrebbero in aiuto proprio loro : i Dati Sintetici. 
Scrivici e …

Viaggia con Noi …nel poco noto

info@ailovetourism.com

via Ammiraglio Millo 9 .

Alberobello, Bari.

📞 +39 339 5856822

Nome
Email
Cognome
Messaggio libero
The form has been submitted successfully!
There has been some error while submitting the form. Please verify all form fields again.