Deep Learning ed i suoi premi.

Parlando di Equazione di Bellman, dobbiamo fare riferimento ad un ramo specifico della Intelligenza Artificiale, ovvero: il DEEP LEARNING

Senza entrare in tecnicismi particolarmente cerchiamo di dare delle definizioni sul Deep Learning, altresì, chiamato Apprendimento Profondo.

Il deep learning è l’apprendimento profondo che ottimizza processi di intelligenza artificiale (AI), grazie al machine learning (ML), con cui le macchine possono imparare.

L’apprendimento profondo rappresenta, dunque, una delle più significative fonti di successo per l’intelligenza artificiale. Infatti, le reti neurali artificiali, in grado di analizzare in automatico dati  – come immagini, audio, video o serie temporali – superano in molti casi le prestazioni umane.

In questo contesto, il deep learning riveste un ruolo sempre più importante. Basti pensare agli algoritmi di apprendimento profondo “rinforzato” nell’ambito dei problemi decisionali sequenziali.

Grazie al reinforcement learning, per esempio, nel 2016 il software Google Deepmind di AlphaGo ha potuto battere il campione mondiale di Go, anticipando di anni le previsioni.

Cos’è il deep learning o apprendimento profondo

Il deep learning è un apprendimento automatico e gerarchico, un segmento della branca di machine learning e artificial intelligence (AI) che imita il modo in cui gli umani acquisiscono alcune tipologie di conoscenza. Si tratta di un metodo ad hoc di machine learning che ingloba reti neurali artificiali in strati successivi per apprendere dai dati in maniera iterativa.

Dunque, il deep learning è una tecnica per apprendere esponendo le reti neurali artificiali ad ampie quantità di dati, in modo da imparare a eseguire i compiti assegnati.

L’apprendimento profondo, quindi, è un elemento importante di data science, che include statistica e modellazione predittiva. Infatti è l’apprendimento con cui le “macchine” apprendono dati attraverso l’utilizzo di algoritmi, soprattutto di calcolo statistico.

Sottocategoria del machine learning, basato sull’assimilazione di rappresentazioni di dati, e branca dell’intelligenza artificiale, il deep learning apprende multipli livelli di rappresentazione che:

  • equivalgono a scale di fattori o concetti;
  • definiscono il campo di ricerca dell’apprendimento automatico e dell’intelligenza artificiale;
  • fa sì che i concetti di basso livello definiscano quelli di livello alto.

Si riferisce agli algoritmi delle reti neurali artificiali che si richiamano alla struttura e alla funzione celebrale.

Come funziona il deep learning

Il deep learning sfrutta architetture come le reti neurali artificiali, applicate nei diversi ambiti, in un sistema in grado di utilizzare una classe di algoritmi di apprendimento automatico che:

  • sfruttano più livelli di unità non lineari a cascata, per eseguire compiti di estrazione di caratteristiche e di trasformazione (dove ogni livello successivo impiega come input l’output del livello precedente);
  • si fondano sull’apprendimento non supervisionato di livelli gerarchici multipli di caratteristiche (e di rappresentazioni) dei dati;
  • appartengono alla più ampia classe di algoritmi di apprendimento della rappresentazione dei dati nell’ambito dell’apprendimento automatico (machine learning);
  • apprendono livelli di rappresentazione multipli che costituiscono una scala gerarchica di concetti equivalenti a vari livelli di astrazione.

Equazione, formulata dal matematico statunitense R.E. Bellman nel 1957, che esprime il valore della soluzione ottimale di un problema di ottimizzazione matematica traducibile in termini di programmazione dinamica, ovvero scomponibile in una sequenza di sottoproblemi concatenati. È naturale pensare che il dinamismo sia indotto dal trascorrere del tempo, e in molte delle applicazioni questa è anche la situazione reale. Tipiche applicazioni riguardano, per es., la definizione delle politiche di investimento intertemporale, il controllo delle scorte, la turnazione del personale, la gestione dei servizi di un aeroporto.

DEFINIZIONE TRECCANI ONLINE

Equazione di Bellman ( …roba pesante )

L’equazione di B. sfrutta il cosiddetto principio di ottimalità. Secondo un efficace riassunto, tale principio dice semplicemente che, se si considera la strada più corta per andare da Roma a Parigi e questa passa da Milano, il tratto Milano-Parigi di questo percorso ottimale è il più corto fra tutti quelli che vanno da Milano a Parigi. La versione formalizzata dell’equazione è la seguente:

V(x0)=maxa0 {F(x0, a0)+βV(x1)}

soggetta al vincolo: a0 in Ψ(x0), x1=T(x0, a0) in cui a0 è il valore della variabile decisionale all’epoca 0, appartenente all’insieme Ψ(x0) delle alternative ammissibili nello stato iniziale x0 del sistema; xh, h=1,…, n è lo stato del sistema all’epoca h, in generale funzione T(xh−1, ah−1) dello stato del sistema e della decisione presa all’epoca precedente h−1; β è un opportuno fattore di attualizzazione uniperiodale, F è il valore della funzione obbiettivo nel singolo stadio e V è la funzione valore, ovvero il valore della decisione ottima.

Facciamo l’esempio di un cane che deve raggiungere un osso tramite un percorso che non conosce. C’è un percorso con minima distanza che gli darà il premio maggiore ed uno con percorso più lungo che non gli consegnerà alcun premio.

All’inizio il cane farà percorsi casuali e, solo dopo tanti tentativi, troverà la strada con il premio maggiore. Ad ogni tentativo, imparerà dalla esperienza passata.

La forza dell’algoritmo è data proprio dalla sua lettura dei casi precedenti ; viene chiamato Apprendimento con Rinforzo proprio perchè ogni passaggio che porta un premio sempre maggiore viene sommato alla esperienza corrente; al ciclo in corso dell’algoritmo stesso.

L’Equazione di Bellman nel Revenue Management alberghiero

Lasciamo stare il “cane” dell’esempio e focalizziamoci sul concetto di guadagno massimo ( revenue massimo ) e prezzo da assegnare ad un servizio.
Ovviamente, per avere successo nel Mercato turistico devo offrire il miglior prezzo sia per me albergatore che per il cliente finale. Nell’esempio precedente il “cane” sarà il prodotto stesso, l’osso sarà il prezzo da assegnare al prodotto ed il percorso sarà l’algoritmo con la configurazione dei parametri ottenuti .
Potete ben capire la potenza di una semplice regola matematica ... un algoritmo che potrebbe assegnare miliardi di premi e miliardi di percorsi ... per arrivarne a formularne uno solo; il migliore.
Scrivici e …

Viaggia con Noi …nel poco noto

info@ailovetourism.com

via Ammiraglio Millo 9 .

Alberobello, Bari.

📞 +39 339 5856822

Nome
Email
Cognome
Messaggio libero
The form has been submitted successfully!
There has been some error while submitting the form. Please verify all form fields again.