UNSUPERVISED DEEP LEARNING su RTX 4090 – Spatial Transformers in PyTorch (Leggiamo il Paper!)



UNSUPERVISED DEEP LEARNING su RTX 4090 – Spatial Transformers in PyTorch (Leggiamo il Paper!)

UNSUPERVISED DEEP LEARNING su RTX 4090 - Spatial Transformers in PyTorch (Leggiamo il Paper!)

Uno Spatial Transformer è una rete neurale che effettua trasformazioni geometriche sull’immagine o feature map in ingresso. Nel Deep Learning si piazza nella categoria dell’apprendimento NON Supervisionato, e lontano dal contesto del Reinforcement Learning. Lo Spatial Transformer, tramite un meccanismo di Attention riesce a localizzare le zone calde della feature map da trasformare, con l’obiettivo di rendere più semplice il training del classificatore con il quale lavora assieme.

Questa rete infatti è come un piccolo parassita che si inserisce dentro una “qualsiasi” rete neurale, aiutandola nel task che deve compiere. Nell’esempio di oggi avremo una rete neurale che dovrà andare a classificare i numeri di MNIST. Noi daremo volontariamente poca capacità di rappresentazione a questo classificatore, in modo tale che da solo ottenga un punteggio basso di accuratezza sul dataset. Così facendo e inserendo uno Spatial Transformer all’interno di questa architettura, ci ritroveremo con quest’ultimo che andrà a modificare la geometria delle immagini di input per diminuire la varianza tra esempi diversi appartenenti alla stessa classe, rendendo più semplice la vita al classificatore.

Lo Spatial Transformer apprenderà le trasformazioni geometriche in modo Unsupervised, senza una funzione di loss che gli dice cosa sbaglia sulla predizione dei parametri. Quest’ultimo farà predizione sui parametri di una trasformazione geometrica affine, potete approfondire qui l’argomento:
https://en.wikipedia.org/wiki/Affine_transformation

La trasformazione Affine contiene 6 parametri legati allo skew, rotazione, traslazione, scaling, ecc., preservando il parallelismo e le linee. Lo stesso Spatial Transformer può essere modificato per lavorare ad esempio su trasformazioni prospettiche composte da 8 parametri.

Iscriviti QUI al canale!
Https://youtube.com/c/ProjectoOfficial?sub_confirmation=1

Spatial Transfomers in pytorch su GitHub
https://github.com/ProjectoOfficial/AI_Python/tree/master/SPATIAL%20TRANSFORMER

La nostra lista amazon dei prodotti migliori!
AMAZON: PC – FILAMENTO 3D – ARDUINO – RASPBERRY PI
https://amzn.to/2RV7KWc

Vuoi farci un Regalo o inviarci un prodotto? Vi ringrazieremo in un video dedicato! 😀
https://www.amazon.it/hz/wishlist/genericItemsPage/L853T1Q0OWVU

Seguici sui nostri social!
Facebook: https://www.facebook.com/MiniProjectsOfficial

Instagram: https://www.instagram.com/officialprojecto/

#DeepLearning #MachineLearning #ComputerVision

Comments are closed.