Machine Learning e Data Mining in R

0
Join & Subscribe
Coursera
Free Online Course (Audit)
Italian
Paid Certificate Available
4 weeks long, 31 hours worth of material
selfpaced

Overview

Il corso Machine Learning e Data Mining in R è rivolto a chiunque voglia avere una pratica panoramica delle tecniche di apprendimento automatico, dalle più interpretabili - come l’analisi di regressione, delle componenti principali e dei gruppi - a quelle più flessibili come le reti neurali artificiali, sia shallow che deep - e le più ricorrenti problematiche di analisi e modellazione di dati e problemi reali - come collinearità, overfitting, regolarizzazione e knowledge transfer.
La modalità di erogazione del corso è di tipo learning by doing, mediante una continua implementazione in R dei concetti esposti. Le diverse unità ti verranno prima illustrate a voce, per permetterti di ricordare e capire, e poi rese disponibili sotto forma di reading, per permetterti di analizzarne criticamente il contenuto. Alla fine di ogni unità, verrai messo alla prova attraverso open Lab in ambiente di sviluppo RStudio, che ti permetteranno di applicare i metodi trattati nel corso ai tanti data set reali che ti saranno forniti. Ti verrà infine richiesto di valutare i tuoi progressi mediante graded quiz contenenti domande a risposta multipla. Non rimandare: Machine Learning e Data Mining in R sono ora a portata di mano!

Syllabus

  • Elementi di R
    • In questa week, ti introdurrò al linguaggio R: avrai una panoramica sulle strutture dati in R, su data wrangling e visualization. Imparerai ad usarei principali pacchetti R, tra cui i famosi dplyr e ggplot2, inclusi in tidyverse. Quando necessario, ti verranno fornite nozioni teoriche di base necessarie per una maggiore comprensione dei concetti implementati in R nei successivi moduli.
  • Apprendimento automatico non supervisionato
    • In questa week,dopo aver introdotto la differenza tra metodi di apprendimento automatico (machine learning) supervisionato e non supervisionato, ti verranno illustrate le principali tecniche multivariate di esplorazione dei dati mediante R e i principali metodi di apprendimento automatico non supervisionato, come l'analisi dei gruppi (clustering) e l'analisi delle componenti principali (PCA).
  • Apprendimento automatico supervisionato
    • In questa week, approfondirai gli elementi di apprendimento automatico (machine learning) supervisionato. Imparerai ad applicare tecniche di predizione numerica a partire dai modelli lineari di regressione semplice e multipla. Ti sensibilizzerò verso i tipici problemi derivanti dall'applicazione della regressione lineare multipla a data set reali e le più comuni soluzioni attraverso la selezioni degli attributi e la regolarizzazione. Inoltre, ti verranno forniti strumenti pratici per la valutazione della capacità descrittiva (in-sample) e predittiva (out-of-sample) di un metodo di machine learning supervisionato e per la selezione del modello interpretativo migliore.
  • RetiNeurali e Deep Learning
    • In questa week ti introdurrò allo studio delle Reti Neurali Artificiali: partirai dal singolo percettrone, che è in grado di risolvere solo problemi di classificazione linearmente separabili, e, passando per il percettrone multilivello, che è in grado di risolvere problemi di classificazione e predizione numerica anche non linearmente separabili, arriverai alla "rivoluzione" del Deep Learning. Vedrai anche come è possibile utilizzare il Knowledge Transfer per addestrare le reti deep.

Taught by

Antonio Lepore, Biagio Palumbo and Carlo Sansone