Data Governance & Data Management (3)

Analisi dei dati

L'analisi dei dati è un'attività cruciale per la realizzazione di sistemi informativi, in quanto ha un impatto diretto su tutte le fasi successive dello sviluppo. La definizione del modello dati è pertanto centrale per l'analisi sia in ottica strutturata che in ottica Object Oriented.
Il corso presenta un insieme di tecniche (Entity/Relationship, normalizzazione), rivolte alla progettazione di un modello dei dati indipendente da ogni particolare ambiente di sviluppo tecnologico. Introduce inoltre i fondamenti per la derivazione di un diagramma delle classi di oggetti con la notazione UML. L'apprendimento, che avviene mediante un'alternanza di sessioni teoriche e di esercitazioni in aula, non richiede come prerequisito nessuna particolare conoscenza in campo informatico. A conclusione del corso vengono svolte alcune considerazioni sull'implementazione del modello concettuale in basi di dati effettive, con particolare riferimento agli ambienti relazionali e alcuni cenni al data warehouse.

Destinatari

  • Capi progetto
  • Analisti
  • Analisti programmatori
  • Data administrator
  • Data base administrator
  • Utenti coinvolti nello sviluppo

Prerequisiti
Conoscenza generale delle problematiche relative allo sviluppo

Contenuti

  • Introduzione - il ruolo dei dati nei sistemi informativi aziendali, la progettazione delle basi di dati;
  • Il modello Entity/Relationship - entità, relationship, attributi, domini, chiavi candidate e primarie, gerarchie di specializzazione;
  • Data type non tradizionali - immagini, suoni, oggetti complessi;
  • Il modello relazionale - struttura e manipolazione dei dati, corrispondenze con il modello Entity/Relationship;
  • Teoria della normalizzazione - il processo di normalizzazione, dipendenze funzionali, forme normali (dalla prima alla quinta forma normale);
  • Definizione dei vincoli di integrità;
  • Costruzione dello schema concettuale - individuazione e raccolta dei dati, convenzioni di descrizione e denominazione, schemi concettuali analitici e di sintesi;
  • Il Reverse Engineering - tecniche e approcci, eliminazione di ridondanze e di altre caratteristiche "fisiche" degli archivi esistenti, determinazione di chiavi e relationship, integrazione delle entità;
  • Definizione e gestione di modelli complessi - integrazione dei modelli di progetto in modelli aziendali o di area, problematiche di proprietà e di condivisione delle informazioni - gestione dei dati storici;
  • Il diagramma delle classi di oggetti di UML - raffronto con l' Entity/Relationship;
  • Considerazioni sul disegno di data base - derivazione del modello logico e sua ottimizzazione, lo star schema del data warehouse;
  • Casi studio ed esercitazioni.

Durata

3 giorni

Data Governance

I dati hanno un valore, normalmente misurabile o altrimenti stimabile, così come la catena del valore dei dati. Il rischio di perdere questi dati o di corromperli è quindi reale ed è stimabile anch’esso. La gestione di questi asset è quindi non solo un fenomeno tecnologico, ma anche organizzativo e normativo. La qualità dei dati assume una rilevanza critica in tutti i suoi aspetti, anche quello di single point of truth, ovvero: se ho più versioni di un dato, qual è quella di cui mi posso fidare? La proliferazione di applicazioni in azienda (anche su piattaforme e tecnologie differenti) ha comportato la diffusione disordinata di database più o meno interconnessi fra loro.
C’è quindi una crescente esigenza di fare ordine, qualità, conoscenza nel caos dei dati anche alla luce di:

  • Nuovi paradigmi (Data Warehouse, Big Data, Open Data, Blockchain);
  • Fusioni o riorganizzazioni aziendali;
  • Esigenze di auditing e di certificazione dei dati (PCI, GDPR, 285, Solvency …);
  • Data Architecture e Data Catalog.

È necessario un governo dei dati, una Data Governance, che affronti questi argomenti per tracciare e coordinare le soluzioni proposte dai vari specialisti aziendali (Modeling, Quality, Security, Privacy …) in un quadro di business aziendale basato sul valore e sul rischio ma non sulla burocrazia. E se la Data Governance sembra un programma non sostenibile si può optare per un  progetto di Data Catalog, del tutto Bottom Up a partire dalla discovery dei dati fino a un processo di governo ridotto e agile.
Il corso esamina questi argomenti anche alla luce degli standard internazionali e definisce gli Stakeholder (dal CDO ai Data Steward etc.), le architetture, le soluzioni tecnologiche ed organizzative necessarie alla formulazione del Programma di Data Governance.

Destinatari

• data administrator
• data base administrator
• capi progetto
• analisti e progettisti
• architetti software

Prerequisiti
Conoscenza delle problematiche legate alla gestione dei dati.

Contenuti
Introduzione - Che cosa è la Data Governance; gli ambiti della Data Governance e i suoi Stakeholder; il Chief Data Office (CDO), i Data Steward, I Data Owner; i Framework di DG: Data Maturity Model (DMM), Data Management Association (DAMA) e altro.
Gestione dei metadati - Che cosa sono i metadati; standard per la definizione dei metadati; Glossario di business e Dizionario dati, Qualità della documentazione; gestione dei metadati aziendali, modelli e processi organizzativi, tecnologie; definizione delle misure di Security e altri tipi di metadati.
Data Catalog e Data Governance - Che cosa è un Data Catalog; Metadata Discovery; Reverse Engineering; Lineage semantico e Data Lineage.
Data Modeling - Il Ciclo di vita di un Modello dati; Foreword Engineering; un modello ed un processo organizzativo, best practice e deliverable di processo.
Data Architecture - Il processo di ridocumentazione e di ottimizzazione degli asset dati vs. le applicazioni.
Integrazione dei dati - Basi di dati integrate e basi di dati replicate, problemi formali e semantici; Modelli di sintesi; Master Data, modelli “canonici” per la SOA.
Qualità dei dati e analisi dei rischi - Il valore dei dati e gli economics: possiamo mette il valore dei dati a bilancio?; la normativa ISO sulla qualità dei dati; analisi del rischio; problemi derivanti dalla non qualità: problemi legali, economici e d’immagine.
Le normative e la Data Governance - Normative e Data Governance, un’interazione PUSH PULL; Data Governance come fattore abilitante; alcuni esempi di normative: GDPR e 285 BI.
Il progetto di Data Governance - Approccio incrementale al progetto, partire da ciò che c’è già: ITIL? COBIT? ISO 9001?; passi del progetto e ruoli coinvolti; auditing e reporting; architetture e tecnologie; Data Governance per il Cloud.

Durata

3 giorni

Data Warehouse: architettura e principi

Il Data Warehouse è una soluzione dati per supportare in modo adeguato i processi decisionali. Dopo oltre vent’anni di esperienze, vanno riconsiderare le scelte fatte in passato, in termini sia architetturali sia di fruizione dei dati, alla luce dei modelli di business emergenti che vedono come prerequisito la connessione 24x7 al sistema informativo. Sul Back End, il Cloud delocalizza la base dati, mentre sul Front End i dispositivi Mobile consentono l’utilizzo delle informazioni ad un bacino di utenza sempre più ampio. Un altro aspetto importante è quello delle tecnologie che supportano i Big Data, strutturati o meno. E’ ormai dominio comune l’utilizzo di Data Lake al posto di Operational Data Store o Aree di Staging: quando è meglio l’una o l’altra? E la Data Virtualization quale apporto di semplificazione può portare all’intera architettura? Il corso, partendo dal ciclo di vita del Data Warehouse, esplora le nuove tecnologie disponibili (DW, ETL, ELT, BI) e le nuove richieste informative provenienti dal business (dal marketing al controllo di gestione, al Customer Care, …) con l’obiettivo di identificare la risposta più appropriata in relazione alle necessità dell’utente. Sono inoltre esaminate le principali architetture, da quelle classiche a 2/3 livelli, fino alla Lambda / Gamma-Delta Architecture evidenziandone caratteristiche, pregi e difetti e comparandole fra loro in termini di necessità di utilizzo. Obiettivo del corso è quindi di dare una panoramica completa specialmente dal punto di vista delle strutture dati, del loro ciclo di vita e della Data Governance.

Destinatari

  • Responsabili dello sviluppo
  • Progettisti e Designer
  • Analisti

Prerequisiti

Conoscenza di base su sistemi gestionali e di business intelligence, dati, ciclo di vita del software.

Contenuti

Data Warehouse Framework: architettura di un ambiente di Data Warehousing
Aspetti architetturali e modelli: confronto tra le diverse architetture (Data Warehouse, Data Mart e ODS), confronto tra i modelli (SQL, NoSQL, Star Schema e derivati)
Architetture per i Big Data: che cosa sono, quali i sono i principi, quando sono utili e quali sono i parametri da tenere sotto controllo.
Architettura Lambda e Gamma-Delta, on Premise ed in Cloud, con disamina delle principali offerte di mercato (da Amazon a Snowflake).
Dati in movimento: ETL, ELT ed ESB, fino alla Data Virtualization.
Acquisizione dei dati: problematiche e tecniche per la costruzione delle componenti della componente software.
Big Data e Data Warehouse: quando e come integrarli, posizionamento.
Metadati: ruolo all’interno dell’ambiente di Data Warehousing, Data Catalog.
Applicare le regole della Data Governance ad un Data Warehouse: dal Business Glossary al Data Catalog, alla derivazione degli schemi, agli schemi di sintesi. Qualità dei metadati e dei dati.
Security e audit di un Data Warehouse: segmentazione e tipologie di utenti.
Problematiche e modalità di gestione di un progetto Data Warehouse: confronto tra approccio tradizionale al PM e approccio Agile (requisiti, metodi di analisi, strategie di Test).
Le applicazioni che operano su un Data Warehouse.
Esempi e Caso studio.

Durata

3 giorni