--- title: Sistema Ibrido di Anonimizzazione Dati emoji: 🔒 colorFrom: blue colorTo: red sdk: gradio sdk_version: 4.44.0 app_file: app.py pinned: false license: mit --- # 🔒 Sistema Ibrido di Anonimizzazione Dati Un sistema avanzato per l'identificazione e anonimizzazione di dati sensibili in testi italiani, che combina: - **Stanford Deidentifier**: Modello transformer specializzato - **Microsoft Presidio**: Framework enterprise per data privacy - **Regex personalizzate**: Pattern specifici per formati italiani ## 🎯 Caratteristiche - ✅ Riconoscimento di **10+ tipi di entità** (persone, CF, P.IVA, IBAN, telefoni, email, ecc.) - 🎛️ **Controllo granulare** per ogni tipo di entità - 🔄 **3 modalità di anonimizzazione**: sostituzione, oscuramento, pseudonimizzazione - ⚙️ **Parametri avanzati** personalizzabili - 📊 **Statistiche dettagliate** di rilevamento ## 🚀 Utilizzo 1. Inserisci il testo contenente dati sensibili 2. Seleziona i tipi di entità da anonimizzare 3. Configura il metodo di anonimizzazione 4. Visualizza i risultati con entità evidenziate ## 🔬 Tecnologie - **Gradio** per l'interfaccia web - **spaCy** per il processamento NLP - **Transformers** per i modelli deep learning - **Presidio** per la privacy dei dati ## 📋 Esempi supportati - **Persone**: Mario Rossi, Dott. Giovanni Bianchi - **Codici Fiscali**: RSSMRC80D15H501V - **Partite IVA**: IT12345678901 - **IBAN**: IT60X0542811101000000123456 - **Telefoni**: +39 333-123-4567 - **Email**: esempio@dominio.com - **Targhe**: AB123CD --- Basato sulla ricerca comparativa di Small Language Models per l'anonimizzazione di dati in lingua italiana.