Spaces:
Sleeping
Sleeping
| title: Sistema Ibrido di Anonimizzazione Dati | |
| emoji: 🔒 | |
| colorFrom: blue | |
| colorTo: red | |
| sdk: gradio | |
| sdk_version: 4.44.0 | |
| app_file: app.py | |
| pinned: false | |
| license: mit | |
| # 🔒 Sistema Ibrido di Anonimizzazione Dati | |
| Un sistema avanzato per l'identificazione e anonimizzazione di dati sensibili in testi italiani, che combina: | |
| - **Stanford Deidentifier**: Modello transformer specializzato | |
| - **Microsoft Presidio**: Framework enterprise per data privacy | |
| - **Regex personalizzate**: Pattern specifici per formati italiani | |
| ## 🎯 Caratteristiche | |
| - ✅ Riconoscimento di **10+ tipi di entità** (persone, CF, P.IVA, IBAN, telefoni, email, ecc.) | |
| - 🎛️ **Controllo granulare** per ogni tipo di entità | |
| - 🔄 **3 modalità di anonimizzazione**: sostituzione, oscuramento, pseudonimizzazione | |
| - ⚙️ **Parametri avanzati** personalizzabili | |
| - 📊 **Statistiche dettagliate** di rilevamento | |
| ## 🚀 Utilizzo | |
| 1. Inserisci il testo contenente dati sensibili | |
| 2. Seleziona i tipi di entità da anonimizzare | |
| 3. Configura il metodo di anonimizzazione | |
| 4. Visualizza i risultati con entità evidenziate | |
| ## 🔬 Tecnologie | |
| - **Gradio** per l'interfaccia web | |
| - **spaCy** per il processamento NLP | |
| - **Transformers** per i modelli deep learning | |
| - **Presidio** per la privacy dei dati | |
| ## 📋 Esempi supportati | |
| - **Persone**: Mario Rossi, Dott. Giovanni Bianchi | |
| - **Codici Fiscali**: RSSMRC80D15H501V | |
| - **Partite IVA**: IT12345678901 | |
| - **IBAN**: IT60X0542811101000000123456 | |
| - **Telefoni**: +39 333-123-4567 | |
| - **Email**: esempio@dominio.com | |
| - **Targhe**: AB123CD | |
| --- | |
| Basato sulla ricerca comparativa di Small Language Models per l'anonimizzazione di dati in lingua italiana. |