Nella “Relazione per orientare le azioni del Governo volte a ridurre l’evasione fiscale derivante da omessa fatturazione” il Dipartimento delle Finanze identifica nel text mining e nel data scraping la nuova frontiera tecnologica per combattere l’evasione dell’IVA attraverso un apposito iter di valutazione del profilo di rischio fiscale del contribuente.
Il rischio fiscale può essere definito come “il rischio di operare in violazione di norme di natura tributaria in palese contrasto con i principi o le finalità dell’ordinamento”.
Quando si tratta di rischi fiscali bisogna premettere che questi possono avere diverse cause e natura e sono generalmente classificabili come segue:
- rischio di identificazione: ad esempio, soggetti registrati a qualsiasi titolo senza averne i presupposti; soggetti che, pur avendone l’obbligo, non si registrano; disponibilità di informazioni errate da parte dell’Amministrazione Finanziaria.
- Rischio di omessa dichiarazione.
- Rischio di infedele dichiarazione.
- Rischio di omesso o insufficiente versamento.
In tema di analisi del rischio fiscale, fino a questo momento l’Agenzia delle Entrate ha disposto quasi solo esclusivamente dei dati presenti nell’archivio dei rapporti finanziari che hanno permesso all’ente di:
- analizzare i flussi finanziari movimentati e la loro variazione di periodo in periodo;
- enucleare le incongruenze esistenti tra il numero di rapporti o posizioni attive e le consistenze totali;
- rilevare la pericolosità complessiva dei rapporti finanziari riconducibili al soggetto, nei diversi ruoli di titolare, delegato e titolare effettivo, nonché dalla frequenza di apertura e/o chiusura, di rapporti anche in corso d’anno.
Un approccio che può essere ulteriormente migliorato attraverso la strumentazione messa a disposizione dallo sviluppo tecnologico e quindi dall’intelligenza artificiale attraverso le tecniche di Text Mining e Data Scraping.
Il Text Mining è una tecnica di Intelligenza Artificiale che utilizza l’elaborazione di un linguaggio naturale per trasformare il testo libero, non strutturato, di documenti/database come pagine web, articoli di giornale, e-mail, agenzie stampa, post/commenti sui social media in dati strutturati e normalizzati.
Si tratta di dati che rappresentano già una informazione, “ovvero fatti, relazioni e asserzioni che possono essere integrati in database, data-warehouse o dashboard di business intelligence e utilizzati per indagini descrittive, predittive e prescrittive” che attraverso algoritmi di Machine Learning possono non solo comprendere un comportamento, ma anche “anticipare problematiche e comportamenti, bisogni e tendenze”.
Secondo la relazione del Dipartimento delle Finanze, il Text Mining sarebbe tuttavia da sottoporre al parere del Garante della Privacy insieme alla tecnica del Data Scraping, chiarendo quali sono le tecniche utilizzabili, le tempistiche di utilizzo/cancellazione dei dati avente natura particolare ed individua e le strutture deputate a svolgere l’attività.
Il Data Scraping è una tecnica già utilizzata in Francia e che consentirebbe all’Agenzia delle Entrate di avvalersi di particolari algoritmi di Intelligenza Artificiale “addestrati” ad “effettuare sistematicamente attività di analisi del rischio basate sulla raccolta massiva e sull’elaborazione automatizzata dei dati liberamente accessibili sui siti e piattaforme web, nonché’ di quelli resi pubblici dagli utenti”.
Qualora i dati acquisiti attraverso il Text Mining ed il Data Scraping ai fini dell’accertamento e quindi degli approfondimenti istruttori dovessero essere effettivamente utilizzati insieme ad altri dati di cui già dispone l’Agenzia delle Entrate, il periodo della loro conservazione potrebbe essere fissato a 10 anni, mentre in caso di procedimenti contenziosi dovrebbero essere conservati fino al termine dell’iter di giudizio.