Programma ECOSISTER: codice ECS00000033
PNRR: Missione 4 Componente 2, “Dalla ricerca all’impresa”, Investimento 1.5, “Creazione e rafforzamento di “Ecosistemi dell’innovazione” finanziato dall’Unione europea – NextGenerationEU”
Università degli Studi di Ferrara
Bando a cascata per le Imprese SPOKE 5 - Tema 4: Sviluppo di soluzioni e servizi innovativi e sostenibili per la tutela del patrimonio culturale, marittimo e costiero. La rigenerazione e lo sviluppo dei sistemi turistici, la realizzazione di nuovi modelli, strumenti e servizi IT per incrementare la qualità dell'offerta turistica
Decreto del Direttore Generale rep. n. 1517/2024, prot. n. 231800/2024 del 31 luglio 2024
CUP: F78H22000410006
ESplora l’Emilia Romagna.
Il sistema per la produzione, distribuzione e fruizione di contenuti digitali relativi al patrimonio culturale, artistico, paesaggistico, marittimo e costiero regionale

Abstract
Il progetto ESplora nasce con l’obiettivo di offrire ai visitatori di qualsiasi nazionalità uno strumento innovativo e di facile utilizzo, capace di garantire un accesso immediato a una vasta banca dati di contenuti culturali. Attraverso una App multi-device, ESplora mette a disposizione informazioni digitali sul patrimonio storico, artistico e culturale, arricchite da funzionalità di realtà aumentata e supportate da sofisticate tecniche di web crawling e data mining. Queste tecnologie permettono di recuperare, aggregare e valorizzare dati disponibili sul web e da fonti open data, trasformandoli in contenuti fruibili in modo semplice e intuitivo.
La piattaforma è progettata per rispondere alle esigenze di enti, operatori del settore, cittadini e turisti, fornendo strumenti mirati per informare, orientare e migliorare l’esperienza di visita sul territorio.
Grazie alla sua struttura flessibile e integrabile, ESplora può connettersi a iniziative già esistenti, favorendo collaborazione, diffusione e partecipazione attiva a livello locale, contribuendo così a rafforzare la valorizzazione e la conoscenza del patrimonio culturale.
Il progetto
Il progetto ESplora ha avuto una durata complessiva di 12 mesi, con avvio il 1° agosto 2024 e conclusione il 31 luglio 2025. Durante questo arco temporale, le attività di ricerca e sviluppo sono state guidate da obiettivi chiari e concreti, volti a creare una piattaforma innovativa, flessibile e in grado di valorizzare il patrimonio culturale, antropologico e naturalistico attraverso strumenti digitali di ultima generazione.
Gli obiettivi principali del progetto possono essere sintetizzati nei seguenti punti:
- Banca Dati. Creare una struttura dati snella, efficiente e ottimizzata, in grado di archiviare contenuti facilmente fruibili da turisti e visitatori. La banca dati doveva garantire rapidità di consultazione e semplicità di gestione, evitando ridondanze e complessità inutili, per focalizzarsi sulla qualità dell’esperienza utente.
- Contenuti. Definire una metodologia innovativa per popolare la banca dati con un ampio patrimonio di contenuti, distribuiti capillarmente sul territorio, riducendo al minimo i tempi e i costi di creazione e manutenzione. L’obiettivo era quello di realizzare un archivio ricco e costantemente aggiornato, capace di valorizzare luoghi, beni e percorsi culturali.
- Crawling. Sviluppare e implementare algoritmi di Crawling e Scraping, indispensabili per l’acquisizione automatizzata di contenuti informativi già disponibili su siti web e banche dati pubbliche. Questo approccio permette di recuperare in modo sistematico risorse digitali e trasformarle in informazioni strutturate, pronte per essere integrate nel sistema.
- Data Mining. Evolvere e potenziare il motore di Data Mining già sviluppato in progetti precedenti, con l’obiettivo di arricchire costantemente la banca dati e di supportare nuove modalità di aggregazione dei Punti di Interesse (POI). In particolare, il sistema è stato progettato per permettere sia raggruppamenti tradizionali, basati sulla localizzazione geografica dei beni, sia percorsi tematici svincolati dalla loro posizione fisica, così da offrire nuove prospettive di fruizione culturale.
- Portale Redazionale. Realizzare un portale redazionale completo, pensato per la gestione e il mantenimento dei contenuti informativi del sistema ESplora. Questo strumento integra funzionalità GIS, traduzione assistita e processi strutturati di gestione del flusso redazionale: dalla fase di redazione, alla storicizzazione delle versioni, fino alla validazione e alla pubblicazione dei contenuti.
- App. Sviluppare una applicazione mobile, scaricabile dai principali store digitali, in grado di accedere direttamente alle informazioni archiviate nel repository centralizzato. L’app è stata progettata per garantire semplicità d’uso e per offrire un’esperienza di visita immersiva e completa, integrando mappe, contenuti multimediali e strumenti innovativi di interazione.
Obbiettivi raggiunti
1 – Banca dati. Per la realizzazione della banca dati è stato implementato un database basato sul DBMS NoSQL ElasticSearch, scelto per la sua capacità di archiviare, indicizzare e restituire grandi volumi di informazioni in maniera rapida ed efficiente. L’ambiente di produzione è stato configurato in modalità cluster, attualmente costituito da tre nodi, una soluzione che consente di garantire alte performance sia nelle ricerche sia nella gestione dei dati, oltre a una migliore affidabilità e scalabilità del sistema.
Nella progettazione della base dati si è posta particolare attenzione alla semplicità e leggerezza della struttura. È stata quindi adottata una modellazione snella, priva di sovrastrutture non necessarie e orientata a memorizzare soltanto i dati realmente essenziali. Questa scelta ha permesso di ottimizzare al massimo i tempi di interrogazione, riducendo la complessità e focalizzandosi sugli obiettivi specifici del progetto.
I tracciati record di ESplora non seguono gli standard catalografici ICCD, tipici delle piattaforme di tipo museale o archivistico, ma sono stati appositamente progettati con un criterio diverso: privilegiare le performance e al tempo stesso garantire una gestione efficace dei contenuti in modalità multilingua, requisito fondamentale per la fruizione internazionale del sistema.
Anche la gestione dei dati geografici è stata integrata direttamente nei moduli nativi di ElasticSearch per il trattamento dei dati spaziali. Grazie a questa soluzione, la georeferenziazione dei Punti di Interesse avviene in modo efficiente e nativamente supportato, rendendo più immediate sia le ricerche basate su coordinate sia la rappresentazione cartografica delle informazioni.
L’accesso ai dati da parte delle applicazioni client avviene attraverso uno strato di API HTTP/REST, che fornisce le informazioni in formato JSON. Questo approccio garantisce un’integrazione semplice e standardizzata con i diversi componenti della piattaforma e con eventuali applicazioni esterne.
L’efficacia delle scelte progettuali è facilmente riscontrabile nell’utilizzo quotidiano dei servizi ESplora: le interrogazioni restituiscono risposte in tempi più che soddisfacenti, dimostrando come l’architettura sia stata dimensionata in maniera corretta per gli obiettivi prefissati. Inoltre, il sistema è scalabile: qualora in futuro si rendesse necessario aumentare la capacità di elaborazione o archiviazione, l’infrastruttura potrà essere potenziata con semplicità, aggiungendo ulteriori nodi sia al cluster degli Application Server sia a quello dei Data Server, senza richiedere interventi invasivi o modifiche radicali.
2 – Contenuti. Il sistema ESplora è stato progettato per garantire la massima flessibilità nella gestione delle informazioni e mette a disposizione due diverse modalità di inserimento dei contenuti: una manuale e una automatizzata.
La modalità manuale corrisponde al tradizionale data entry svolto da operatori specializzati. Pur essendo più onerosa in termini di tempo e risorse, questa modalità si rivela particolarmente utile in contesti specifici, ad esempio per avviare progetti di arricchimento dei contenuti sviluppati in convenzione con enti culturali, università o operatori del settore turistico. Grazie a questa modalità è possibile garantire una forte attenzione alla qualità, alla precisione delle informazioni e alla personalizzazione dei contenuti, aspetti fondamentali in progetti che richiedono un elevato livello di affidabilità scientifica o documentale.
La modalità automatizzata, invece, rappresenta la vera innovazione introdotta dal progetto di ricerca ed è stata uno degli obiettivi centrali perseguiti sin dall’inizio. Nel corso delle attività sono stati implementati algoritmi e procedure avanzate in grado di acquisire automaticamente dal web una grande quantità di dati e informazioni, di rielaborarli, strutturarli e infine memorizzarli nella banca dati ESplora. Questi processi permettono di recuperare in modo sistematico contenuti relativi al patrimonio storico, artistico e culturale (sia immagini sia testi descrittivi), di associarli ai beni già censiti all’interno del sistema e di renderli immediatamente disponibili per la fruizione da parte degli utenti finali.
Grazie all’integrazione tra la modalità manuale e quella automatizzata, il progetto ha potuto beneficiare sia della precisione e della qualità garantite dal lavoro umano, sia della rapidità e della capacità di scala resa possibile dalle procedure automatiche. Al termine del progetto di ricerca, questo approccio ibrido ha consentito di archiviare e rendere disponibili oltre 2.500 punti di interesse, distribuiti in maniera capillare su tutto il territorio dell’Emilia-Romagna, creando così un patrimonio digitale ampio e strutturato, a disposizione sia dei cittadini che dei visitatori.
3 – Crawling. Il processo di acquisizione automatizzata rappresenta uno degli elementi cardine all’interno del sistema di acquisizione automatizzata dei contenuti del progetto ESplora. La sua implementazione è stata pensata per garantire un flusso strutturato e scalabile, capace di trasformare la grande quantità di informazioni disponibili sul web in dati organizzati e utilizzabili all’interno della piattaforma.
La procedura si articola in più fasi. In un primo momento vengono impiegati i motori di ricerca generalisti (Search Engines), il cui compito è quello di individuare i cosiddetti target web: si tratta delle pagine che contengono uno o più contenuti potenzialmente associabili a un determinato punto di interesse. Questa fase preliminare consente di ridurre il campo di analisi, selezionando esclusivamente siti e pagine che hanno una reale rilevanza in relazione al patrimonio storico, artistico e culturale che il sistema intende censire.
Successivamente si entra nel vivo del processo con l’applicazione delle tecniche di Crawling e Scraping.
- Il Crawling può essere immaginato come un’attività di “esplorazione sistematica”: un insieme di procedure che scandagliano in profondità le varie pagine di un sito web, seguendo i collegamenti interni e ricostruendo così la struttura complessiva del dominio. Questo permette di raccogliere non soltanto la pagina iniziale identificata come target, ma anche le eventuali pagine secondarie che contengono informazioni utili.
- Lo Scraping, invece, è il processo complementare che si occupa di “estrarre” dai contenuti delle pagine le informazioni realmente significative per il progetto. Si tratta di un’attività mirata, in cui vengono isolati dati specifici — come testi descrittivi, immagini o metadati — che vengono poi trasformati in un formato strutturato e coerente con le esigenze della banca dati ESplora.
Durante l’intero processo di acquisizione, i contenuti individuati non vengono inseriti immediatamente nel sistema definitivo, ma vengono inizialmente conservati in archivi temporanei. Questa scelta metodologica ha un duplice scopo: da un lato consente di disporre di una “copia di lavoro” su cui applicare ulteriori controlli, dall’altro permette di evitare che dati incompleti o non validati confluiscano direttamente nella banca dati principale.
A questo punto entrano in gioco ulteriori procedure di analisi e filtraggio. Esse hanno il compito di esaminare i dati raccolti, scartare le informazioni ridondanti o di bassa qualità e preparare i contenuti ritenuti validi per la successiva fase di convalida. È in questa fase che i dati grezzi vengono trasformati in risorse pronte per essere integrate nel sistema e messe a disposizione della fruizione finale.
Il processo di crawling, quindi, non si limita a una semplice acquisizione meccanica di contenuti, ma costituisce un flusso articolato, in cui tecniche di ricerca, esplorazione e estrazione lavorano in sinergia per garantire che solo informazioni pertinenti, affidabili e di qualità entrino a far parte del patrimonio informativo di ESplora.
4 - Data Mining – Il motore di data mining integrato nel sistema ESplora rappresenta uno degli elementi più rilevanti della piattaforma. Esso non è stato sviluppato da zero, ma trae origine da soluzioni già realizzate da ES Progetti e Sistemi nel corso di diversi progetti precedenti. Con ESplora questo engine è stato significativamente potenziato, aggiornato e adattato a esigenze specifiche, con l’obiettivo di garantire la capacità di elaborare in maniera efficace grandi quantità di dati eterogenei provenienti da fonti diverse, nella quasi totalità dei casi reperite sul web.
Le informazioni trattate derivano principalmente da siti web, servizi online e altre risorse digitali e, solo in casi meno frequenti, da file statici. Una volta acquisite, queste informazioni vengono sottoposte a un articolato processo di elaborazione, che può includere diverse operazioni:
- filtraggio dei dati per eliminare ridondanze, elementi incoerenti o contenuti non pertinenti;
- traduzione dei testi in più lingue, così da garantire la fruibilità internazionale del sistema;
- trasformazione e normalizzazione delle informazioni, con l’obiettivo di adattarle al modello di dati previsto dal sistema ESplora.
Al termine di questa fase di elaborazione, i contenuti vengono ricondotti a una struttura coerente e compatibile con la banca dati di ESplora, pronti per essere archiviati e successivamente resi disponibili agli utenti finali.
Il livello di automazione del processo dipende dall’affidabilità e dalla tipologia della risorsa web da cui provengono i dati. Nei casi in cui le fonti siano considerate attendibili e la qualità dei contenuti soddisfi determinati criteri, il flusso può concludersi in maniera completamente automatica, consentendo la pubblicazione diretta e l’immediata fruizione delle informazioni attraverso la piattaforma. In altri casi, invece, viene richiesto l’intervento di un operatore umano, che ha il compito di effettuare un controllo di validità e di coerenza sui dati prima che questi vengano resi disponibili.
Questo approccio ibrido, che combina l’automazione con la supervisione umana, assicura da un lato la scalabilità e l’efficienza necessarie per gestire grandi moli di dati, dall’altro la qualità e l’affidabilità indispensabili per un sistema come ESplora, orientato alla valorizzazione del patrimonio culturale e turistico.
5 - Portale Redazionale. Il portale redazionale costituisce uno strumento centrale e imprescindibile per la gestione dei contenuti all’interno della piattaforma ESplora. Si tratta di una web app progettata specificamente per facilitare e rendere più efficiente la gestione dei Punti di Interesse da parte di utenti autorizzati, offrendo un ambiente di lavoro completo, intuitivo e altamente funzionale.
L’applicazione è stata sviluppata con una particolare attenzione all’usabilità e all’efficienza operativa, così da rendere semplice e veloce l’interazione anche con grandi quantità di dati. Attraverso il portale, gli utenti possono: cercare i POI già presenti nel sistema, visualizzarli su mappe interattive, modificarli e arricchirli con nuovi contenuti. L’interfaccia, progettata per essere chiara e immediata, consente di navigare agevolmente tra i dati, di intervenire in tempo reale sulle informazioni e di utilizzare strumenti evoluti per l’inserimento di immagini, contenuti testuali e traduzioni automatizzate, che ampliano la fruibilità dei POI anche in un contesto internazionale.
Il portale non è un modulo isolato, ma è fortemente integrato con la piattaforma ESplora, della quale rappresenta il principale punto di interazione per la gestione redazionale dei contenuti. Attraverso di esso è possibile accedere a diverse funzionalità fondamentali, tra le quali:
- Pubblicazione dei POI – una volta completata la fase di revisione e redazione, i contenuti possono essere pubblicati e diventano immediatamente disponibili per la fruizione tramite la App ESplora.
- Crawling mirato – il sistema consente di avviare procedure di crawling su singoli punti di interesse, al fine di arricchire i dati già presenti con nuove informazioni acquisite automaticamente dal web.
- Storicizzazione dei dati – ogni modifica apportata ai contenuti viene versionata e archiviata nello storico, con la possibilità di consultare in qualsiasi momento le versioni precedenti e, se necessario, ripristinarle. Questa funzione garantisce tracciabilità, trasparenza e sicurezza nel processo di gestione.
- Traduzione assistita – i contenuti testuali possono essere tradotti automaticamente in più lingue, con la possibilità di ulteriori revisioni manuali da parte degli operatori, così da assicurare una diffusione multilingue dei POI.
- Creazione di itinerari tematici – gli utenti possono ideare e strutturare itinerari culturali o turistici, inserendo una descrizione dedicata e associando ai percorsi i POI pertinenti, trasformando così il portale in uno strumento utile non solo per la gestione dei dati, ma anche per la progettazione di esperienze di visita complete.
In questo modo, il portale redazionale non si limita a essere un semplice pannello di amministrazione, ma diventa un vero e proprio ambiente di lavoro collaborativo, in grado di coniugare efficienza tecnica e valorizzazione dei contenuti culturali.
6 - App. La App ESplora rappresenta l’ultimo anello della catena tecnologica ed è lo strumento principale attraverso il quale vengono erogati i servizi della piattaforma, attingendo direttamente alle informazioni archiviate all’interno del database centrale. La sua funzione è quella di mettere a disposizione degli utenti finali un accesso semplice, immediato e interattivo ai contenuti, trasformando la banca dati in uno strumento fruibile in mobilità.
L’applicazione è compatibile con i sistemi operativi Android e Apple iOS ed è già presente sugli store digitali, anche se attualmente l’accesso è limitato a un gruppo di test ristretto, al quale si può accedere esclusivamente tramite invito esplicito. Questa fase di pre-rilascio ha lo scopo di validare le funzionalità, raccogliere feedback dagli utenti e ottimizzare l’esperienza complessiva. Il rilascio pubblico dell’applicazione è previsto per dicembre 2025, data a partire dalla quale i servizi saranno disponibili a un pubblico più ampio.
Dal punto di vista funzionale, la App è stata progettata per fornire un supporto concreto agli utenti durante la visita di luoghi di interesse turistico e culturale. Il suo potenziale si esprime al meglio negli spazi aperti, grazie all’impiego della tecnologia GPS, che consente di rilevare con precisione la posizione dell’utente e di individuare i punti di interesse circostanti.
L’accesso ai contenuti è stato concepito per essere il più semplice e naturale possibile: testi, supporto audio e immagini vengono proposti automaticamente al visitatore nel momento in cui si trova in prossimità del POI, riducendo al minimo la necessità di ricerche manuali o interazioni complesse. In questo modo l’esperienza di fruizione risulta fluida e immediata, arricchendo la visita con informazioni contestualizzate e facilmente accessibili.
L’individuazione dei POI può avvenire in due modalità principali:
- attraverso una mappa interattiva, che consente all’utente di orientarsi e pianificare i propri percorsi;
- tramite strumenti di realtà aumentata, che offrono un’esperienza immersiva, permettendo di visualizzare i punti di interesse in tempo reale direttamente sovrapposti alla vista della telecamera del dispositivo.
Questa combinazione di tecnologie rende la App ESplora non solo un mezzo di consultazione, ma anche un compagno di viaggio intelligente, capace di arricchire la scoperta del patrimonio turistico e culturale con un approccio dinamico, personalizzato e orientato all’esperienza.
Conclusioni
L’aspetto fondamentale che testimonia il pieno raggiungimento degli obiettivi del progetto ESplora è la replicabilità e trasferibilità dei processi sviluppati. Le metodologie di acquisizione automatizzata dei contenuti (crawling, scraping e data mining), la struttura snella ed efficiente della banca dati, il portale redazionale integrato e la App multi-device dimostrano di costituire un modello solido e versatile. Non solo i risultati ottenuti sono stati concretamente misurabili — con migliaia di punti di interesse censiti, organizzati e resi disponibili alla fruizione — ma l’intero approccio si presta ad essere applicato in altri territori, sia a livello regionale che nazionale, e persino in contesti culturali e tematici differenti da quello originario.
La combinazione di automazione e supervisione umana, la flessibilità delle architetture software adottate e la possibilità di integrazione con fonti e iniziative esterne rendono infatti ESplora un progetto scalabile e sostenibile, capace di adattarsi a nuove esigenze e di favorire la diffusione, la valorizzazione e la fruizione del patrimonio culturale in molteplici contesti. In questo senso, il progetto non rappresenta soltanto un traguardo raggiunto, ma anche un punto di partenza per ulteriori sviluppi e applicazioni future
Direzioni future della Ricerca e Sviluppo
Guardando al futuro, ESplora si pone l’obiettivo di compiere un vero e proprio salto di qualità, puntando sull’integrazione delle tecnologie di intelligenza artificiale. L’introduzione di questi strumenti consentirà di automatizzare i processi di validazione dei contenuti, riducendo significativamente tempi e costi operativi e rendendo più efficiente la distribuzione delle informazioni su territori sempre più estesi.
Tra le direttrici prioritarie di sviluppo vi è la creazione di contenuti a elevato valore storico e culturale, capaci di arricchire ulteriormente la banca dati e di offrire ai visitatori esperienze sempre più complete e coinvolgenti. Parallelamente, una delle sfide tecnologiche più ambiziose riguarda il riconoscimento automatico delle opere attraverso la fotocamera del dispositivo mobile: questa funzionalità permetterà all’utente di inquadrare un bene culturale e ricevere immediatamente informazioni contestuali e multimediali ad esso collegate.
Accanto a questi sviluppi, si prevede anche la definizione di strategie di diffusione e commercializzazione mirate, con l’obiettivo di consolidare e ampliare la presenza di ESplora sul mercato. Tali strategie saranno portate avanti in stretta collaborazione con enti culturali e istituzioni territoriali, così da garantire non solo la crescita tecnologica della piattaforma, ma anche il suo radicamento nei contesti locali, favorendo sinergie, nuove opportunità di valorizzazione e una fruizione sempre più partecipata del patrimonio culturale.