Machine learning applicato alle risorse idriche in ambito domestico

L’acqua è una risorsa essenziale e preziosa. Siamo abituati ad avere sempre a disposizione acqua pulita e fresca a basso costo. Tuttavia, l’acqua potabile è il risultato prezioso di un processo complesso che ha un forte impatto sulle risorse naturali e che non è del tutto riflesso o evidente nelle bollette o nelle tasse che paghiamo

Nell’ambito del progetto europeo Wisdom ed in collaborazione con diversi partner internazionali tra cui l’Imperial College London ed Intel labs ho avuto l’incarico da parte di questi ultimi di formulare una soluzione di data science e machine learning volta alla disaggregazione dei consumi idrici in ambito domestico.

Nel corso del progetto mi sono occupato di serie temporali, classificazione supervisionata di eventi e di clustering con tecniche non supervisionate.

Contatori intelligenti

La premessa alla base dell’introduzione dei contatori intelligenti è che “non si può migliorare ciò che non si può misurare”. Ecco come appare la lettura di un contatore intelligente: (grafico). Ma l’intelligenza non deriva dal monitoraggio in sé, bensì dall’interpretazione dei dati che essi rappresentano. Dobbiamo estrarre la conoscenza da questi dati utilizzando un processo chiamato disaggregazione. Ad esempio, questo picco è una doccia o uno sciacquone? È legato al bucato o al lavaggio delle stoviglie?

Stato dell’arte e la proposta di valore

Oggi è l’era dei big data. Tuttavia, l’accesso a grandi volumi di dati in casa è spesso un’ipotesi irrealistica. I dati hanno un costo e il valore della loro fornitura non è spesso evidente. La vita reale è complessa. A differenza del nostro ambiente di prova in laboratorio, l’installazione di soluzioni di monitoraggio complesse nelle abitazioni sarebbe invasiva, laboriosa e costosa. La maggior parte dei residenti non vorrebbe un cablaggio invasivo nella propria abitazione o dover cambiare le batterie ogni poche settimane per mantenere alte le frequenze di campionamento. La nostra proposta di valore consiste nel lavorare con le attuali condizioni realistiche e nel concentrarsi sui piccoli dati anziché sui grandi.

Supervisionato o non supervisionato?

Per questo motivo abbiamo studiato due approcci: la classificazione supervisionata e la disaggregazione non supervisionata. Nei classificatori supervisionati, i dati provengono dai contatori e vengono etichettati con un’etichetta come “questo evento è una doccia”. L’etichettatura di questi eventi avviene tramite un’installazione invasiva di sensori. Questo, insieme alla scarsa portabilità, è il principale svantaggio dei modelli supervisionati.

D’altro canto, i modelli non supervisionati apprendono dagli stessi dati che osservano, nel nostro caso il flusso dell’acqua nella conduttura, e senza alcuna etichettatura. Si basano sul raggruppamento dei dati e su distribuzioni statistiche miste. Lo svantaggio è che forniscono meno conoscenze rispetto agli approcci supervisionati e quindi hanno poco spazio per ulteriori approfondimenti e valore.

La prima domanda di ricerca

La prima domanda che ci siamo posti è stata: “È possibile addestrare un modello supervisionato in una casa completamente strumentata e poi distribuire lo stesso modello in altre case?”.

Il risultato della nostra indagine è piuttosto chiaro. L’accuratezza della classificazione scende a un inaccettabile 45% una volta testata in una nuova casa.

Il problema riformulato

Ma vogliamo davvero che il nostro contatore ci dica che alle 8:00 abbiamo fatto la doccia? Forse no. Riformuliamo allora il problema: ciò che ci serve sapere è quanta acqua viene utilizzata per la doccia, il bucato, lo sciacquone del bagno e così via durante il giorno. Il risultato dovrebbe essere simile a un grafico a torta.
Abbiamo confrontato il nostro disaggregatore non supervisionato con uno basato esclusivamente sui sondaggi: quest’ultimo mostra un errore medio del 40%, mentre il nostro è del 10%.

Energia e acqua

Un ultimo test che abbiamo condotto è stato quello di confrontare il consumo di energia e di acqua, per vedere se questo supportava il processo di identificazione degli elettrodomestici che utilizzano l’acqua. Tuttavia, poiché gli apparecchi moderni sono in genere molto efficienti, è stato difficile osservare segnali distinguibili. L’eccezione è stata rappresentata da apparecchi come le docce elettriche, per le quali abbiamo invece riscontrato un notevole vantaggio nel sapere “quando” viene utilizzata l’acqua calda.

Conclusioni

Per la disaggregazione dell’acqua, sembra più probabile l’adozione di tecniche non supervisionate, in quanto meno invasive, meno costose e in grado di utilizzare velocità di trasmissione dati realistiche. Inoltre, la comprensione dei consumi energetici legati al riscaldamento dell’acqua si è dimostrata utile per l’accuratezza della disaggregazione. Dato il prezzo modesto dell’acqua, è più probabile che la soluzione garantisca un ritorno sull’investimento se inserita in un’offerta consolidata di smart home.

Poiché il costo reale dell’acqua continuerà ad aumentare per il cliente, riteniamo che la disaggregazione dell’uso dell’acqua sia un’opzione valida per incentivare un uso intelligente e consapevole delle risorse idriche.

Rispondi

Blog at WordPress.com.