Publication:
Distributed acoustic sensor acquired signals : detection, processing, classification and parallel implementation

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Bu çalışma, Dağıtılmış Akustik Sensör (DAS) olarak da adlandırılan Dağıtılmış Fiber Optik Sensör tarafından elde edilen akustik olayları sınıflandırmayı amaçlamaktadır. Bu veriler, fiberin ışık darbeleriyle araştırılması ve Rayleigh geri saçılımının analiz edilmesiyle elde edilmektedir. Söz konusu veriler, Machine Learning (ML) sınıflandırma modelimizin girdisini oluşturmak için bir işleme algoritmaları boru hattından geçirilir.Tez kapsamında, ilgilenilen gerçek akustik olayı arka plan gürültüsünden ayırt etmek için Random Matrix Theory (RMT) kullandık. Toplanan ham iz, Signal-to-Noise Ratio (SNR) geliştirmek amacıyla Hareketli Ortalama filtresi ve Dalgacık tabanlı bir filtreleme algoritması kullanılarak koşullandırıldı. Olayın doğasını sınıflandırmak için, bir Convolutional Neural Network (CNN) enjekte ettiğimiz ham, düşük geçişli filtrelenmiş ve dalgacık tabanlı filtrelenmiş işlenmiş sinyal için Kısa Vadeli Fourier Dönüşümünün karmaşık katsayılarının büyüklüğüne güvendik. Ayrıca, sınıflandırıcıya bir girdi olarak akustik olaya uygun Mel-Frequency Cepstrum Coefficients (MFCC) araştırmış olup, performans sonuçlarını sinyalin diğer temsilleriyle karşılaştırdık. Çevre güvenliği ve boru hattı izleme amaçları için kullanılan bir DAS'tan elde edilen sonuç olarak boyutlandırılmış bir veri kümesini kullanan kapsamlı bir deney seti, CNN'de 2 sınıflı ve 3 sınıflı sınıflandırma için çalıştırıldı ve MFCC'ler kullanıldığında en iyi sonuçlar elde edildi. 2 sınıflı süreç söz konusu olduğunda 'Event' sınıfı için %96,4 ve ‘No Event’ sınıfı için %99,7 doğruluk sağlayan bir dalgacık ön işleme. Katsayılarla en iyi sonuçlara, 3 sınıflı işlem için de sırasıyla 'Kazma', 'Yürüme' ve ' Kazı makinesi' sınıfları için sırasıyla %83,3, %81,3 ve %96,7 doğruluklara ulaşılmıştır.Son olarak, veri kümesi çok tutarlı bir boyutta olduğundan ve modelin mimarisi oldukça karmaşık olduğundan, eğitimin yürütme süresi son derece uzundur. Bu nedenle, elimizdeki makinenin tüm gücünden yararlanmak için CPU ve GPU'yu verimli kullanmanın yollarını araştırdık. Bunun için Keras API'sinden Sequence veri üretecini test ettik. Bunun sonucu olarak, seri uygulamaya kıyasla, parallel işleme sayesinde 4,87 kata kadar bir hızlanma elde ettik.
This study aims at classifying acoustic events acquired by a Distributed Fiber Optic Sensor, also referred to as Distributed Acoustic Sensor (DAS). This data is obtained by probing the fiber with light pulses and analyzing the Rayleigh backscatter. We passed the data through a pipeline of processing algorithms to constitute the input of our Machine Learning (ML) classification model. To distinguish the actual acoustic event of interest from the background noise, we test out Random Matrix Theory (RMT). We conditioned the gathered raw trace using a Moving Average filter and a Wavelet-based filtering algorithm to enhance the Signal-to-Noise Ratio (SNR). To categorize the nature of the event, we rely on the magnitude of the complex coefficients of its Short-Term Fourier Transform for raw, low pass filtered and wavelet-based filtered, the processed signal that we inject into a Convolutional Neural Network (CNN). We also investigate Mel-Frequency Cepstral Coefficients (MFCC) proper to the acoustic event as an input to the classifier and compare performance results with other signal representations. An extensive set of experiments, using a consequently sized dataset from a DAS utilized for perimeter security and pipeline monitoring purposes, was run on the CNN for 2-class and 3-class classification with the optimal results. We obtained these results when using the MFCCs paired with wavelet denoising pre-processing, achieving 96.4% for the ‘Event’ class and 99.7% for the ‘No Event’ class for the 2-class process. We also achieved optimal results with the coefficients for the 3-class process with accuracies of 83.3%, 81.3% and 96.7% for the ‘Digging’, ‘Walking’ and ‘Excavation’ classes, respectively.Finally, since the dataset is of a consequent size and the model’s architecture is quite complex, the execution time of training is exceedingly long. Therefore, we investigate ways to utilize the CPU and GPU efficiently to take advantage of the full power of the machine at our disposal. For this, we tested out the Sequence data generator from the Keras API. We report an improvement of up to 4.87 times compared to the serial implementation.

Description

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By