Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 7 von 18

Details

Autor(en) / Beteiligte
Titel
Improving the Listening Experience for SSB-Modulated HF Transmissions Using Neural Networks
Ort / Verlag
Paderborn
Erscheinungsjahr
2023
Verknüpfte Titel
Beschreibungen/Notizen
  • Tag der Verteidigung: 18.01.2023
  • ger: Bis heute spielen analoge Hochfrequenz-Funkübertragungen in einigen Bereichen unserer Gesellschaft eine zentrale Rolle, zum Beispiel in der Schiff- und Luftfahrtkommunikation. Aufgrund des stark verzerrten Übertragungskanals und der Abhängigkeit von einer präzise generierten Demodulationsfrequenz sind die aufgezeichneten Sprachsignale der Hochfrequenz-Kommunikation häufig stark gestört. In dieser Arbeit werden auf neuronalen Netzen basierende Lösungen für drei der Hauptursachen für eine schlechte Verständlichkeit dieser Signale vorgestellt, wobei Einseitenband-modulierte Sprachsignale als Beispiel für analoge Hochfrequenz-Funkkommunikation verwendet werden. Zunächst wird eine zuverlässige Schätzung der Sprachaktivität vorgestellt, um zu vermeiden, dass ein Hörer den inaktiven, verrauschten Hochfrequenzkanal verfolgen muss, wenn keine Aktivität vorliegt. Die vorgestellte Architektur, die bis heute die besten veröffentlichten Ergebnisse auf den Fearless Steps Daten erzielt, übertrifft vergleichbare Aktivitätsschätzer auch im betrachteten Szenario.Die zweite Herausforderung ist eine Frequenzverschiebung im aufgezeichneten Signal aufgrund einer Differenz zwischen der Modulations- und der Demodulationsfrequenz. Zur Reduktion dieser Problematik, werden zwei Netzwerkarchitekturen zur Verschubsschätzung entworfen und mit einem modernen statistischen Schätzer verglichen. Als dritte Aufgabe wird die Extraktion des Sprachsignals aus der verrauschten Aufnahme identifiziert, diese Herausforderung wird durch die Anpassung eines neuronales Netzwerk zur Quellentrennung angegangen. Für alle Kombinationen der präsentierten Modelle wird eine hoher Gewinn in Sprachverständlichkeit und -qualität festgestellt.
  • eng: To this day, analog high frequency radio transmissions play a pivotal role in some vital sectors of our society, such as marine, aviation and police communications. However, the listening experience for such recordings is limited due to the highly distorted transmission channel and the dependency on accurate carrier frequency generation. In this thesis, neural network-based solutions to three of the main causes of poor listening quality are presented, using single-sideband modulated speech signals as an example of high frequency analog radio communication. First, a reliable speech activity estimation is presented to avoid the strenuous task of tracking the inactive, noisy high frequency channel. The developed architecture, which to this day achieves the best published results on the public Fearless Steps data, is shown to outperform comparable activity estimators. As a second challenge, a frequency shift in the recorded signal due to a mismatch between the modulation and demodulation frequency is identified. This is a challenge specific to analog transmission systems, which can lead to a highly reduced quality and intelligibility of the recorded speech signal. Here, two network architectures are designed and compared to a state-of-the-art statistical estimator. Third, a source separation network is adapted to extract the speech signal from the noisy recording, which leads to an improvement of more than 20% in the speech intelligibility metric STOI. The models for the different tasks are combined into one system to improve the signal quality and intelligibility at the receiver in a single step. For all combinations of the presented models a large gain in both intelligibility and speech quality is reported.
Sprache
Englisch
Identifikatoren
Titel-ID: 9925090838106463
Format
vi, 141 Seiten; Diagramme

Lade weitere Informationen...