Two-stage decision making algorithm for speaker verification with training set optimization

Yaparoğlu, Efe Tankut; Şenol, Yavuz

Two-stage decision making algorithm for speaker verification with training set optimization

Dosyalar

TWO-STAGE DECISION MAKING ALGORITHM FOR SPEAKER.pdf (844.79 KB)

Tarih

2019

Yazarlar

Yaparoğlu, Efe Tankut

Şenol, Yavuz

Yayıncı

Niğde Ömer Halisdemir Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

In this paper, a two-stage decision making algorithm is proposed for the task of speaker verification. This twostage algorithm aims to eliminate the first-stage qualifying impostors by the help of impostor-resistant structure in the second stage. First, a baseline system is formed using mel-frequency cepstral coefficients (MFCC) as features and, a radial basis function (RBF) neural network for speaker modelling. Then, the investigations have been realized for optimizing the training set by means of two issues: (1) the ratio of impostor features to genuine speaker features, (2) the ratio of same gender features to opposite gender features (in respect of the genuine speaker) within the impostor speakers’ set. Last, the two-stage decision making algorithm is presented, and the performance enhancement provided by the two-stage system is given with the test results.
Bu çalışmada, konuşmacı doğrulama görevi için iki aşamalı bir karar verme algoritması önerilmiştir. Bu iki aşamalı algoritma, ikinci aşamada sahtekarlara dayanıklı yapı sayesinde ilk aşamayı geçen sahtekârları ortadan kaldırmayı amaçlıyor. Birinci aşamada, öznitelik olarak mel-frekanslı sepstral katsayılar (MFCC) kullanılarak temel bir sistem oluşturulmuş ve bir radyal taban fonksiyonu (RBF) sinir ağı kullanılarak konuşmacı modellemesi gerçekleştirilmiştir. Ardından, eğitim setini iki kısımda optimize etmek için araştırmalar gerçekleştirildi: (1) taklitçi konuşmacı özniteliklerinin gerçek konuşmacı özniteliklerine oranı, (2) taklitçi konuşmacı kümesi içinde aynı cinsiyet özniteliklerinin zıt cinsiyet özniteliklerine oranı (gerçek konuşmacıya bağlı olarak). Son olarak, iki aşamalı karar verme algoritması sunulmuş ve iki aşamalı sistem tarafından sağlanan performans artışı test sonuçlarıyla birlikte verilmiştir.

Anahtar Kelimeler

Speaker Verification, Training Set Optimization, RBF Neural Network, MFCC, Cohort, Konuşmacı Doğrulama, Eğitim Kümesi Optimizasyonu, RBF Yapay Sinir Ağları, Cohort

Kaynak

Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi

Cilt

8

Sayı

1

Künye

Yaparoğlu, E , Şenol, Y . (2019). Konuşmacı doğrulama için eğitim seti optimizasyonlu iki aşamalı karar verme algoritması. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi , 8 (1) , 48-58 . DOI: 10.28948/ngumuh.516805

Bağlantı

http://dergi.ohu.edu.tr/index.php/muhendislikdergisi/article/view/1818/1402
https://hdl.handle.net/11480/6678

Koleksiyon

Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi Koleksiyonu

Detaylı Öğe Kaydı

Two-stage decision making algorithm for speaker verification with training set optimization

Dosyalar

Tarih

Yazarlar

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

Özet

Açıklama

Anahtar Kelimeler

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Bağlantı

Koleksiyon