Mini-batch sample selection strategies for deep learning based speech recognition

Dokuz, Yesim; Tufekci, Zekeriya

Mini-batch sample selection strategies for deep learning based speech recognition

dc.contributor.author	Dokuz, Yesim
dc.contributor.author	Tufekci, Zekeriya
dc.date.accessioned	2024-11-07T13:31:21Z
dc.date.available	2024-11-07T13:31:21Z
dc.date.issued	2021
dc.department	Niğde Ömer Halisdemir Üniversitesi
dc.description.abstract	With the use of deep learning technologies, speech recognition systems gained more success and human-computer interactions became more prevalent. Deep learning based speech recognition systems are getting more attention and are having tremendous success in all areas of speech recognition, such as voice search, mobile communication, and personal digital assistance. However, speech recognition is still challenging due to hardness of adapting new languages, difficulty in handling variations in speech datasets, and overcoming distorting factors. Deep learning systems have the ability to overcome these challenges using high-level abstractions in the datasets by using a deep graph with multiple processing layers using training algorithms, such as gradient descent optimization. In this study, a variant of gradient descent optimization, mini-batch gradient descent is used. We proposed four strategies for selecting mini-batch samples to represent variations of each feature in the dataset for speech recognition tasks to increase model performance of deep learning based speech recognition. For this purpose, gender and accent adjusted strategies are proposed for selecting mini-batch samples. The experiments show that proposed strategies perform better in comparison with standard mini-batch sample selection strategy. (C) 2020 Elsevier Ltd. All rights reserved.
dc.identifier.doi	10.1016/j.apacoust.2020.107573
dc.identifier.issn	0003-682X
dc.identifier.issn	1872-910X
dc.identifier.scopus	2-s2.0-85089352303
dc.identifier.scopusquality	Q1
dc.identifier.uri	https://doi.org/10.1016/j.apacoust.2020.107573
dc.identifier.uri	https://hdl.handle.net/11480/14793
dc.identifier.volume	171
dc.identifier.wos	WOS:000580649900024
dc.identifier.wosquality	Q1
dc.indekslendigikaynak	Web of Science
dc.indekslendigikaynak	Scopus
dc.language.iso	en
dc.publisher	Elsevier Sci Ltd
dc.relation.ispartof	Applied Acoustics
dc.relation.publicationcategory	Makale - Uluslararası Hakemli Dergi - Kurum Öğretim Elemanı
dc.rights	info:eu-repo/semantics/closedAccess
dc.snmz	KA_20241106
dc.subject	Mini-batch gradient descent
dc.subject	Sample selection strategies
dc.subject	Deep learning
dc.subject	Speech recognition
dc.subject	LSTM
dc.title	Mini-batch sample selection strategies for deep learning based speech recognition
dc.type	Article

Koleksiyon

WoS İndeksli Yayınlar Koleksiyonu
Scopus İndeksli Yayınlar Koleksiyonu

Mini-batch sample selection strategies for deep learning based speech recognition

Dosyalar

Koleksiyon