Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi

Yegen, Tuğba

Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi

dc.contributor.advisor	Yavuz, Ahmet
dc.contributor.author	Yegen, Tuğba
dc.date.accessioned	2024-11-04T20:06:05Z
dc.date.available	2024-11-04T20:06:05Z
dc.date.issued	2023
dc.department	Niğde ÖHÜ, Eğitim Bilimleri Enstitüsü, Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı
dc.description	Eğitim Bilimleri Enstitüsü, Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı, Fen Bilgisi Eğitimi Bilim Dalı
dc.description.abstract	Bu tez çalışmasının amacı, ilkokul ile ortaokul sınıf düzeylerinde okutulan Fen Bilimleri ders kitaplarını doğal dil işleme araçları yöntemleriyle otomatik olarak analiz edilmesine dayanmaktadır. Nicel araştırma yönteminin kullanıldığı bu çalışmada doküman analizi kullanılmıştır. Milli Eğitim Bakanlığı Eğitim Bilişim Ağı'nda 2020-2021 Eğitim-Öğretim yılı için yayınlanmış olan PDF formatındaki her sınıf düzeyinden iki Fen Bilimleri ders kitabı örneklemi olmuştur. Üniteler PDF formatından Microsoft Word belgesi ardından düz metin belgesine dönüştürülmüştür. NKod yazılımı yardımıyla sözcük frekans listeleri elde edilmiş olan üniteler RStudio programı yardımıyla R programlama dilinde uygun kütüphaneler ve gerekli kodlamalarla, otomatik metin analizi yapılarak karşılaştırılmıştır. Metinlerdeki 134915 sözcük ve 19363 isim kökü ile çalışılmıştır. Yapılan analizlerde ilk olarak ders kitaplarının sözcük frekans listelerinin ilk 20 sözcüğünün sınıflandırılmış ve ünitelerin içeriğini yordamaya yardımcı olduğu sonucuna varılmıştır. İkinci olarak elde edilen sözcük frekans listeleri normal dağılıma uymadığından üniteler arasındaki korelasyonlar için Spearman Sıra Korelasyonu Testi uygulanmıştır. Analizler farklı kitapların aynı üniteleri arasında güçlü ve orta kuvvette ilişki (0.3????0.5), farklı üniteleri arasında ise düşük kuvvette ilişki (??<0.3) veya ilişki olmadığını (???0) göstermiştir. Parametrik olmayan Ki-kare testi ile her sınıf düzeyindeki tüm ünitelerin, ünite bazında istatistiksel olarak farklılaşan terimleri (??2 >3.84 ???? ??<0.05) elde edilmiştir. Elde edilen sonuçlar üniteye özgü terimler, günlük hayata veya fen bilimleri derslerine özgü nesneler ve diğer kategorilerine uygun olup olmama durumlarına göre yorumlanmış ve tartışılmıştır. Sınıf seviyesi yükseldikçe üniteye özgü farklılaşan terimlerin sayısında gözle görülür artış tespit edilmiştir.
dc.description.abstract	The aim of this thesis is based on the automatic analysis of science textbooks taught at primary and secondary school grade levels using natural language processing tools. Document analysis was used in this study in which quantitative research method was used. Two Science textbooks from each grade level in PDF format published in the Ministry of National Education Information Network for the 2020-2021 academic year were sampled. The units were converted from PDF format to Microsoft Word document and then to the plain text. The units, whose word frequency lists were obtained with the help of NKod software, were compared with the help of RStudio program by performing automatic text analysis with appropriate libraries and necessary coding in R programming language. 134915 words and 19363 noun stems in the texts were studied. In the analysis, firstly, it was concluded that the first 20 words of the word frequency lists of the textbooks were classified and helped to predict the content of the units. Secondly, since the word frequency lists obtained did not fit the normal distribution, the Spearman Rank Correlation Test was performed for the correlations between the units. The analyses revealed strong and moderate correlations between the same units of different books (0.3????0.5), and a low-strength relationship between different units (??<0.3) or no relationship (???0) was shown. The nonparametric Chi-square test showed that all units at each grade level had statistically differentiated terms (??2 >3.84 ?????? ??<0.05) were obtained. The results were interpreted and discussed according to whether they were appropriate for unit-specific terms, objects specific to daily life or science courses, and other categories. As the grade level increases, there is a noticeable increase in the number of differentiated terms specific to the unit.
dc.identifier.endpage	158
dc.identifier.startpage	1
dc.identifier.uri	https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=kIrIdtdJ31bRgjb6fHvMUXMri4oSi9sOp_q5HqDjucbtHFann5tWWlDyMvK-CyJf
dc.identifier.uri	https://hdl.handle.net/11480/8849
dc.identifier.yoktezid	778377
dc.language.iso	tr
dc.publisher	Niğde Ömer Halisdemir Üniversitesi
dc.relation.publicationcategory	Tez
dc.rights	info:eu-repo/semantics/openAccess
dc.snmz	KA_2024
dc.subject	Eğitim ve Öğretim
dc.subject	Education and Training
dc.title	Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi
dc.title.alternative	Using Turkish natural language processing tools in analysis of science textbooks for primary and secondary education: Comparative analysis of word and lemma frequencies
dc.type	Master Thesis

Koleksiyon

Eğitim Bilimleri Enstitüsü Tez Koleksiyonu

Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi

Dosyalar

Koleksiyon