Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi

Küçük Resim Yok

Tarih

2023

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Niğde Ömer Halisdemir Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu tez çalışmasının amacı, ilkokul ile ortaokul sınıf düzeylerinde okutulan Fen Bilimleri ders kitaplarını doğal dil işleme araçları yöntemleriyle otomatik olarak analiz edilmesine dayanmaktadır. Nicel araştırma yönteminin kullanıldığı bu çalışmada doküman analizi kullanılmıştır. Milli Eğitim Bakanlığı Eğitim Bilişim Ağı'nda 2020-2021 Eğitim-Öğretim yılı için yayınlanmış olan PDF formatındaki her sınıf düzeyinden iki Fen Bilimleri ders kitabı örneklemi olmuştur. Üniteler PDF formatından Microsoft Word belgesi ardından düz metin belgesine dönüştürülmüştür. NKod yazılımı yardımıyla sözcük frekans listeleri elde edilmiş olan üniteler RStudio programı yardımıyla R programlama dilinde uygun kütüphaneler ve gerekli kodlamalarla, otomatik metin analizi yapılarak karşılaştırılmıştır. Metinlerdeki 134915 sözcük ve 19363 isim kökü ile çalışılmıştır. Yapılan analizlerde ilk olarak ders kitaplarının sözcük frekans listelerinin ilk 20 sözcüğünün sınıflandırılmış ve ünitelerin içeriğini yordamaya yardımcı olduğu sonucuna varılmıştır. İkinci olarak elde edilen sözcük frekans listeleri normal dağılıma uymadığından üniteler arasındaki korelasyonlar için Spearman Sıra Korelasyonu Testi uygulanmıştır. Analizler farklı kitapların aynı üniteleri arasında güçlü ve orta kuvvette ilişki (0.3????0.5), farklı üniteleri arasında ise düşük kuvvette ilişki (??<0.3) veya ilişki olmadığını (???0) göstermiştir. Parametrik olmayan Ki-kare testi ile her sınıf düzeyindeki tüm ünitelerin, ünite bazında istatistiksel olarak farklılaşan terimleri (??2 >3.84 ???? ??<0.05) elde edilmiştir. Elde edilen sonuçlar üniteye özgü terimler, günlük hayata veya fen bilimleri derslerine özgü nesneler ve diğer kategorilerine uygun olup olmama durumlarına göre yorumlanmış ve tartışılmıştır. Sınıf seviyesi yükseldikçe üniteye özgü farklılaşan terimlerin sayısında gözle görülür artış tespit edilmiştir.
The aim of this thesis is based on the automatic analysis of science textbooks taught at primary and secondary school grade levels using natural language processing tools. Document analysis was used in this study in which quantitative research method was used. Two Science textbooks from each grade level in PDF format published in the Ministry of National Education Information Network for the 2020-2021 academic year were sampled. The units were converted from PDF format to Microsoft Word document and then to the plain text. The units, whose word frequency lists were obtained with the help of NKod software, were compared with the help of RStudio program by performing automatic text analysis with appropriate libraries and necessary coding in R programming language. 134915 words and 19363 noun stems in the texts were studied. In the analysis, firstly, it was concluded that the first 20 words of the word frequency lists of the textbooks were classified and helped to predict the content of the units. Secondly, since the word frequency lists obtained did not fit the normal distribution, the Spearman Rank Correlation Test was performed for the correlations between the units. The analyses revealed strong and moderate correlations between the same units of different books (0.3????0.5), and a low-strength relationship between different units (??<0.3) or no relationship (???0) was shown. The nonparametric Chi-square test showed that all units at each grade level had statistically differentiated terms (??2 >3.84 ?????? ??<0.05) were obtained. The results were interpreted and discussed according to whether they were appropriate for unit-specific terms, objects specific to daily life or science courses, and other categories. As the grade level increases, there is a noticeable increase in the number of differentiated terms specific to the unit.

Açıklama

Eğitim Bilimleri Enstitüsü, Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı, Fen Bilgisi Eğitimi Bilim Dalı

Anahtar Kelimeler

Eğitim ve Öğretim, Education and Training

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye