Türkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi

dc.contributor.advisorYavuz, Ahmet
dc.contributor.authorYegen, Tuğba
dc.date.accessioned2024-11-04T20:06:05Z
dc.date.available2024-11-04T20:06:05Z
dc.date.issued2023
dc.departmentNiğde ÖHÜ, Eğitim Bilimleri Enstitüsü, Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı
dc.descriptionEğitim Bilimleri Enstitüsü, Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı, Fen Bilgisi Eğitimi Bilim Dalı
dc.description.abstractBu tez çalışmasının amacı, ilkokul ile ortaokul sınıf düzeylerinde okutulan Fen Bilimleri ders kitaplarını doğal dil işleme araçları yöntemleriyle otomatik olarak analiz edilmesine dayanmaktadır. Nicel araştırma yönteminin kullanıldığı bu çalışmada doküman analizi kullanılmıştır. Milli Eğitim Bakanlığı Eğitim Bilişim Ağı'nda 2020-2021 Eğitim-Öğretim yılı için yayınlanmış olan PDF formatındaki her sınıf düzeyinden iki Fen Bilimleri ders kitabı örneklemi olmuştur. Üniteler PDF formatından Microsoft Word belgesi ardından düz metin belgesine dönüştürülmüştür. NKod yazılımı yardımıyla sözcük frekans listeleri elde edilmiş olan üniteler RStudio programı yardımıyla R programlama dilinde uygun kütüphaneler ve gerekli kodlamalarla, otomatik metin analizi yapılarak karşılaştırılmıştır. Metinlerdeki 134915 sözcük ve 19363 isim kökü ile çalışılmıştır. Yapılan analizlerde ilk olarak ders kitaplarının sözcük frekans listelerinin ilk 20 sözcüğünün sınıflandırılmış ve ünitelerin içeriğini yordamaya yardımcı olduğu sonucuna varılmıştır. İkinci olarak elde edilen sözcük frekans listeleri normal dağılıma uymadığından üniteler arasındaki korelasyonlar için Spearman Sıra Korelasyonu Testi uygulanmıştır. Analizler farklı kitapların aynı üniteleri arasında güçlü ve orta kuvvette ilişki (0.3????0.5), farklı üniteleri arasında ise düşük kuvvette ilişki (??<0.3) veya ilişki olmadığını (???0) göstermiştir. Parametrik olmayan Ki-kare testi ile her sınıf düzeyindeki tüm ünitelerin, ünite bazında istatistiksel olarak farklılaşan terimleri (??2 >3.84 ???? ??<0.05) elde edilmiştir. Elde edilen sonuçlar üniteye özgü terimler, günlük hayata veya fen bilimleri derslerine özgü nesneler ve diğer kategorilerine uygun olup olmama durumlarına göre yorumlanmış ve tartışılmıştır. Sınıf seviyesi yükseldikçe üniteye özgü farklılaşan terimlerin sayısında gözle görülür artış tespit edilmiştir.
dc.description.abstractThe aim of this thesis is based on the automatic analysis of science textbooks taught at primary and secondary school grade levels using natural language processing tools. Document analysis was used in this study in which quantitative research method was used. Two Science textbooks from each grade level in PDF format published in the Ministry of National Education Information Network for the 2020-2021 academic year were sampled. The units were converted from PDF format to Microsoft Word document and then to the plain text. The units, whose word frequency lists were obtained with the help of NKod software, were compared with the help of RStudio program by performing automatic text analysis with appropriate libraries and necessary coding in R programming language. 134915 words and 19363 noun stems in the texts were studied. In the analysis, firstly, it was concluded that the first 20 words of the word frequency lists of the textbooks were classified and helped to predict the content of the units. Secondly, since the word frequency lists obtained did not fit the normal distribution, the Spearman Rank Correlation Test was performed for the correlations between the units. The analyses revealed strong and moderate correlations between the same units of different books (0.3????0.5), and a low-strength relationship between different units (??<0.3) or no relationship (???0) was shown. The nonparametric Chi-square test showed that all units at each grade level had statistically differentiated terms (??2 >3.84 ?????? ??<0.05) were obtained. The results were interpreted and discussed according to whether they were appropriate for unit-specific terms, objects specific to daily life or science courses, and other categories. As the grade level increases, there is a noticeable increase in the number of differentiated terms specific to the unit.
dc.identifier.endpage158
dc.identifier.startpage1
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=kIrIdtdJ31bRgjb6fHvMUXMri4oSi9sOp_q5HqDjucbtHFann5tWWlDyMvK-CyJf
dc.identifier.urihttps://hdl.handle.net/11480/8849
dc.identifier.yoktezid778377
dc.language.isotr
dc.publisherNiğde Ömer Halisdemir Üniversitesi
dc.relation.publicationcategoryTez
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_2024
dc.subjectEğitim ve Öğretim
dc.subjectEducation and Training
dc.titleTürkçe doğal dil işleme araçlarının ilk ve ortaokul fen bilimleri ders kitapları analizinde kullanımı: Sözcük ve sözcük kökü frekanslarının karşılaştırmalı analizi
dc.title.alternativeUsing Turkish natural language processing tools in analysis of science textbooks for primary and secondary education: Comparative analysis of word and lemma frequencies
dc.typeMaster Thesis

Dosyalar