İlkokul ve ortaokul fen bilimleri dersi 'Madde ve doğası' konu alanı üniteleri ile lise kimya ders kitaplarının Terim Frekansı-Ters Doküman Frekansı (TF-IDF) analizleri

Küçük Resim Yok

Tarih

2024

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Niğde Ömer Halisdemir Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu tez çalışmasının amacı, ilkokul ve ortaokul Milli Eğitim Bakanlığı yayını olan fen bilimleri ders kitaplarında Maddenin Doğası konu alanında yer alan üniteler ile 9. ve 10. sınıf kimya ders kitaplarında yer alan üniteler, otomatik metin analizi yöntemleri ile analiz edilmektedir. Nicel araştırma yöntemlerinde sıklıkla kullanılan doküman analizi yöntemi bu çalışmada kullanılmıştır. Çalışmanın örneklemini, Millî Eğitim Bakanlığı tarafından ders kitabı olarak kabul edilen fen bilimleri dersi öğretim programına uygun her sınıf düzeyinden bir ders kitabı ile ortaöğretim kimya eğitimi öğretim programına uygun hazırlanan 9. ve 10. sınıf ders kitapları oluşturmaktadır. Bu çalışma, fen bilimleri ders kitaplarının madde ve doğası konu alanını, ortaöğretim 9. ve 10. sınıf kimya ders kitaplarındaki 17 üniteyi ele alarak detaylı analizler sunacaktır. Ders kitaplarındaki içerikler bilgisayar ortamında derlenerek NKod yazılımıyla kelime frekans listeleri oluşturulacak ve metin madenciliği yöntemlerinde sıkça kullanılan TF-IDF istatistiğiyle çeşitli analizler gerçekleştirilecektir. Bu doğrultuda sekiz (8) ders kitabına Millî Eğitim Bakanlığı Eğitim Bilişim Ağı (EBA) üzerinden PDF formatında ulaşılmıştır. Elde edilen bu kitaplar farklı uygulamalar kullanılarak düz metin belgesine dönüştürülmüş ve olası yazım hatalarından arındırılmıştır. NKod yazılımı yardımıyla düz metin dosyalarından kelime frekans listeleri elde edilmiştir. R programlama dili ve RStudio yazılımında otomatik metin analizlerinde kullanılan kütüphaneler yardımıyla kelime frekans listeleri analiz edilmiştir. Çalışmada, ilkokul, ortaokul ve lise düzeyinde olmak üzere üç farklı doküman (DİLKOKUL, DORTAOKUL ve DLİSE) olarak oluşturulmuştur. Araştırma verilerini, bu üç dokümandaki metinlerden elde edilen isim frekans listeleri oluşturmuştur. Bu doğrultuda 8117 isimden oluşan veriler analiz edilmiştir. Analizlerin ilk aşamasında, dokümanlar içerisinde ham frekans listelerinden elde edilen yirmi terime odaklanılmıştır. Elde edilen yirmi terimin incelenen ders kitaplarındaki ünitelerin özünü yansıttığı sonucuna varılmıştır. İkinci aşamada ise otomatik metin analizi için yaygın olarak kullanılan Terim Frekansı-Ters Doküman Frekansı (TF-IDF) yöntemi kullanılmıştır. Bu yöntem, doküman içinde geçen terimlerin dokümanlar arasındaki kullanım sıklığına göre ağırlıklandırılmış frekanslarını vermektedir. Bu sayede dokümanlar arasında ortak kelimeler ile dokümana özgün, ayırt edici kelimeler tespit edilmiştir. Ortak terimlere ilişkin analizlerde DLİSE dokümanının diğer üç dokümandan farklılaştığı, ikili karşılaştırmalarda DLİSE dokümanının dahil edilmesiyle ortak kelime oranının düştüğü gözlenmiştir. DİLKOKUL ile DORTAOKUL dokümanlarının karşılaştırılması ise ortak kelime oranının en yüksek olduğu karşılaştırma olduğu saptanmıştır. Üçüncü olarak elde edilen TF-IDF grafiğinde DLİSE dokümanının kimyaya özgü kelimelerden oluştuğu, DORTAOKUL ve sonraki dokümanlarda bardak, taş, şeker gibi günlük hayatta kullanılan kelimelerin ayırt ediciliğe sahip olduğu sonucuna varılmıştır. Buna sebep olarak DİLKOKUL dokümanı sonrası dokümanlarda kimya üniteleri ve konularındaki karmaşıklık seviyesinin arttığı, öğrencilerin bilişsel gelişimleri, öğrenme kapasiteleri, soyut düşünme yetenekleri ve eğitim programlarının hedefleri gibi faktörlerin etkili olduğu görülmüştür. Bu araştırma, Türkçe doğal dil işleme ve TF-IDF yöntemleri ile fen bilimleri öğretim programında yer alan, madde ve doğası konu alanındaki hedeflerin öğrenim düzeylerine göre meydana gelen değişimlerin ders kitap analizleri ile ortaya konabileceğini göstermektedir.
The purpose of this thesis is to examine the similarities and disparities between chemistry units in science textbooks and the chemistry units in 9th and 10th-grade chemistry textbooks in secondary education using automatic text analysis methods. The document analysis method, commonly used in quantitative research methods, has been employed in this study. The sample of the study consists of one textbook from each class level that is compatible with the science curriculum and 9th and 10th-grade textbooks prepared in accordance with the secondary education chemistry curriculum accepted by the Ministry of National Education. In this context, eight (8) textbooks were accessed in PDF format through the Ministry of National Education's "Education Informatics Network". These obtained books were converted to plain text documents using different applications and were cleansed of possible spelling errors. Word frequency lists were obtained from plain text files using the NKod software. Word frequency lists were analyzed using libraries commonly used in automatic text analysis in the R programming language and RStudio software. In this study, textbooks considered as three different documents (DELEMENTARY SCHOOL, DMIDDLE SCHOOL, and DHIGH SCHOOL) at the the elementary school, middle school, and high school levels were utilized as data sources. The research data were generated from the name frequency lists obtained from the texts in these three different documents. In this context, data consisting of 8117 names were analyzed. In the first stage of the analysis, the raw frequency list of twenty terms was obtained, and it was concluded that these twenty terms reflected the essence of the chemistry subject area. In the second stage, the Term Frequency-Inverse Document Frequency (TF-IDF) method, commonly used for automatic text analysis, was preferred. This method allows for the weighting of terms occurring within a document based on their frequency of use across documents. Thus, common words and unique, distinctive words were identified among the documents. In the analysis of common terms, it was observed that the DHIGH SCHOOL document differed from the other three documents, and in pairwise comparisons, the inclusion of the DHIGH SCHOOL document resulted in a decrease in the common word ratio. The comparison of DELEMENTARY SCHOOL and DMIDDLE SCHOOL documents was determined to have the highest common word ratio. Thirdly, in the obtained TF-IDF graph, it was concluded that the DHIGH SCHOOL document consisted of chemistry-specific words, while in the DMIDDLE SCHOOL and subsequent documents, words such as glass, stone, sugar, and sense were distinctive. As a result, it was observed that the complexity level of chemistry units and topics increased in documents after the DELEMENTARY SCHOOL document; and factors such as students' cognitive development, learning capacities, abstract thinking abilities, and educational program goals were found to be effective. This research demonstrates that changes occurring across educational levels can be elucidated through the implementation of Turkish natural language processing and TF-IDF methods in the big data analyses of science education textbooks.

Açıklama

Eğitim Bilimleri Enstitüsü, Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı, Fen Bilgisi Eğitimi Bilim Dalı

Anahtar Kelimeler

Eğitim ve Öğretim, Education and Training

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye