Eğitimsel İçerik Tasarımında Üretken Yapay Zekâ Performans Asimetrisi

Arş. Gör. Fatih DEMİR
Karadeniz Teknik Üniversitesi
[email protected]

Eğitimsel İçerik Tasarımında Üretken Yapay Zekâ Performans Asimetrisi: Bilgisayar Bilimi Müfredatı üzerine Karşılaştırmalı bir Analiz

Bu çalışma, Üretken Yapay Zekâ araçlarının eğitimsel içerik tasarımındaki yetkinliklerini Bilgisayar Bilimi dersi özelinde karşılaştırmalı olarak incelemeyi amaçlamaktadır. Araştırma kapsamında, günümüzün önde gelen dört büyük dil modeli olan Grok, Perplexity, ChatGPT ve Gemini’nin ücretsiz versiyonları;“11. Sınıf Algoritmalar” konusu için ders planı oluşturma ve ölçme-değerlendirme soruları hazırlama performansı üzerinden analiz edilmiştir.

Metodoloji: Çalışmada nitel ve nicel yöntemlerin bir arada kullanıldığı karma bir yaklaşım benimsenmiştir. Her dört modele de aynı standart “zero-shot” komut verilmiş ve elde edilen çıktılar; pedagojik iskeleleme, teknik doğruluk, zaman yönetimi, aktif öğrenme teknikleri ve ölçme-değerlendirme kalitesi olmak üzere beş ana kriter üzerinden 5’li Likert ölçeği ile değerlendirilmiştir.

Bulgular: Yapılan analizler, modeller arasında belirgin bir performans asimetrisi olduğunu ortaya koymuştur:

Grok, 40 dakikalık ders süresini en hassas şekilde planlayan ve müfredata tam uyumlu teknik pseudocode örnekleri sunan model olarak öne çıkmıştır.
Gemini, “Robot Sensin!” gibi rol yapma temelli yaratıcı etkinlikler ve görselleştirme önerileriyle en yüksek pedagojik çeşitliliği sergilemiştir.
Perplexity, özellikle süreç ve mantık odaklı üst düzey bilişsel sorular hazırlamada en başarılı performansı göstermiştir.
ChatGPT ise günlük hayat metaforlarını (çay demleme, sandviç hazırlama) kullanarak konuyu basitleştirme ve uygulama kolaylığı sağlamada etkili bulunmuştur.

Sonuç: Çalışma sonucunda, hiçbir modelin tek başına tüm kriterlerde mükemmel sonuç vermediği, ancak teknik derinlik için Grok, pedagojik yaratıcılık için Gemini ve mantıksal sorgulama için Perplexity’nin hibrit bir şekilde kullanılmasının eğitimciler için en verimli strateji olacağı saptanmıştır. Bulgular, ÜYZ araçlarının yerel müfredat bağlamında hala insan denetimine ihtiyaç duyduğunu göstermektedir.

Anahtar Kelimeler: Üretken Yapay Zekâ, Bilgisayar Bilimi Eğitimi, Karşılaştırmalı Analiz, Algoritma Öğretimi, Ders Planlama.

1. GİRİŞ

Üretken Yapay Zekâ (ÜYZ) teknolojileri, 21. yüzyıl eğitim ekosisteminde öğretimsel tasarım ve içerik geliştirme süreçlerini kökten değiştiren bir dönüştürücü güç haline gelmiştir. Özellikle Büyük Dil Modelleri (LLM), öğretmenlere ders planı hazırlama, öğretim materyali geliştirme ve ölçme-değerlendirme araçları oluşturma gibi zaman alıcı görevlerde önemli bir asistanlık kapasitesi sunmaktadır. Ancak, literatürde yer alan çalışmaların büyük bir bölümü genellikle tek bir modelin (özellikle ChatGPT) genel eğitimsel yetkinliklerine odaklanmakta, farklı mimarilere ve veri setlerine sahip modellerin spesifik bir müfredat kazanımı üzerindeki performans asimetrisini göz ardı etmektedir.

Bilgisayar Bilimi eğitimi, doğası gereği hem teorik mantıksal yapıların (algoritma özellikleri) hem de teknik uygulama becerilerinin (pseudocode, akış şemaları) bir arada sunulmasını gerektiren kompleks bir alandır. Bu çalışmada ele alınan “11. Sınıf Algoritmalar” konusu, bir problemin çözümü için gerekli olan belirlilik, sonluluk ve etkililik gibi temel prensiplerin öğrencilere kazandırılmasını hedefler. Bu süreçte kullanılan yapay zekâ araçlarının sadece metin üretmesi değil, aynı zamanda pedagojik bir iskeleleme (scaffolding) kurarak aktif öğrenme tekniklerini ders akışına entegre etmesi beklenmektedir.

Yapılan ön incelemeler, farklı ÜYZ modellerinin aynı eğitim görevi karşısında birbirlerinden farklı stratejiler geliştirdiğini göstermektedir. Örneğin, Grok modeli ders planlamasında dakiklik ve teknik pseudocode doğruluğuna odaklanan disiplinli bir yapı sergilerken; Gemini multimodal yeteneklerini kullanarak görsel destekli ve “Robot Sensin!” gibi rol yapma temelli yaratıcı pedagojik etkinlikler önermektedir. Perplexity‘nin ise bilgi doğruluğu ve mantıksal sorgulama kalitesini ön plana çıkaran süreç odaklı bir yaklaşım benimsediği, ChatGPT‘nin ise “sandviç hazırlama” veya “çay demleme” gibi günlük hayat metaforlarıyla konuyu basitleştirerek uygulama kolaylığı sunduğu gözlemlenmiştir.

Bu çalışma, ücretsiz erişime açık olan ChatGPT, Gemini, Grok ve Perplexity gibi önde gelen ÜYZ modellerinin, 11. sınıf bilgisayar bilimi dersi “Algoritmalar” konusu özelindeki performanslarını karşılaştırmalı olarak analiz etmeyi amaçlamaktadır. Çalışmanın temel amacı, hangi modellerin teknik içerik doğruluğunda, hangilerinin ise pedagojik yaratıcılık ve zaman yönetiminde daha etkin olduğunu ortaya koyarak öğretmenler ve eğitim tasarımcıları için kanıta dayalı bir rehber oluşturmaktır. Bu kapsamda, modellerin ürettiği ders planları; müfredat uyumu, aktif öğrenme tekniklerinin kullanımı ve ölçme-değerlendirme sorularının bilişsel düzeyleri açısından değerlendirilmiştir.

2. YÖNTEM

Bu çalışma, farklı LLM’nin eğitimsel içerik üretme kapasitelerini ölçmeyi amaçlayan karşılaştırmalı bir durum çalışması (comparative case study) niteliğindedir. Çalışma kapsamında, modellerin ürettiği ders planları nitel ve nicel analiz yöntemleri bir arada kullanılarak incelenmiştir.

2.1. Veri Kaynakları ve Örneklem

Araştırmada veri kaynağı olarak günümüzde yaygın olarak kullanılan dört farklı ÜYZ modelinin ücretsiz sürümleri seçilmiştir:

Grok (xAI)
Perplexity (Perplexity AI)
ChatGPT (OpenAI)
Gemini (Google)

2.2. Veri Toplama Süreci ve Komut (Prompt) Tasarımı

Modellerin performansını adil bir şekilde kıyaslayabilmek için tüm araçlara aynı anda ve aynı içerikte tek bir “Zero-Shot” komutu verilmiştir. Kullanılan standart komut şu şekildedir;
“11. Sınıf Bilgisayar Bilimi dersi için ‘Algoritmalar’ konusunda, 40 dakikalık, aktif öğrenme tekniklerini içeren bir ders planı ve sonunda 3 adet çoktan seçmeli soru oluştur.”

2.3. Değerlendirme Kriterleri (Rubrik)

Üretilen ders planları, eğitim bilimleri ve bilgisayar bilimi pedagojisi temel alınarak belirlenen beş ana kriter üzerinden değerlendirilmiştir:

Pedagojik İskeleleme: Bilginin basitten karmaşığa doğru sunulma düzeyi.
Teknik Doğruluk: Algoritma özelliklerinin ve teknik gösterimlerin (pseudocode, akış şeması) doğruluğu.
Zaman Yönetimi: 40 dakikalık sürenin alt başlıklara dengeli dağılımı.
Aktif Öğrenme Entegrasyonu: Öğrenciyi merkeze alan tekniklerin (Think-Pair-Share, Rol Yapma, İstasyon vb.) uygulanabilirliği.
Ölçme-Değerlendirme Niteliği: Hazırlanan soruların ders kazanımlarıyla uyumu ve zorluk derecesi.

2.4. Veri Analiz Prosedürü

Çalışmada izlenen analiz süreci üç aşamadan oluşmuştur;

İçerik Analizi: Her modelin sunduğu etkinlikler ve teknik bilgiler (örneğin Grok’un sunduğu 5 temel özellik veya Gemini’nin “Robot Sensin!” etkinliği ) kodlanarak karşılaştırılmıştır.
Karşılaştırmalı Matris Oluşturma: Modellerin zaman yönetimi yaklaşımları; Grok’un mikro-planlamasından (0-5, 5-15 dk), Perplexity’nin makro-bloklarına (5, 25, 10 dk) kadar olan farklılıklar tablolaştırılmıştır.
Uzman Puanlaması (Simülasyon): Elde edilen çıktılar, belirlenen rubrik üzerinden 1-5 arası Likert tipi puanlamaya tabi tutularak betimsel istatistiklerle yorumlanmıştır.

3. BULGULAR VE TARTIŞMA

Bu bölümde, dört farklı ÜYZ modelinin “11. Sınıf Algoritmalar” konusu üzerine ürettiği çıktılar; yapısal düzen, teknik derinlik, pedagojik yaklaşım ve ölçme-değerlendirme kalitesi açısından karşılaştırılmıştır.

3.1. Yapısal Düzen ve Zaman Yönetimi Bulguları

Modellerin 40 dakikalık ders süresini planlama biçimleri önemli farklılıklar göstermiştir.

Grok, dersi 0-5, 5-15, 15-30, 30-35 ve 35-40 dakikalık çok net mikro-bloklara ayırarak en disiplinli zaman yönetimini sergilemiştir.
ChatGPT, benzer şekilde 5-5-10-12-5-3 dakikalık bir dağılım sunarak öğretmene uygulama kolaylığı sağlamıştır.
Buna karşın Perplexity, zamanı 5-25-10 dakikalık geniş bloklar halinde sunarak ders içi geçişlerde esneklik bırakmış ancak uygulama rehberliği açısından daha zayıf kalmıştır.

3.2. Teknik İçerik ve Pedagojik Derinlik Analizi

Teknik derinlik açısından modellerin konuyu ele alış biçimleri şu şekildedir:

Grok, algoritmanın 5 temel özelliğini (belirlilik, sonluluk, girdilik, çıktı, etkililik) eksiksiz listelemiş ve iki sayıyı karşılaştıran teknik bir pseudocode (sözde kod) örneği sunarak müfredat beklentilerini tam karşılamıştır.
Gemini, teknik bilgiyi somutlaştırmada en yaratıcı yaklaşımı sergilemiş; “Robot Sensin!” etkinliği ile öğrencilerin komut-mantık ilişkisini rol yapma yoluyla deneyimlemesini hedeflemiştir. Ayrıca girdi-işlem-çıktı döngüsünü görselleştirme önerisiyle multimodal bir avantaj sunmuştur.
ChatGPT, konuyu daha çok günlük hayat metaforları (çay demleme, sandviç hazırlama) üzerinden basitleştirme eğilimi göstermiştir. “Düşün-Eşleş-Paylaş” etkinliğini adım adım (düşün, eşleş, paylaş süreleri dahil) kurgulayarak öğretmene net bir rehberlik sunmuştur.
Perplexity, sorularında öğrencinin ezberden ziyade “bir probleme nasıl başlanır?” veya “karar yapısı nedir?” gibi mantıksal süreçleri anlamasını hedeflemiştir.

3.3. Ölçme ve Değerlendirme Sorularının Niteliği

Modellerin hazırladığı 3 adet çoktan seçmeli soru, Bloom Taksonomisi açısından incelenmiştir;

Perplexity, “bir probleme başlarken ilk adımın ne olması gerektiği” gibi süreç ve mantık odaklı sorularla en yüksek bilişsel düzeyi yakalamıştır.
Grok, pseudocode hatalarını bulmaya yönelik uygulama odaklı sorular hazırlamıştır.
ChatGPT, daha çok tanım ve özellik hatırlamaya dayalı (alt düzey bilişsel basamak) sorular üretmiştir.

4. TARTIŞMA

Elde edilen bulgular, ÜYZ modelleri arasında belirgin bir “uzmanlık asimetrisi” olduğunu doğrulamaktadır. Çalışmada dikkat çeken en önemli unsur, modellerin aynı komuta rağmen farklı pedagojik iskeleler (scaffolding) kurmasıdır.

Grok‘un teknik hassasiyeti ve yapılandırılmış zaman planı, Bilgisayar Bilimi gibi hata toleransı düşük derslerde öğretmenin bilişsel yükünü azaltabilecek niteliktedir.

Gemini‘nin önerdiği rol yapma ve istasyon teknikleri ise öğrenci katılımını maksimize eden “yapılandırmacı yaklaşım” ile tam uyum göstermektedir. Ancak, hiçbir modelin ders planında MEB müfredatındaki özgün kazanım numaralarına (örn: 11.1.1.) yer vermemesi, bu araçların hala yerel müfredat bağlamında insan denetimine (human-in-the-loop) ihtiyaç duyduğunu kanıtlamaktadır.

Sonuç olarak; teknik içerik ve sınav hazırlığı için Grok ve Perplexity kombinasyonu, sınıf içi aktif öğrenme tasarımı için ise Gemini ve ChatGPT‘nin sunduğu pedagojik senaryoların tercih edilmesi, eğitimciler için en verimli strateji olarak değerlendirilmektedir.

5. KISITLAR VE GELECEK ÇALIŞMALAR

5.1. Araştırmanın Kısıtları

Bu çalışma, elde edilen bulguların genellenebilirliği açısından bazı sınırlılıklara sahiptir:
Konu ve Kapsam Sınırlılığı: Araştırma, yalnızca 11. sınıf Bilgisayar Bilimi dersinin “Algoritmalar” konusu ile sınırlıdır. Farklı disiplinlerdeki veya daha soyut konulardaki performans bu çalışmanın kapsamı dışındadır.

Model Versiyonları: Çalışmada sadece ilgili yapay zekâ araçlarının ücretsiz sürümleri kullanılmıştır. Ücretli versiyonların (GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro vb.) sunduğu daha gelişmiş mantık yürütme ve multimodal yetenekler analize dahil edilmemiştir.

Uygulama Boyutu: Ders planları, uzman görüşü ve içerik analizi ile değerlendirilmiş; ancak bu planların gerçek bir sınıf ortamında uygulanmasıyla elde edilecek öğrenci çıktıları (başarı puanları, motivasyon düzeyleri) bu aşamada ölçülmemiştir.

Dil Bağımlılığı: Çalışma tamamen Türkçe komutlar (prompt) üzerinden yürütülmüştür. LLM’lerin İngilizce dilindeki eğitim verisi yoğunluğu nedeniyle, farklı dillerde farklı kalitede çıktılar üretme potansiyeli bir kısıt olarak görülmektedir.

5.2. Gelecek Çalışmalar için Öneriler

Bu çalışmanın bulgularından yola çıkarak gelecekte şu araştırma alanlarına odaklanılabilir:

Sınıf İçi Uygulama ve Etki Analizi: Gemini’nin önerdiği “Robot Sensin!” gibi yaratıcı etkinliklerin veya Grok’un yapılandırdığı teknik görevlerin gerçek öğrenci grupları üzerindeki etkisi deneysel çalışmalarla (deney-kontrol gruplu) incelenmelidir.

Model Sürümleri Arası Karşılaştırma: Aynı modellerin ücretsiz ve ücretli versiyonları arasındaki pedagojik kalite farkı, “yatırıma değerlik” açısından analiz edilebilir.

Özelleştirilmiş Prompt Mühendisliği: Modellere MEB müfredat kazanım numaraları ve yerel ders kitapları veri olarak sunulduğunda, ders planlarının yerel standartlara uyum düzeyinin nasıl değiştiği araştırılabilir.

Multimodal İçerik Üretimi: Modellerin sadece metin değil, akış şemaları (flowcharts) ve eğitim videoları taslakları oluşturma yetenekleri üzerine odaklanan daha teknik karşılaştırmalar yapılabilir.

Öğretmen Eğitimi ve YZ Okuryazarlığı: Farklı ÜYZ modellerinin sunduğu bu “asimetrik performansın”, öğretmenlerin ders hazırlık süreleri ve iş yükü üzerindeki azaltıcı etkisi nicel olarak ölçülmelidir.

Kaynakça

Google. (2026). Gemini. https://gemini.google.com adresinden erişildi.

Grok. (2026). Grok. https://grok.com adresinden erişildi.

Milli Eğitim Bakanlığı (MEB). (2018). Ortaöğretim Bilgisayar Bilimi Dersi (Kur 1, Kur 2) Öğretim Programı. Ankara: Talim ve Terbiye Kurulu Başkanlığı. https://ogmmateryal.eba.gov.tr adresinden erişildi.

OpenAI. (2026). ChatGPT . https://chat.openai.com adresinden erişildi.

Perplexity AI. (2026). Perplexity. https://www.perplexity.ai adresinden erişildi.

Prince, M. (2004). Does active learning work? A review of the research. Journal of Engineering Education, 93(3), 223-231.