ChatGPT Nasıl Çalışıyor?
Özetle ChatGPT, Büyük Öğrenme Modeli (Large Learning Model) olarak adlandırılan bir makine öğrenimi türüdür.Büyük bir öğrenme modeli, bir cümle içindeki bir sonraki kelimenin ne olduğunu tahmin edebilen büyük miktarda veri üzerinde eğitilmiş bir yapay zekadır.
Ne kadar çok veri üzerinde eğitilirse o kadar çok türde görevi yerine getirebilir (makale yazmak gibi).
Bazen büyük dil modelleri beklenmedik yetenekler geliştirir.
Stanford Üniversitesi, eğitim verilerindeki artışın GPT-3’ün bu görevi yapmak için özel olarak eğitilmemiş olmasına rağmen metni İngilizce’den Fransızca’ya çevirmesini nasıl sağladığını yazıyor.
GPT-3 (ve ChatGPT’nin temelini oluşturan GPT-3.5) gibi büyük dil modelleri belirli görevleri yerine getirmek üzere eğitilmez. Daha sonra diğer alanlara uygulayabilecekleri geniş bir bilgi yelpazesi ile eğitilirler.
Bu, bir insanın öğrenme yöntemine benziyor. Örneğin, bir insan marangoz olmaya dair temel bilgileri öğrenirse, bu kişiye nasıl yapılacağı özel olarak öğretilmemiş olsa bile, bu bilgiyi pekala bir masa yapmak için kullanabilir.