Yandexin kendi ifadesine göre algoritma matrixnet şu şekilde işliyor.
"Öğrenen bilgisayar konsepti 90’ların başından itibaren arama teknolojilerinde kullanılıyor. Farklı arama sistemleri farklı modeller kullanıyor. Öğrenen bilgisayar teknolojisindeki sorunlardan biri alakalı-alakasız bütün verileri arama sonuçlarına ekleme anlamında “gerekli-gereksiz bütün sonuçları ölçütlere uydurma” sendromudur. Bütün verileri aynı sepette toplayan bu tür bir algoritma, kitapta okuduğu bütün hastalıklara yakalandığını düşünen hastalık hastası bir tıp fakültesi öğrencisine benzer. Yeterince deneyimli olmayan bu öğrenci gördüklerine bahane uydurmaktadır. Bir bilgisayar da küçük ve yetersiz bir öğrenim örneğinden (değerlendiricilerin “doğru” olduğunu tahmin ettiği sonuçlar) yola çıkarak çok fazla sayıda faktörü hesaba katmaya çalıştığında (bu durumda, web sayfaları ve arama sorgularının özellikleri) gerçekte var olmayan bağıntılar tespit edecektir. Örneğin, öğrenim örneğine aynı faktörlere sahip (2 KB'lık dosya boyutu, mor renkli arka plan ve “A” harfiyle başlayan gövde metni gibi), ancak birbirinden farklı iki sayfa dahil edilmiş olabilir. Üstelik tümüyle rastlantı eseri olarak her iki sayfa da [elma] arama sorgusuyla alakalı olabilir. Bu durumda bilgisayar söz konusu faktörlerin [elma] arama sorgusuyla alakalı arama sonuçlarına uygun olduğuna karar verebilir. Aynı zamanda, elmalar hakkında gerçekten alakalı ve yararlı bilgiler veren web sayfaları da bu faktörlere sahip olmadığı için önemsiz olarak değerlendirilebilir.
Yandex, 2009 yılında, yeni bir bilgisayara öğretme yöntemi olan MatrixNet’i kullanmaya başladı. Bu yöntemin en büyük özelliği; bir yandan gerekli-gereksiz bütün sonuçları ölçütlere uydurma olasılığını azaltırken, diğer yandan da Yandex’in arama motorunun arama sonuçlarının alaka düzeyini belirlemek için çok sayıda faktörü hesaba katmasını sağlamasıydı. Üstelik arama sisteminin, “doğruyu” “doğru olmayandan" ayırt etmeyi öğrenmesi için büyük bir arama sonucu örneğine de ihtiyacı yoktu. Bu da sistemin var olmayan bağıntılar bulma hatasına düşmesini önlüyordu.
MatrixNet, çok sayıda faktörü bir arada dikkate alan uzun ve ayrıntılı bir sıralama formülünün oluşturulmasını sağlamaktadır. Buna benzeyen diğer bilgisayara öğretme yöntemleri ise ya az sayıda faktör kullanarak benzer sonuçlar üretir ya da daha büyük bir öğrenim örneğine gerek duyar. MatrixNet, on binlerce faktöre dayanan bir arama formülü oluşturur. Bu da arama sonuçlarının çok daha alakalı olmasına imkan tanır.
MatrixNet’in bir diğer önemli özelliği de farklı arama sorguları için farklı sıralama formülleri oluşturulmasını sağlaması. Örneğin, sıralama algoritmasında müzik aramalarını kolaylaştıracak değişiklikler yapmak diğer sorgu türlerinin kalitesini düşürmeyecektir. Sıralama algoritmaları onlarca düğmesi, şalteri, kolu ve kadranı olan karmaşık bir makine gibidir. Nitekim böyle bir makinede tek bir şalteri çevirmek bile bütün makinenin işleyişini değiştirecektir. MatrixNet ise bütün sistemin değiştirilmesine gerek kalmadan her sorgu türü için ayrı parametreler belirlenmesine imkan verir"
Yani elmalar armutlar karışmadan güzelce arama kelimesine göre sıralayabiliyoruz diyorlar.
Yandex'in yatırımalrı sürmesi halinde türkyede pazar payında önemli pay sahibi olacaklarını bu yaklaşımlardan sezmekteyim. Tabi en doğruyu bize zaman gösterecek...
0 yorum:
Yorum Gönder