Rankbrain Algoritması, Google’ın yapay zeka, makine öğrenimi destekli olarak sorguların arka planında yatan arama amacını daha iyi anlamayı ve sorguları çok daha iyi yorumlamayı amaçlayarak geliştirdiği algoritmadır. Google tarafından kullanılan en önemli 3.cü algoritma olarak belirtilen ve resmi olarak 26 ekim 2015 yılında duyurulan Rankbrain algoritması ile Google sorguları, özellikle de daha öncesinde cevaplandırmakta zorlandığı sorguları çok daha iyi anlamaya ve yorumlamaya başlamıştır.
Rankbrain algoritmasını diğer Google algoritmalarından ayıran en önemli fark, Algoritmanın derin öğrenme, yapay zeka desteği ile Google mühendislerinin minimum müdahalesine ihtiyaç duyarak kendisini geliştirebiliyor olmasıdır. Yapay zeka destekli algoritma, makine öğrenimi ile kendi kendini geliştirse de hala Google mühendislerinin periyodik geliştirmelerine ihtiyaç duymaktadır.
Rankbrain algoritması daha önce karşılaşmadığı bir sorgu gördüğünde yada herhangi bir sorgu içerisinde daha önce karşılaşmadığı bir anahtar kelime (entity), ifade görüntülediğinde ilgili sorguyu içerisindeki tanımlayamadığı anahtar kelimenin yerine geçebilecek anahtar kelimeleri word vektörleri kullanarak tahmin eder ve sorguyu yorumlar. Tanımlayamadığı anahtar kelimelerin yerine geçebilecek kelime ve ifadeleri belirledikten sonra sorguyu buna göre yeniden yorumlar ve arama sonuçlarını buna göre filtreler.
Bilinmeyen anahtar kelime, ifade ve sorgular üzerinde gerçekleştirilen bu işlem ile yapay zeka destekli olarak sorguların arka planında yatan arama amacının ve sorgunun genel anlamının çok daha başarılı şekilde çözülmesi sağlanır.
Google üzerinde gerçekleştirilen arama sorguları Word vectorler (kelimelerin anlamını ifade eden numaralar) olarak kendi aralarında dil uyum ve anlamlarına göre gruplandırılırlar. Rankbrain algoritması kendi içerisinde linguistic (dilsel olarak) anlam bütünlüğü olan, birbiri ile eş ve yakın anlamlı olan kelimeleri kendi içerisinde bir eşleşme (kümesi) olarak gruplar.
Google üzerinde gerçekleştirilen herhangi bir sorgunun daha iyi yorumlanabilmesi, sorgunun arka planında yatan arama amacının daha iyi çözümlenebilmesi ve en önemlisi anlamı bilinmeyen bir kelime yada ifadenin farklı bir kelime, ifade ile yorumlanarak çözümlenebilmesinde oluşturulan bu word vectorler (Word2vec) ve kelime eşleşmeleri kullanılır.
Rankbrain ile alakalı farklı Google algoritmaları ;
Google Rankbrain Algoritmasının Amacı Nedir?
Gün içerisinde milyarlarca sorguya cevap veren Google, içerisinde gerçekleşen sorguların yaklaşık %15’i Google algoritmasının daha önce karşılaşmadığı özgün ve rutin sorguların dışında kalan “farklı” sorgulardır. Bu sorgular, Google tarafından ilk defa karşılaşıldığından ve özellikle de önemli bir bölümü doğal dil sorgusu (Natural Language Queries) formatında olduğundan rutin bir şekilde cevaplanması zor sorgulardır. Google’ın üstlendiği misyon içerisinde milyarlarca sorgunun yaklaşık %15’inin sağlıklı şekilde anlaşılarak rutin şekilde cevaplanamıyor olması Rankbrain öncesinde önemli bir zorluktu.
Bu zorluk ve amaç dahilinde Google, yapay zeka desteği ile dış müdahaleye minimum şekilde ihtiyaç duyan ve kendi kendine öğrenerek Google’ın daha öncesinde karşılaşmadığı sorguları çok daha iyi çözümlemek ve arama sonuçlarını buna göre düzenlemek amacı ile Rankbrain algoritmasını geliştirmiştir.
Rankbrain Algoritmasının Önemi Nedir?
2015 yılının erken dönemlerinde uygulamaya konan ve resmi olarak 2015 yılının ekim ayında duyurulan Rankbrain, Google tarafından arama sisteminin (çekirdeğinin) en önemli 3.cü sıralama faktörü olarak belirtilmiştir. Rankbrain algoritmasının Google arama sistemi içerisindeki önemini belirleyen faktörlerin en başında deep learning (derin öğrenme) sayesinde Google mühendislerinin minimum müdahalesine ihtiyaç duyarak kendisini geliştirebilmesi gelmektedir.
Rankbrain’in Google arama sistemi içerisindeki önemini arttıran en kritik faktörlerden biri de özellikle derin öğrenme ile tarihsel arama verilerini (historical data) kullanarak Google’ın daha önce karşılaşmadığı ve rutinden farklı olarak sağlıklı arama sonuçlarını sunmakta zorlandığı sorguları çok daha iyi yorumlayarak öğrenmesi ve arama sonuçlarını kullanıcıların arama niyetine çok daha uyumlu hale getirmesidir.
Google’ın kıdemli araştırmacısı, mühendisi
Greg Corrado Rankbrain ile alakalı şunları söylemiştir; Rankbrain, Google’ın arama sonuçları sayfasında hangi web sitelerinin kaçıncı sırada gösterileceğini belirlemede kullandığı yüzlerce sinyalden bir tanesidir. Ancak bu yüzlerce sinyal içerisinden Rankbrain yayınlandığı tarihten itibaren bir arama sorgusuna ait arama sonuç sayfasındaki sıralamayı belirlemede etkili olan en önemli 3.cü sinyal haline gelmiştir demiştir.
Kaynak: https://searchengineland.com/meet-rankbrain-google-search-results-234386 – Danny Sullivan
Rankbrain’i Google algoritmaları (sıralama faktörleri) içerisinde en önemli 3. faktör yapan etmenlerden bir diğeri de günümüzde Google’ın gelişen, sorguları anlama ve içerikleri alakalarına göre sorgular ile eşleştirme yeteneğine paralel olarak artan uzun kuyruklu sorgulardır. Artan uzun kuyruklu sorgulara paralel olarak Rankbrain algoritmasının kullanım sıklığı, etkinliği artış göstermiş ve Rankbrain’in algoritma içerisindeki önemi artmıştır.
Rankbrain Algoritması Nasıl Çalışır?
Rankbrain deep learning yani derin öğrenme, yapay zeka destekli bir algoritma olarak herhangi bir sorgu ile alakalı oluşturulan arama sonuç sayfalarının nasıl daha iyi oluşturabileceğini tarihsel arama verilerine (historical data) bakarak karar vermeye çalışır. Sorgu ile alakalı arama sonuçlarını belirlerken çok sayıda farklı sinyale bakarak sorguyu genişletir, yorumlar ve arama sonuçlarını buna göre düzenler.
Aşağıda yer alan video da Garry Illyes tarafında da açıklandığı şekilde Rankbrain mevcut çalışma sistemi ile özellikle Google tarafından daha öncesinde rutin olarak cevaplanmayan ve daha önce karşılaşılmamış sorguları cevaplamada çok başarılı bir performans göstermektedir.
Özellikle daha önce rutin olarak sağlıklı, hedeflenen şekilde cevaplanmamış ve karşılaşılmamış olan sorgular içerisinden Google için en zorlayıcı olan Natural Language Queries (Doğal dil sorguları) Rankbrain ile çok daha iyi çözümlenmeye ve yorumlanmaya başlanmıştır.
Tipik olarak Google üzerinde gerçekleştirilen rutin sorgularda Google sorgu verilerini toplar, arama sonuçlarını belirler ve ortaya çıkan sonuçları tarihsel veri (historical data) olarak saklar. Google üzerinde algoritmanın daha önce karşılaşmadığı bir sorgu gerçekleştirildiğinde yada natural language query olarak adlandırdığımız gündelik konuşma diline benzer, klasik algoritmaların kolaylıkla anlayamayacağı tarzda sorgular girildiğinde bu tarz sorgular ile alakalı veriler rutin olarak bulunmadığından bu tarz sorgular için Rankbrain devreye girerek geçmişte benzer tarzda kullanılmış sorgulardan elde ettiği verileri kullanarak sorguyu tahmin ederek yorumlar ve arama sonuçlarını buna göre belirler.
Long tail (uzun kuyruklu) ve doğal dil kullanımı ile oluşturulan sorgular Google tarafından daha öncesinde karşılaşılmamış ise arama sorgularında kullanılan kelimeleri gruplandırmak için kullanılan Word vectorlerden faydanılarak sorgu içerisindeki kelimelere, ifadelere karşılık gelecek kelimeler Rankbrain tarafından tahmin edilir ve sorgu buna göre yorumlanır. Bu gruplandırmalarda kullanılan veriler geçmişte benzer tarzda oluşturulmuş sorgulardan alınan verilerden faydalanılarak oluşturulur.
Rankbrain, sorguları anahtar kelimelere, entitylere bölerek linguistic (dilsel) olarak yapılarına, anlam benzerliklerine göre sorgu ile uyumlu olabilecek kelimeleri ve kelime kümelerini gruplar ve sorguyu tahmin etmeye çalışır. Kelimelerin (entitylerin) birbirleri ile anlamsal olarak sıralanması ve eşleştirilmesi sürecinde kelimelerin anlamlarını algoritmanın anlamlandırabilmesi amacıyla kullanılan Word vectorlerden (word2vec) faydalanılır. Bu noktada herhangi bir sorgu içerisinde sıklıkla kullanılmayan bir ifade, kelime kullandığınız da sorgunun anlamı Google için bulanıklaşıyor ise Google, Rankbrain algoritmasından faydalanarak ilgili anahtar kelimeyi alternatifini kullanarak tahmin etmeye çalışır ve sorgunun arama sonuçlarını buna göre oluşturur.
Rankbrain, yerel arama (local search), linkler, spam analizi gibi arama sisteminin farklı faktörleri ile doğrudan ilgili değildir. Yalnızca sorgulara yönelik arama sonuçlarının iyileştirilmesi, ve anlamlandırılamayan sorguların çok daha başarılı şekilde anlaşılması ve yorumlanması ile doğrudan ilişkilidir.
Rankbrain klasik çekirdek (core) algoritmanın bir parçası olarak tüm sorgularda kontrol gerçekleştirir ve hali hazırda herhangi bir sorgunun arama sonuçlarının başarılı olarak oluşturulup oluşturulmadığını kontrol eder. Herhangi bir sorgu için sorguya yanıt olarak dönen arama sonuçlarında yer alan içerikler sorgu ile alaka noktasında uyumlu değil ise Rankbrain sorguya yönelik yeniden hesaplama yaparak arama sonuçlarını yeniden düzenler. Özellikle işlevi gereği uzun kuyruklu ve doğal dil sorgularında başarılı olması sebebiyle günümüzde pek çok sorguda Rankbrain’in aktif olarak rol oynadığı söylemek mümkündür.
Rankbrain Sorguların Önemli Bölümünde Kullanılıyor
Özellikle yapısı ve işlevi gereği yukarıda değindiğimiz gibi, Google’ın ilk kez karşılaştığı total sorguların yaklaşık %15’lik diliminde çok başarılı sonuçlar veren Rankbrain, toplam sorguların %15’lik bölümünün dışında kalan sorgularda da kullanılmaktadır.
Sanılanın aksine Rankbrain algoritması, çok başarılı sonuçlar verdiği doğal dil sorguları ve ilk kez karşılaşılan sorguların yanı sıra Google’da gerçekleştirilen pek çok sorguda aktif olarak kullanılmaktadır.
Rankbrain Periyodik Olarak Yeniden Eğitilmekte
Rankbrain derin öğrenme ile gerçekleştirdiği işlemlere yönelik öğrenme gerçekleştiriyor olsa da kendi içerisinde sağladığı derin öğrenmenin sürekli olmadığı ve öğrenme işlemini anında gerçekleştirmediği Jack Clark ve Garry Illyes tarafından Twitter’da söylendi.
Rankbrain algoritması için sürekli olmasa da karşılaştığı yeni sorgular ve arama yapıları ile alakalı Google mühendisleri tarafından yeniden öğrenme ve yeniden programlanma süreçleri sağlanmaktadır. Rankbrain algoritması periyodik olarak yeniden düzenlemekte (eğitilmektedir).
Knowledge Graph, Hummingbird ve Rankbrain
Google’ın 2012 yılında duyurduğu Knowledge Graph ve 1 yıl sonra 2013 yılında duyurduğu Hummingbird algoritması, Google’ın semantic search (anlamsal arama) misyonu içerisinde algoritmanın stringlerden entitylere ve (vectorlere) geçişinin duyurulduğu ilk adımlardı.
Hummingbird algoritması ile Google bir cümle içerisindeki entityleri, anahtar kelimeleri ve cümlenin anlamını çok daha başarılı şekilde anlayarak yorumlamaya (sorguları genişletmeye) ve Knowledge Graph ile veritabanı içerisinde herhangi bir entity’nin fact ve attributelarını (bağlantılarını) kaydederek sorguları ve sorguda yer alan ifadeleri çok daha başarılı şekilde anlamlandırmaya başlamıştır.
Hummingbird algoritması ile sorguların anlamının genişletilerek daha iyi yorumlanmaya başlanması ve Knowledge Graph ile entity tabanlı semantic aramaların geliştirilmesi günümüzde başarılı şekilde gerçekleştirdiğimiz sorguların temelini oluşturan geliştirmelerdi.
Bu noktada Knowledge Graph ve en temelde Hummingbird algoritması ile çekirdek algoritmanın kazandığı yetenekler Rankbrain ile çok daha otomotize bir hale gelmiş ve yapay zeka destekli algoritma çok daha kompleks sorguları öğrenerek cevaplayabilir, yorumlayabilir hale gelmiştir.
Rankbrain ve Word Vectorler (Word2Vec)
Jack Clark‘a göre Google’ın NLP (Natural Language Processing) yani doğal dili algılama amacıyla gerçekleştirdiği çalışmalarda kullandığı, bilgisayarların yani algoritmanın kelimelerin birbiri arasındaki alakaları ve kelimenin anlamını daha iyi anlaması amacıyla geliştirdiği ve kullandığı Word Vectorler, Rankbrain algoritmasında da kullanılmaktadır.
Herhangi bir web dokümanı içerisindeki kelimelerin ve dokümanın içerisindeki cümlelerin anlamının daha iyi anlaşılabilmesi adına Word vectorler devreye girerek kelimelerin anlamlarını ve benzer anlamdaki kelimelerin birbiri arasındaki ilişkilerin belirlenmesinde ve veritabanına kaydedilmesinde kullanılır. Aynı şekilde Google’da gerçekleştirilen sorgularda da kelimeler word vectorlere bölünerek sorgunun anlamı ve sorguda kullanılan kelimelerin yerine geçebilecek yakın anlamdaki kelimeler “distributed represantation” olarak kaydedilir.
Rankbrain, vektörlerden faydalanarak herhangi bir sorgu içerisindeki kelime ve ifadelerin farklı sorgularda kullanılan kelime ve ifadeler ile arasındaki ilişkiye ve anlam bütünlüğüne tarihsel verileri kullanarak bakmakta ve kelimelerin birbiri arasındaki linguistic (dilsel), anlamsal ilişkileri öğrenmektedir.