"Snippet"lər Nəyə Əsasən Təyin Olunur? Qiymətləndirilmə Prosesi

"Snippet"lər Nəyə Əsasən Təyin Olunur? Qiymətləndirilmə Prosesi

“Snippet” termini axtarış sistemlərində müəyyən bir sorğuya cavabların xülasəsini ehtiva edən qısa mətn parçalarına aiddir. Bu seçilmiş qısa mətnlər istifadəçiyə axtarış etdiyi mövzunun nəticəsini qısa vaxt ərzində görməsinə imkan yaradır. 

 

Yəni gün ərzində milyardlarla insan “Google”də axtarış edir və bunların əksəriyyəti məlumat xarakterlidir. Siz bu məlumat üçün mövzuları axtararkən şəkildə əks olunan kimi kənarda (mərkəzdə də ola bilər) qısa-konkret məlumat əks olunur.

Bəs bu “snippet”lər hansı veb-saytlardan və nəyə əsasən təyin olunur?

 

“Google” bu zaman edilən sorğulara uyğun cavabları müəyyən etmək üçün iki əsas siqnaldan istifadə edir:

 

1.Sorğudan asılı siqnallar. Onlar istifadəçinin sorğusuna nə dərəcədə uyğun olduğunu müəyyən edirlər. 

2.Sorğudan asılı olmayan siqnallar. Sorğu şərtləri ilə əlaqəsi olmayan amillərə, məsələn, səhifənin keçid keyfiyyətinə əsaslanır.

 

“Snippet” xalları

 

Xallar “Google” axtarış nəticələrinin müəyyən edilməsi və sıralamasını anlamaq üçün çox vacibdir. İki əsas xal növü var; sorğudan asılı və ümumi cavab xalları.

 

1.Sorğudan asılı xal. Axtarışın nəticəsinə yanaşmanın ölçüsü

 

Sorğudan asılı xal, cavabın sorğu şərtlərinə nə dərəcədə uyğun olduğunu müəyyən etmək üçün çətin metrik təmin edir. Məsələn, istifadəçi "ən yaxşı yeməyi necə hazırlamaq olar" sualını verdikdə, “Google” cavab namizədlərini həmin sorğunun şərtləri ilə müqayisə edir. Sorğudan asılı xal bu müqayisədə olan nəticələrin axtarış ilə nə dərəcədə uyğun olduğunu ölçür.

 

Yəni, əgər sorğuda istifadə olunan sözlər cavabda tez-tez istifadə olunursa və onun məzmunu ilə uyğunluğu yüksəkdirsə, bu cavabın sorğudan asılı balı yüksək olacaq. Yüksək xalı olan mətn istifadəçiyə onun axtarışına uyğun cavab verdiyi üçün “snippet” olaraq istifadə olunur.

 

2.Ümumi cavab hesabı. Ümumi performansın müəyyənedicisi

 

Sorğudan asılı xallar uyğunluğu müəyyən etmək üçün önəmli olsa da, ümumi cavab balı daha əhatəli qiymətləndirmə təmin edir. Ümumi cavab balı sorğudan asılı ballardan istifadə etməklə yaradılmış xaldır və adından da göründüyü kimi üçün cavabların performansını ölçür.

 

Yəni, əgər bir axtarış nəticəsi bir sıra müxtəlif sorğulara uyğun gəlirsə və istifadəçilərə geniş məzmun təqdim edirsə, ümumi cavab balı yüksək olacaq.

Məsələn, bir istifadəçi "ən uzun çay" sorğusunu verəndə, “Google” həmin sorğu üçün bir neçə cavab namizədini qiymətləndirir. Sorğudan asılı ballar hər bir cavabın sorğunun şərtlərinə nə dərəcədə uyğun olduğunu müəyyən edir. Sonra bu ballardan istifadə edərək ümumi cavab balı yaradılır. Ən yüksək ümumi cavab balı olan cavab "istifadəçinin sualına ən yaxşı cavab verən “snippet” kimi seçilir.

 

“Google” bu ballardan istifadə edərək istifadəçi təcrübəsini təkmilləşdirməyi hədəfləyir. Bu səbəbdən də ən yaxşı cavabları təyin edərkən həm axtarışlara uyğunluğu, həm də ümumi dəyəri nəzərə alır.

 

Patent bizə hansı üstünlükləri verir?

 

  • Daha qabaqcıl sorğudan asılı xallar. İstifadəçilərə sorğularına daha konkret və uyğun cavablar almağa imkan verir.
  • Müxtəlif sorğulara uyğunlaşma. Müxtəlif sorğulara daha yaxşı uyğunlaşmaq üçün geniş məzmunlu veb-saytları dəstəkləyir.
  • Kontekst korrelyasiyası. Cavabların təkcə sorğu şərtlərinə deyil, həm də cavab şərtlərinə uyğunluğunu qiymətləndirir.
  • Keyfiyyətli kontentlər seçimi. Seçilmiş fraqmentlərdə dəqiq və keyfiyyətli məlumatlardan ibarət olur.
  • Qabaqcıl məlumatı təqdim etmək bacarığı. Daha çox məlumatı qiymətləndirmək və vurğulamaq bacarığı.
  • Daha yaxşı istifadəçi təcrübəsi. İstifadəçilərin daha effektiv və mənalı axtarış nəticələrinə çatmasına imkan verir.

 

“Snippet” qiymətləndirmə sistemi


1.Sorğudan aslı qiymətləndirmə

 

  • Cavab müddəti uyğunluq qiyməti. Bu, mətnin “snippet” ola biləcək hissəsinin sorğu şərtlərinə cavab şərtlərinin oxşarlığını ölçən bal sistemidir. Yəni respondentin təklif etdiyi cavabın istifadəçinin verdiyi sualla nə dərəcədə uyğun olduğunu müəyyən etmək üçün istifadə olunur.
  • Sorğuya aslı qiymətləndirmə: Əvvəlcə, potensial cavab şərtlərinin siyahısı yaradılır. Bu siyahıda axtarışın nəticəsi olan ən yaxşı məzmunlar yer alır.
  • Termin çəkiləri və vektorlaşdırma. Hər bir terminin sorğuda ən yüksək reytinqli nəticələrdə görünmə tezliyinə əsaslanan çəkisi var. Yəni termin nə qədər çoxdursa, onun çəkisi də bir o qədər yüksəkdir. Bu çəkilər terminin sorğuda nə qədər vacib olduğunu göstərir. 

 

Termin  çəkisinə vuraraq vektor yaradılır. Bu vektor namizədin cavab fraqmentində olan terminlərin tezliyi əsasında müəyyən edilir. Daha sadə desək, "semantika" termini cavab fraqmentində iki dəfə görünürsə, bu termin üçün vektor dəyəri 2 olacaq. 

 

  • Veb-saytın növünə əsasən qiymətləndirmə. Hər bir namizəd mətnin qiymətləndirilməsində son olaraq veb-saytın hansı sahəyə aid olduğu nəzərə alınır.  Əgər veb-saytın aid olduğu sahə axtarış olunan mövzu ilə tam fərqlidirs, bu balın azalmasına səbəb olur.

 

Gəlin sorğudan aslı qiymətləndirməni daha da da sadələşdirək. Biz "Ən sürətli qatar hansıdır" sualının cavabını axtarırıqsa, “Google” bütün bu suala cavab ola biləcək kontentləri nəzərdən keçirir, xüsusilə də axtardığımız sözün ən çox istifadə olunduğu kontentləri. O, cavabda görünən terminlərin tezliyinə və bu terminlərin müəyyən bir varlıq növünü təsvir edib-etməməsinə diqqət yetirir. Daha sonra, ən uyğun cavab sorğudan asılı qiymətləndirmə prosesi nəticəsində müəyyən edilir və “snippet” olaraq qaşımıza çıxır.

 

2.Sorğudan asılı olmayan qiymətləndirmə

 

  • Cavab fraqmentləri. Namizədin cavab fraqmentləri sorğunun cavabları arasında ən yaxşı mənbədən seçilir.
  • Axtarış sıralaması. “Snippet” olmağa namizət mətnin axtarış sıralamasında öndə olması onun qiymətləndirilməsinə müsbət təsir edir.
  • Strukturlaşdırılmış məzmun. Əgər cavabda strukturlaşdırılmış məzmun varsa (məsələn, cədvəl, qrafik), bu məzmun qiymətləndirilməyə bilər. 
  • Bölmə limit nöqtələri. Axtarışda “snippet” üçün ayrılan hissəyə sığmayacaq mətn olarsa, o qiymətləndirilmir. 
  • Konkret olmayan cavab. Axtarışın nəticəsi konkret deyilsə və əlavə suallar yaradırsa, bu “snippet”ə salınmır. Yəni, "Günəş saat neçədə çıxır" sualına "təxminən 5-8 arası" cavabında dəqiq saat yoxdur və konrent deyil deyə qiymətləndirilmə edilsə belə, az xal alacaq. 
  • Köməkçi sözlər. Məsələn, "lakin", "əksinə" kimi sözlərin çox olduğu mətnlər aşağı xal alır.

 

 

Muzaffar Garakhanli

Other articles

"Query Context": "Query Definition" Və "Query Aspect" Yanaşmaları

"Query Context": "Query Definition" Və "Query Aspect" Yanaşmaları

"Orion" Yanaşmasının Fəaliyyəti

"Orion" Yanaşmasının Fəaliyyəti

“Semantic Relevance”nin Axtarış Nəticələrinə Təsiri

“Semantic Relevance”nin Axtarış Nəticələrinə Təsiri