Ryska sökmotorn Yandex källkod läckt: avslöjar information om 417 aktiva rankingfaktorer

Yandex hacket

Vad är Yandex

Yandex, Rysslands ledande sökmotor. Lär dig om dess tjänster, annonseringsmöjligheter och hur det skiljer sig från andra globala plattformar. Yandex är inte bara en sökmotor; det är en hel ekosystem av tjänster och produkter som dominerar den ryska digitala marknaden. Från e-posttjänster till molnlagring, erbjuder Yandex en mängd digitala produkter som är integrerade i vardagen för miljontals användare.

Annonsering på Yandex
Yandex.Direct erbjuder unika möjligheter för företag att nå den ryska marknaden. Innan du kan börja annonsera behöver du ett Yandex.Direct konto. Registreringsprocessen är enkel och kräver grundläggande företagsinformation.

Yandex har flera annonsformat:

  • Textannonser
  • Bildannonser
  • Videoannonser

Yandex.Direct erbjuder detaljerad segmentering. Du kan rikta dina annonser baserat på geografi, demografi, sökord och användarbeteende.

Yandex Webmaster Tools
För webbplatsägare och SEO-experter är Yandex Webmaster Tools ett oumbärligt verktyg för att förstå och förbättra webbplatsens prestanda…

Yandexleak – en protest mot den ryska invasionen?

En tidigare anställd har läckt källkoden till sökmotorn Yandex, som är populär i Ryssland, Turkiet och Östeuropa. Samtliga filer (totalt 100 GB) är daterade till den 24:e februari 2022 – dagen då Ryssland började invasionen i Ukraina, så det här är troligtvis en politisk markering. Yandex räknas som världens fjärde största sökmotor och att alla deras rankingfaktorer har läckt ut kan räknas som en av de mest dramatiska händelserna i SEO-historien. Varje faktor beskriver en specifik mätmetod för att avgöra hur relevant en viss webbplats är för en specifik sökfråga. Varje faktor har också information som vilka som är författare och ansvariga, vilken artikel det är dokumenterat i och vilken typ av data som används.

Av 1 922 rankingfaktorer går det att läsa ut koden och komma fram till att:

  • 242 av rankningsfaktorerna inte används ”TG_UNUSED”
  • 999 av rankingfaktorerna anges som föråldrade ”TG_DEPRECATED”
  • 242 är inte aktiva längre och har koden ”TG_UNUSED”
  • 149 är inte implementerade och har koden  ”TG_UNIMPLEMENTED”
  • 115 har tagits bort och har koden ”TG_REMOVED”.

Tar vi bort ovanstående återstår 417 aktiva rankingfaktorer. Många av dem saknar tyvärr utförligare beskrivningar, vilket gör dem svåra att tolka.

Det är viktigt att komma ihåg att Yandex inte är Google och att en faktor som är listad av Yandex inte nödvändigtvis får samma vikt av Google. Men detta kan ge insikter om vad som är viktigt för en sökmotor.

Sökresultaten för Yandex matchar med Google på en del frågor, så marknadsförare kan få viss inblick i rankingfaktorer, viktningar och mer som man kan förbättra på sin webbplats. Precis som Google använder också Yandex olika algoritmer och viktningar beroende på sökfråga. Till exempel skiljer man på tid: Det finns morgon-och kvällsviktningar (IND_FI_MORNING_QUERY), men också skillnader för vuxenunderhållning (IND_FI_XPORNO_QUERY), kommersiella frågor (IND_FI_QUERY_COMMERCIALITY_MX) med mera.

Yandex sökmotor

De viktigaste faktorerna för Yandex

En initial lista med viktningar av rankingfaktorerna (nav_linear.h) tyder på att de viktigaste av dem för Yandex finns inom fyra kategorier, som vi går igenom här nedanför.

1. Användarsignaler

Yandex använder en mängd olika användarsignaler kring beteenden för att förbättra relevansen i sina sökresultat, såsom:

  • sökfrågors historik
  • klickdata
  • klickfrekvens (click through rate)
  • senaste klicket på hemsidan (last click on site)
  • tid som man är på sidan (time on site)
  • avvisningsfrekvens (bounce rate)
  • återkommande besökare (returning visitors)
  • sökresultat feedback
  • placering på sidan
  • söktid
  • enhetstyp
  • bokmärkning av webbplatsen
  • plats
  • författare
  • detektering av översatt innehåll
  • antalet sökfrågor till en webbplats olika URL:er
  • rankingfaktorer för korta videor (tiktok, shorts, reels).

2. Länkar

Yandex använder precis som Google länkar som en viktig signal för att bestämma relevansen och betydelsen av en webbplats. Länkar från externa webbplatser till en viss webbplats anses vara en form av rekommendation, och webbplatser med fler eller bättre kvalitetslänkar blir då mer relevanta och viktiga. I sitt index använder Yandex också länkar för att identifiera och mäta populariteten hos en webbplats samt för att avgöra hur den är relaterad till andra webbplatser.

Av faktorerna förekommer länkar 456 gånger vilket är rätt intressant eftersom det fanns ett långlivat rykte i SEO-världen att länkar inte har betydelse för sökmotorerna. Yandex använder alltså precis som Google en dominerande LINK (Link Graf – länkgraf) i sina algoritmer. Linktemat implementerades senast maj 2019. De använder en faktor som mäter det genomsnittliga värdet av DifferentInternalLinks för en given sökfråga under ett år. Viktigt bland länkrelaterade faktorer är bland annat:

  • länkdata
  • länktexter
  • ålder på länkarna
  • ankartexter i backlinks
  • verifierade sociala medier-konton
  • backlinks från de 100 bästa webbsajterna i Pagerank påverkar rankingen.
  • länkar och omnämnanden från Wikipedia får extra vikt, men även trafik från sajten
  • länkar till video som fungerar är en bra rankingfaktor och en länk till en video som inte fungerar är dåligt
  • det verkar också finnas faktorer för webbplatser som VK, Sunhome.ru, expertcen.ru och Rumbler

3. Relevans för textinnehållet

Innehållet är självklart också viktigt, likaså dokumentkvalitet. I Yandex-algoritmen finns det faktorer för ”lingvistisk boosting” – vars syfte är att öka relevansen och kvaliteten på sökresultaten genom språkliga tekniker. Indexeringsdjup (crawl depth) är en annan rankingfaktor som innebär att man ska hålla sina sidor nära förstasidan, och toppsidor ett klick från huvudsidan. Viktiga sidor bör inte ligga längre bort än tre klick.

Trafik och procentuell andel organisk trafik spelar roll, vilket innebär att köpt annonsering kan påverka rankingen. Detta är något som Google alltid förnekar – inte så förvånande med tanke på att annonseringen påverkar deras affärsmodell.

Andra rankingfaktorer är: sökordet i URL:en, procentuell andel versaler i titeln, andelen annonser (ju färre desto bättre) samt dokumentålder och när det senast är uppdaterat.

4. Kvalitet och förtroende

YMYL (som står för Your Money or Your Life) används, och det är en term inom SEO för att beskriva webbplatser som handlar om ämnen som kan påverka människors pengar eller livsstil, som medicinska frågor, ekonomi och juridik. Det finns 15 rankingfaktorer för medicinska, ekonomiska och juridiska ämnen.

Yandex har specifika rankingfaktorer för:

  • https (det vill säga att man har sajten krypterad)
  • sidhastighet (hastigheten är med andra ord viktig även här precis som på Google)
  • användarrecensioner och kommentarer
  • siffror i URL:erna är dåligt för rankingen likaså att använda flera snedstreck
  • att använda Yandex Metrika, Google Analytics och JavaScript från Facebook.
  • om det finns Google Maps på sajten
  • 40X-och 50X-fel (ju färre desto bättre)
  • TikTok
  • Google Analytics JavaScript-kod (som är en positiv rankingfaktor)

Sidor med låg kvalitet påverkar hela domänen. En annan intressant sak är att det finns tio rankingfaktorer för tid på dygnet och veckodag, även rankingfluktuationer på helgen.

Lite mer tekniskt om viktningar

Det finns också en lista med den initiala vikten av olika rankingfaktorer där FI_URL_DOMAIN_FRACTION får mest vikt med 0.564095297143887 följt av FI_QUERY_DOWNER_CLICKS_COMBO. Den slutliga rankingen beräknas av ett AI (Matrixnet).

De andra som har intitial vikt:

  • FI_URL_DOMAIN_FRACTION
  • FI_QUERY_DOWNER_CLICKS_COMBO
  • FI_MAX_WORD_HOST_Cllicks
  • FI_MAx_WORD_HOST_YABAR
  • Fi_IS_COM
  • FI_OQ_BCLM_PLAIN
  • FI_OWNER_CLICK_PCTR

För att ta ett exempel är faktor FI_URL_DOMAIN_FRACTION, även känd som ”UrlDomainFraction”, en dynamisk faktor som används i kvalitetssökningen av Yandex-teams Jandekspoisk. Den mäter täckningen av en domän av trigram från frågan. Det beräknas genom att översätta frågan till transliteration, hitta trigram som täcks och sedan titta på vilken andel av alla trigram som täcks. Faktorn är en del av gruppen ”Dynamic” och den använder i sin tur taggarna TG_HOST, TG_DYNAMIC, TG_URL_TEXT, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE, TG_FORMULA_2245_DEP_2, TG_DEPRECATED.
Den skrevs av Cliff och Melton, och ansvariga är Tsimkha och Melton.

Mer information

En detaljerad lista över rankingfaktorerna finns tillgänglig på Web Marketing School.
Twittraren Alex Burkas har en bra tråd kring rankingfaktorer.

 

 

Om författaren

Website | + posts

Daniel Larsson började jobba professionellt med webben 1994. Han är utbildad civilekonom inom marknadsföring och har jobbat +20 år som senior SEO-specialist. Daniel har arbetat inhouse som webbansvarig och marknadsansvarig. Han har på byråsidan varit konsult för flera av Sveriges största varumärken och suttit med i juryn för Nordic Search Awards och European Search Awards.