Dieta index - Ce aduce și cum funcționează Creșterea

Mai mult nu este întotdeauna mai bun - uneori trebuie să vă despărțiți de lucruri. Aici puteți afla ce trebuie să faceți pentru a aduce în index numai conținut foarte bun și important.

La asta vă puteți aștepta în această postare

Ce este o dietă index?
Ce cerințe trebuie îndeplinite?
Cum trebuie să procedați?

Acest articol a fost creat în colaborare cu Vanessa Ostner și Maik Schindler.

Subiectul dietei index este în prezent pe buzele tuturor. Și asta nu este surprinzător - deoarece hype-ul de conținut a creat atât de mult conținut încât, la un moment dat, a trebuit să devină suprasaturat. A fost publicat (și se publică) atât de mult conținut, încât nu totul poate adăuga valoare pentru vizitatori sau motoare de căutare.

Care este punctul de plecare?

Când vine vorba de conținut, este la fel ca la toate celelalte hypes. Ceea ce începe ca o inovație sensibilă este redus la absurd prin faptul că tot mai mulți oameni sar pe cărucior și doresc, de asemenea, o bucată de plăcintă. Așa că conținutul s-a transformat din rege în panaceu - iar calitatea a căzut adesea pe mal. Chiar și calculul de a fi găsit pentru toți termenii și combinațiile de căutare posibili și imposibili, cu ajutorul acestui conținut, a funcționat cu adevărat doar în câteva cazuri.

Mai ales că Google a acordat atenție și calității conținutului cu Panda and Co., această abordare nu mai este recomandată. De multe ori, un astfel de conținut folosește pur și simplu moartea lentă a rezultatelor căutării. Paginile „mult ajută foarte mult” care au ceva de spus despre toate sunt un bun exemplu aici:

Fig. 1: Moartea lentă a unui site cu probleme masive cu conținut subțire și conținut aproape duplicat.

Dar ce puteți face pentru a vă asigura că tot conținutul inutil - de la conținut duplicat la texte de 2 stele Textbroker - nu vă pune în pericol succesul în SERP? În primul rând, trebuie să vă asigurați că numai paginile care sunt cu adevărat importante pentru căutare sunt incluse în index. Dar ce ar fi ei?

În magazinele online, paginile relevante pentru căutare sunt pagina de început, paginile categoriei, paginile subcategoriei, paginile produselor și, dacă este cazul, paginile subiectului. Pentru paginile editorilor, pagina de start, categoriile de subiecte, subcategoriile, articolele, conținutul media (cum ar fi videoclipuri sau podcast-uri) și conținutul lung (cum ar fi PDF-urile și cărțile albe) sunt foarte importante.

În schimb, următoarele pagini nu sunt relevante pentru căutare în majoritatea cazurilor:

Paginile cu rezultatele căutării
Filtrează paginile, sortările și tipurile de pagini similare
Dubluri
conținut subțire
pagini goale
...

Probabil cunoașteți multe site-uri web care plasează pagini cu rezultate ale căutării sau duplicate în index. Acest lucru arată de ce dieta cu indicii devine din ce în ce mai relevantă - și această evoluție se reflectă și în programele conferințelor relevante.

Fig. 2: Conferință anunțată de la OTTO la SEO CAMPIXX 2018.

Când trebuie să începeți o dietă index?

În principiu, există două probleme de bază care apar dintr-o mulțime de conținut rău:

Google (și orice alt motor de căutare) trebuie să acceseze cu crawlere toate documentele existente pentru a le indexa.
Google (și orice alt motor de căutare, de asemenea) trebuie să analizeze relevanța documentelor indexate pentru a le putea afișa în căutare.

Deci, dacă oferiți o mulțime de conținut „fără valoare”, risipiți resurse importante. În cele din urmă, îi distragi pe crawler de la conținutul tău foarte bun. Este posibil ca acestea să nu fie accesate cu crawlere și indexate suficient de repede. De asemenea, se poate întâmpla ca masa conținutului rău să dilueze relevanța conținutului bun din index.

Oferiți un articol despre subiectul „Curățarea indexului”. Aceasta ar trebui să fie clasificată în funcție de cuvântul cheie „ajustare index”. Articolul este legat prin diferite pagini de subiecte și, prin urmare, accesibil prin intermediul adreselor URL parametrizate:

curățarea de/index
ajustare de/index? source = company-page-a
ajustarea de/index? sursa = pagina companiei-b
ajustare de/index? sursă = companie-pagină-c
ajustarea de/index? sursa = pagina companiei-d

Întrebarea acum este: care dintre aceste cinci documente este corect și important? Pentru că, de fapt, aveți cinci articole cu conținut identic. Acum, dacă Google nu poate decide asupra unei versiuni, aparatul va alege conținut diferit. Ar fi mult mai bine dacă ai avea un document cu adevărat puternic.

Cum poți identifica „excesul”?

Deci, cum puteți reuși să identificați paginile în exces? Ei bine, cel mai bine este să faceți acest lucru în mai mulți pași.

Pasul 1: interogarea site-ului

Pentru o prezentare generală inițială, puteți efectua o interogare a site-ului în Google. Fie cu „site: domeniu”, fie cu „site: topic”. Dar aveți grijă: interogarea site-ului este doar o estimare și nu oferă o perspectivă 100% fiabilă asupra numărului real de pagini indexate.

Fig. 3: Interogarea site-ului Wikipedia germană aduce în prim plan aproximativ 4 milioane de documente indexate.

Fig. 4: Interogarea site-ului Wikipedia german pentru „Angela Merkel” returnează aproximativ 31 de documente indexate.

Fig. 5: În căutarea pe Google pentru „Angela Merkel”, Wikipedia se clasează foarte bine.

Acest exemplu este, desigur, un pic construit deocamdată, deoarece Wikipedia nu numai că se clasează bine din cauza tipului de indexare. Site-ul are, de asemenea, un bonus de încredere ridicat, printre altele. Următorul exemplu ar fi mai aproape de realitate.

Fig. 6: Conrad.de are aproximativ 421.000 de documente în index.

Fig. 7: Dintre acestea, aproximativ 258 tratează subiectul „All-in-One PC”, cu condiția ca toate titlurile să fie bine întreținute. Acestea sunt pagini de produse care se pot clasa bine pentru combinația de tip marca.

Fig. 8: Trei documente folosesc pluralul. Printre altele, aceasta este o pagină de categorie care este ideală pentru clasarea la interogări mai generale.

Pasul 2: O privire atentă asupra performanței

Mai presus de toate, trebuie să vă analizați vizibilitatea. Nu numai pentru întregul domeniu, ci și la nivel de director. Analizează adresele URL indexate la acest nivel și le compară cu adresele URL de clasare. De asemenea, puteți consulta datele despre trafic pentru a vedea ce pagini sunt vizitate în mod regulat.

Al treilea pas: Identificați „victimele” clasice

Acum este timpul să vă adânciți site-ul web. Rulați un crawl peste pagină și utilizați instrumentele SEO pentru a căuta următorii indicatori care indică refuzuri:

titluri de pagină duplicate
descrieri duplicate
titluri duble H1
Clasificarea duplicărilor sau fluctuațiilor (le puteți găsi, de exemplu, cu Serplorer sau prin intermediul propriilor exporturi din Search Console)
Există adrese URL care alternează pentru anumite clasamente? Sunt la fel în conținut?
Verificați adresele URL ale parametrilor
Verificați paginarea
Verificați filtrul (caracteristicile sunt indexate și aveți nevoie de paginile rezultate în index?)
Bloguri (pagini de etichete, pagini de arhivă, pagini de categorii și paginarea acestora)

Pasul 4: Analiza fișierului jurnal

Analiza fișierului jurnal este un subiect real al experților. În perioada anterioară Google Analytics, aceasta era metoda aleasă pentru analiza traficului. Cu timpul, însă, a devenit pur și simplu prea complex în comparație. Datorită noilor instrumente și hardware-ului puternic, acesta a revenit la tendință de ceva timp. De obicei, este de un interes deosebit să răspundeți la următoarele întrebări pentru pagini mai mari:

Ce pagini accesează cu crawlere robotul Google?
Cât de des accesează cu crawlere aceste pagini?
Toate părțile sunt importante?
Sunt „cadavre” acolo?
Botul „se pierde” (de exemplu, în paginări)?

Tratarea excesului

Dacă ați identificat acum paginile pe care doriți să le eliminați din index, apare în mod firesc întrebarea cu privire la modul în care puteți face acest lucru. În primul rând, nu ar trebui să utilizați eticheta noindex fără minte. Deoarece acest lucru elimină doar simptomul, nu problema reală.

Consolidați conținutul

Consolidarea conținutului este metoda clasică pentru editori și reviste. Prin etichetarea internă și analiza titlurilor și a titlurilor, identificați conținut similar și foarte asemănător și le reuniți - de exemplu pe o pagină de prezentare generală. În cel mai bun caz, profitați de ocazie și revizuiți din nou conținutul direct.

Cum puteți face acest lucru este ilustrat de următorul exemplu:

Fig. 9: Gutefrage.net oferă aproape 50.000 de documente despre subiectul „Sunt însărcinată”.

Fig. 10: Există doar aproximativ 1390 de rezultate pe același subiect la Erdbeerlounge.de.

Fig. 11: În SERP-uri, Erdbeerlounge marchează semnificativ mai bine cu pagina subiectului decât Gutefrage.net.

Fig. 12: În comparație, salonul cu căpșuni este mult mai stabil.

Cu toate acestea, atunci când vă consolidați conținutul, nu trebuie să uitați niciodată cele patru puncte SEO centrale:

Redirecționați adresele URL originale către rezumat (redirecționare 301)
Personalizați linkurile interne
reglați legăturile externe
Curățați sitemap-urile (adrese URL redirecționate, adrese URL noi)

Canonizează conținutul

Cu toate acestea, uneori nu vă va duce nicăieri să vă consolidați conținutul. Și atunci când aveți o mulțime de duplicate 1: 1 pe site-ul dvs. Atunci (și numai atunci) merită canonizat conținutul. Acest lucru este valabil mai ales la indexarea alternativelor de conținut, cum ar fi versiunile tipărite, versiunile mobile sau PDF-urile.

Asta ar arăta astfel:

Noi avem
1. https://www.beispielseite.de/original-dokument
2. https://www.beispielseite.de/original-dokument-print-version
3. https://www.beispielseite.de/original-dokument-kurzversion
4. https://mobil.beispielseite.de/original-dokument-mobilversion
Canonizare în codul sursă al documentelor HTML:

Noi avem:
1. https://www.beispielseite.de/original-dokument
2. https://www.beispielseite.de/original-dokument-pdf-version.pdf
Canonizare prin antet:
1. când accesați https://www.beispielseite.de/original-dokument-pdf-version.pdf:

HTTP/1.1 200 OK
Data: joi, 26 octombrie 2017 10:44:59 GMT
Legătură:; rel = "canonical"
X-SP-TE: 6151
X-Robots-Tag: index, follow, noarchive, noodp
Content-Type: text/html; charset = UTF-8

Excludeți conținutul de la accesarea cu crawlere și indexare

Pentru a exclude pur și simplu conținutul dorit de la accesarea cu crawlere și indexare, puteți lucra cu robots.txt:

Din păcate, acest lucru nu rezolvă problema fundamentală. Este mult mai bine să folosiți o căutare cu fațete cu model PRG. În acest fel, evitați că crawlerele pot „vedea” și accesa URL-urile solicitate. Crawlerul are apoi redată „pagina originală”, iar utilizatorii nu observă nimic din toate acestea.

Cu modelul PRG, totuși, trebuie să rețineți că depinde de soluție dacă este acceptată navigarea cu file. De asemenea, trebuie să excludeți variantele de filtrare relevante pentru SEO din PRG. Acestea sunt, de exemplu, combinații produs-culoare cu un volum mare de căutare.

Curăță radicală: conținutul dezindexării

În multe cazuri, însă, niciuna dintre aceste opțiuni nu ajută cu adevărat. De exemplu, dacă aveți conținut irelevant din trecutul îndepărtat în index, nu are rost să îl canonizați sau să îl consolidați. În ce scop ar trebui să mai funcționeze recenziile de produse învechite, paginile de profil, paginile de produse, paginile mărcilor, paginile subiectelor sau paginile autorilor?

Deci, faceți testul intern și puneți-vă trei întrebări:

Paginile gălbenuș (încă)?
Au trafic intern și extern?
Sunt căutate și găsite folosind căutarea internă?

Dacă nu răspundeți de trei ori, vă va ajuta doar codul de stare 410. Pentru a accelera această ștergere, puteți pune adresele URL corespunzătoare într-un sitemap extern. Apoi urmăriți-l până când a fost procesat complet de Google și apoi ștergeți-l din nou. Ultimul punct nu trebuie subestimat, deoarece dacă uitați să-l ștergeți, vor exista multe erori în Search Console. 410 practic nu aparțin sitemap-ului.

Și apoi?

Acum aveți o foaie de parcurs cu ajutorul căreia vă puteți îmbunătăți sau scăpa de conținutul dvs. neplăcut. Dar dieta index nu este un scop în sine! Întregul lucru vă este de puțin folos dacă nu definiți în prealabil obiective rezistente. Aceasta include

fuzionarea traficului comun al tuturor paginilor individuale pe o singură pagină,
fuzionarea clasamentelor pe o singură adresă URL,
îmbunătățirea clasamentului,
câștigând noi clasamente,
îmbunătățirea târârii și
îmbunătățirea eficienței indexului: câte pagini sunt clasate și câte sunt indexate? Nici paginile care nu se clasează de obicei nu trebuie indexate.

Pentru a vă asigura că aceste obiective sunt atinse, ar trebui, desigur, să monitorizați fișierele jurnal ulterior și să verificați dacă există modificări. De asemenea, ar trebui să urmăriți clasamentul paginilor noi sau alte pagini și să urmăriți traficul pe URL-urile respective. Și pentru a fi în siguranță, nu poate strica să verificați redirecționarea la intervale regulate.

Apoi puteți reuși să vă creșteți vizibilitatea la fel ca în exemplele următoare. Marcatorii arată data la care au fost eliminate URL-urile excedentare. Valorile de comparație din tabele vorbesc de la sine. Distrează-te copiind.

Fig. 13: 18.000 de pagini indexate în loc de peste 380.000 - și succesul se instalează.

Fig. 14: 10.000 în loc de 200.000 de pagini indexate duc la o creștere vizibilă a vizibilității.