Eliminați înregistrările duplicate din oraș. Duplicați paginile Joomla - Cum să scăpați de

Bună ziua tuturor, dacă citiți acest articol, înseamnă că, la fel ca mulți dezvoltatori web novici, aveți o întrebare complet legitimă - cum să gestionați paginile duplicate în Joomla.

În acest articol voi încerca să răspund la această întrebare. Pentru început, să vorbim despre ceea ce amenință apariția paginilor duplicate pe site, apoi vom analiza soluțiile gata făcute pentru gestionarea duplicatelor și în cele din urmă vom analiza alternativele modalități de a face față paginilor duplicate.

De ce să scapi de paginile duplicate?

Nu este un secret faptul că Joomla, ca orice alt sistem de gestionare a conținutului, creează în cursul activității sale pagini identice disponibile la diferite adrese de site - duplicate. Pentru vizitatorii site-ului dvs., chiar aceste pagini sunt inofensive, poate că nici măcar nu știu despre existența lor.

Cu toate acestea, duplicatele, inofensive pentru vizitatori, pot afecta semnificativ poziția site-ului în rezultatele căutării. De ce se întâmplă?

Să ne imaginăm o situație - ați scris mai multe materiale unice și le-ați publicat pe site-ul dvs. web. Roboții de căutare i-au indexat, totul este în regulă, dar după un timp robotul de căutare găsește duplicate ale acestor pagini. Robotul de căutare nu înțelege că aceasta este o dublă, pentru el acestea sunt două pagini complet diferite, ca urmare, materialul inițial unic nu mai este.

Ca urmare a apariției pe site a unui număr mare de pagini identice (duplicate), poziția site-ului în rezultatele căutării se poate „scufunda” foarte mult. De aceea merită să scăpați de paginile duplicate cât mai curând posibil.

De ce apar duplicatele?

Duplicatele din CMS Joomla apar ca urmare a instalării unor extensii suplimentare. Dar acesta este departe de a fi singurul motiv pentru formarea lor.

Un motiv la fel de comun pentru formarea de pagini duplicat este structura prost gândită a site-ului. Cum poate fi legat acest lucru, întrebați? Este foarte simplu - ați creat mai multe categorii pe site care au o categorie părinte și ați plasat materiale în aceste categorii. În interiorul materialelor, creați linkuri către materiale create anterior și așa mai departe. Aruncați o privire la captura de ecran pentru un exemplu:

Dacă nu creați un meniu pentru categorii, atunci adresa paginii poate arăta astfel:

Http: //joom4all..php? Option = com_content & view = article & id = 38 & catid = 10

Adresa este departe de a fi perfectă și vrei să scapi de numerele din bara de adrese. Pentru a face acest lucru, creați elemente de meniu pentru categorii și materiale. După aceea, adresa sa dovedit a fi mai atractivă:

Http: // site / sites-creation / basics / intro

Și totul ar fi bine, dar vechile adrese ale paginii nu au plecat nicăieri, au rămas ca duplicate. Ca urmare, aceeași pagină poate avea mai multe adrese simultan:

Http: // site / 32-sites-creation / 10-basics / 38-intro http: // site / 32-sites-creation / basics / intro http: //joom4all..php? Option = com_content & view = article & id = 38 & catid = 10

Nu este o situație plăcută, în plus, roboții de căutare consideră că toate aceste pagini sunt complet diferite.

Modalități de a face față paginilor duplicate

Desigur, cel mai bine este să evitați apariția paginilor duplicate în etapa inițială - să vă gândiți în prealabil la structura site-ului, să creați categoriile și elementele de meniu necesare. Dar, după cum arată practica, nu toată lumea face acest lucru și, în timp, apare întrebarea despre cum să eliminați duplicatele din rezultatele căutării.

Există mai multe opțiuni pentru gestionarea duplicatelor:

  • Folosind extensii personalizate
  • Fișier Robots.txt
  • Redirecționați 301 în fișierul htaccess
  • Utilizați panoul webmasterului pentru a elimina adresele inutile
  • Componenta de redirecționare

Plugin JL No Doubles pentru a face față duplicatelor de pagină

Cel mai ușor și în același timp suficient un mod eficient de a face față paginilor duplicate folosește extensii. O astfel de extensie este Plugin JL No Doubles.

Pluginul este foarte ușor și nu are nevoie de setări speciale. Tot ce trebuie să faceți este să descărcați acest plugin, să îl instalați și să îl activați. Restul lucrării îl va face singur.

Pluginul JL No Doubles elimină paginile duplicate din mai mult de douăzeci de componente, inclusiv componenta com_content. Puteți personaliza ieșirea unei erori 404 sau a unei redirecționări 301 către pagina corectă de pe site. Pagina de setări a pluginului arată astfel:

Există doar cinci parametri pentru configurarea pluginului:

  • Cheie de licență- pentru a activa plug-in-ul cu componentele k2, Virtuemart, Zoo.
  • Multiplicitatea limitelor- setare pentru categorii de materiale Joomla. Puteți configura o redirecționare atunci când generați linkuri precum / avansat? Start = 3. Tot ce trebuie făcut este să indicați numărul de materiale afișate în categorie.
  • Folosiți 301 redirecționări- puteți activa posibilitatea de a utiliza o redirecționare către pagina corectă sau (dacă este setat la „nu”), genera o eroare 404. Dacă site-ul dvs. există de mult timp și alte site-uri fac link către paginile sale, atunci vă recomand să setați o redirecționare pentru a nu pierde din greutatea paginii.
  • Alias- o setare care înlocuiește un alias pentru linkurile din componenta formularului / conținut / articol (acasă în mod implicit).
  • Oprește cuvintele- acestea sunt liniile găsite în adresa paginii care nu ar trebui procesate.

Cu setările de bază sortate, acum să mergem la fila „Componente”:

În această filă, selectați componentele care sunt utilizate pe site și care sunt disponibile pentru indexare. Componenta com_content este deja selectată în mod implicit. Nu trebuie să selectați toate componentele posibile, mai ales dacă nu le utilizați, acest lucru va crea încărcări inutile pe site-ul dvs.

Utilizarea fișierului Robots.txt

Pe cât de grozav este pluginul de redirecționare a paginii, nu puteți scăpa de toate duplicatele. În acest caz, puteți împiedica roboții de căutare să indexeze anumite pagini ale site-ului, cu alte cuvinte, să închidă accesul la acestea.

Am vorbit deja despre toate complexitățile configurării fișierului Robots.txt în acest articol. Voi spune doar pe scurt că există o directivă pentru a închide o parte a robotului dvs. din „ochii” robotului Nu permiteți .

301 redirecționare și fișier htaccess

Un alt mod obișnuit de a face față duplicatelor este să configurați o redirecționare, cu alte cuvinte o redirecționare 301 către pagina corectă. Acest lucru se poate face în fișierul „ .htaccess ».

Pentru a crea o redirecționare, trebuie să utilizați directiva RewriteRule, dar trebuie să vă asigurați că modulul mod_rewrite este activat pe hosting.

Php pe pagina site-ului, pentru aceasta în fișierul „.htaccess” după directiva RewriteEngine On, scrieți următoarea linie:

RewriteRule http: // site / index.php $ http: // site

Am discutat lucrarea cu fișierul „.htaccess” mai detaliat în acest articol.

Componenta de redirecționare

Componentă destul de utilă și în același timp încorporată în Joomla 3, care vă permite să configurați manual redirecționarea paginii. Această componentă folosește un plugin special pentru munca sa, care este dezactivat în mod implicit.

Inițial, trebuie să activați pluginul, deoarece nu trebuie să îl căutați printre altele, deoarece după ce accesați pagina „Componente” -> „Redirecționare”, veți primi un mesaj că trebuie să activați pluginul și un link pentru activare.

După ce pluginul este activat, puteți crea o redirecționare specificând adresele paginii de început (vechi) și de sfârșit (noi):

Această metodă este bună atunci când nu există prea multe pagini duplicate.

Să rezumăm

În concluzie, vreau să spun că, deși Joomla este renumit pentru crearea de pagini duplicate, există multe modalități de a scăpa de ele. Care dintre modalități este cel mai bun pe care îl poți decide pentru tine, dar pot spune că va fi de preferat o abordare integrată pentru rezolvarea acestei probleme. Și merită să începeți cu abordarea corectă a creării unei structuri de site-uri.

În plus, merită să ne gândim cum să scăpăm de index.php în bara de adrese a site-ului, acest lucru va ajuta și la reducerea numărului de pagini duplicat.

Am vorbit despre motivele pentru care apar și cum să le găsim. În acest articol vă voi spune cum puteți elimina duplicatele sau pentru a le împiedica să apară în rezultatele căutării.

Deoarece fiecare caz este diferit, vom lua în considerare cele mai populare metode, care funcționează perfect în 99% din cazuri. Puteți alege un singur lucru pentru dvs. sau îl puteți folosi într-un complex.

Deși toate aceste metode sunt aplicabile oricărui alt sistem CMS, mă voi baza pe caracteristicile Joomla în detaliu.

Toate aceste exemple sunt valabile dacă ați activat redirecționarea standard SEF și URL în setările globale J.

  • 1. Plugin pentru Joomla

Primul lucru pe care îl puteți face dacă aveți confuzie în adresele URL (când sunt generate linkuri atât din aliasul de categorie, cât și din elementul de meniu) este să instalați pluginul Shnodoubles din sherza.

Un plugin excelent care își face treaba 100%. După instalare, link-ul format incorect (din aliasul categoriei) va fi redirecționat către cel corect (din elementul de meniu). Puteți descărca acest minunat plugin care elimină duplicatele pentru Joomla 2.5 (link direct!)

După activarea pluginului, unele capturi vor fi pur și simplu lipite între ele.

  • 2. Robots.txt pentru Joomla

Acest fișier vine în distribuția standard Joomla, este localizat la rădăcină și este disponibil la site.ru/robots.txt. Scopul principal este de a da instrucțiuni pentru a căuta roboți pentru a indexa site-ul. Cu ajutorul acestuia, puteți închide unele secțiuni (aveți nevoie) ale site-ului, sunt acceptate și expresii regulate - puteți închide pagini individuale prin mască.

Cel mai adesea, folosesc această afirmație (în plus față de ceea ce intră în fișier în mod implicit):

Doar o singură linie îndepărtează mult gunoi. Poate fi:

  • paginile pentru materiale de tipărire, conțin în URL și print = sau tmpl = componentă
  • linkuri către fluxul RSS
  • paginile cu rezultatele căutării pe site
  • va închide, de asemenea, paginile de paginare
  • pot exista și alte opțiuni, în funcție de extensiile utilizate

Depinde de dvs. să utilizați această linie sau să interziceți fiecare tip de pagină separat, dar rețineți că un robot prea mare este considerat complet permisiv. De asemenea, merită să vă asigurați că această linie nu acoperă ceva important, de exemplu, un sitemap - în acest caz, puteți scrie: Permiteți: / path_to_map

Puteți citi mai multe despre utilizarea robots.txt în ajutorul Yandex - help.yandex.ru/webmaster/?id=996567

  • 3. Atribut rel = etichetă "canonică"

Utilizarea acestui atribut îl va ajuta pe robot să determine ce pagini ar trebui incluse în index și care nu. Dacă există pagini foarte similare pe site (duplicate neclare), diferă doar, de exemplu, în opțiunile de sortare - de la început sunt noi sau sortează în ordine crescătoare, sau se afișează cu 20-30 etc., atunci puteți folosiți acest atribut. În acest caz, va trebui să selectați o pagină canonică, care va fi clasată, adăugați rel = "canonical" la restul cu indicația paginii selectate - astfel de documente nu vor fi incluse în rezultatele căutării, robotul va ști că nu trebuie incluse în index.

Pentru detalii despre cum să implementați rel = "canonical" în Joomla 1.7 / 2.5, consultați

  • 4.301 redirecționare

Este adecvat să utilizați dacă ați schimbat adresele paginii, dar documentele există încă, adică nu le-ați șters. În acest caz, se recomandă utilizarea unei redirecționări 301 în .htaccess pentru o lipire adecvată - motoarele de căutare vor ști că documentul s-a mutat la o nouă adresă. Această metodă vă permite să salvați indicatorii site-ului - Tit și PR.

301 redirecționări pot fi, de asemenea, utilizate pentru a îmbina duplicatele. De exemplu, duplicatele binecunoscute ale paginii principale a unui site Joomla sunt /index.php și aliasul elementului de meniu Acasă, de exemplu, / home sau / homepage

Este destul de ușor să le lipiți împreună, să deschideți .htaccess și să intrați

Redirecționează 301 /index.php http://site.ru/

Sau puteți face o redirecționare 301 către php în fișierul index al șablonului

if ($ _ SERVER ["REQUEST_URI"] == "/index.php") (
antet („Locație: /”, TRUE, 301);
Ieșire ();
}
?>

Și vă voi oferi o redirecționare clasică de la www la nr www

RewriteEngine On
RewriteCond% (HTTP_HOST) ^ www.example.ru $
RewriteRule ^ (. *) $ Http://example.ru/$1

* example.ru înlocuiți cu numele de domeniu.

  • 5. Etichetă meta-roboți

O altă modalitate de a preveni duplicarea indexării în Joomla este folosirea metaetichetei:

În prezent, această metodă este mai eficientă pentru Google decât interzicerea instrucțiunilor din fișierul robots.txt. De exemplu, pentru a închide pagina de imprimare de la indexare și duplicare la? Tmpl = component, puteți deschide fișierul component.php din rădăcina șablonului dvs. și puteți adăuga această etichetă la .

Pentru a închide paginile cu rezultatele căutării de pe site folosind com_search standard, puteți adăuga o condiție la șablonul index.php



Dar mai întâi trebuie să definiți variabila

$ option = JRequest :: getVar ("opțiune", nul);

Nu voi intra adânc în condițiile din șabloane, articolul nu este despre asta, sper că principiul este clar.

  • 6. Scoaterea adresei URL din panou

O altă modalitate rapidă este de a o șterge manual din panoul webmasterului.

Pentru Yandex, trebuie să accesați adresa - webmaster.yandex.ru/delurl.xml

Există încă o metodă nu foarte populară pentru eliminarea duplicatului Joomla din SERP, dar o vom lua în considerare și.

  • 7. Anteturi X-Robots-Tag

Un titlu destul de rar, este folosit mai des de optimizatori străini, funcționează pentru Google. Din păcate, Yandex nu a comentat încă suportul pentru acest antet http.

HTTP / 1.1 200 OK
Data: marți, 25 mai 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...

După cum puteți vedea, există multe modalități de a elimina conținutul duplicat Joomla, ar trebui cel puțin să înțelegeți cum funcționează fiecare dintre ele pentru a alege cea mai potrivită opțiune și a vă aplica situației dvs.

În acest articol, vreau să vorbesc despre paginile duplicate în Joomla. S-au scris o mulțime de articole pe această temă, dar mi se pare că merită să rezolv și punctul meu de vedere asupra acestei probleme. În acest articol voi vorbi despre Joomla 3, deși aproape toate sfaturile sunt valabile și pentru Joomla 2.5.

Problema paginilor duplicate în Joomla merge adânc în rădăcinile formării CMS în sine, pentru a fi precis, nici măcar în Joomla însăși, ci progenitorul CMS Mambo. Faptul este că atunci nu s-au gândit la CNC-uri (URL-uri citibile de om) și atunci când problema a devenit urgentă și a apărut Joomla 1.5, în loc să refacem radical sistemul de legături, s-a făcut o blotch, cu care avem de-a face acum. Da, în acel moment, părea o soluție la problemă, dar, după cum putem vedea, o jumătate de măsură a devenit o problemă globală.

Din fericire, dezvoltatorii Joomla înțeleg că există o problemă, dar nu vor să ia măsuri drastice, care de altfel au fost propuse de comunitate. A existat chiar o strângere de fond de succes pentru un nou router Joomla, dar schimbările abia se infiltrează în distribuția principală Joomla.

Deci, ce face cu adevărat Joomla pentru a evita duplicatele?

Au urmat din nou calea jumătăților de măsură, au introdus eticheta canonică, care este concepută pentru a indica o pagină reală Joomla. Nu vom vorbi despre calea spinoasă a implementării, voi observa doar că a fost cu adevărat spinoasă. Și voi spune că această metodă vă permite într-adevăr să reduceți numărul de duplicate de pe site, dar problema este că această metodă aproape că nu funcționează pentru componentele Joomla, deoarece dezvoltatorii de componente trebuie să aibă grijă de implementarea suportului, asistență corectă și acest lucru nu se întâmplă întotdeauna. Și, pentru a fi sincer, eticheta canonică în sine nu este un panaceu.

Vă voi povesti despre această metodă simplă și eficientă mai jos.

De fapt, această metodă vă va ajuta să reduceți semnificativ numărul de preluări. În practica mea, mi-a permis să reduc cu 10 factor.

De ce avem nevoie pentru asta?

  • Un pic de timp și mâini

Primul lucru pe care ni-l spune Google este să eliminăm domeniul duplicat.

Cum să o facă?

Faceți o redirecționare de la domeniul www către un domeniu fără www. Adică, mergem la site-ul www.site.ru și suntem redirecționați către site-ul site.ru.

În fișierul .htaccess adăugați următoarea regulă.

RewriteCond% (HTTP_HOST) ^ www \ .site \ .ru $ RewriteRule ^ (. *) $ Http://site.ru/$1

Site.ru va fi înlocuit cu domeniul dvs.

Acum să trecem la plăcut.

Instalați pluginul JL No Doubles și activați-l în managerul de pluginuri. Dacă aveți doar conținut standard Joomla, atunci nu trebuie să configurați nimic. De fapt, această serie de acțiuni care nu sunt complicate vă vor ajuta să reduceți radical numărul de duplicate de pe site.

Crearea și promovarea site-urilor pe html static este din ce în ce mai puțin populară, iar majoritatea webmasterilor trec la CMS modern, în special la Joomla, care, pe lângă plusurile sale, poate supăra utilizatorul, în primul rând, prin duplicarea paginilor. Paginile duplicate în Joomla sunt un fel de flagel al webmasterului, deși, cu sinceritate, multe sisteme de automatizare a site-ului păcătuiesc acest lucru.

Căutați duplicate

În primul rând, să vedem cum să determinăm pagini duplicatși de ce afectează negativ procesul de promovare a site-ului web. Cel mai simplu mod de a determina duplicarea este să folosiți căutarea avansată pe Yandex, unde plasăm proiectul în linia „site” și în linia de căutare, această sau acea interogare. Ca urmare, puteți vedea paginile site-ului în funcție de relevanța lor și există, de asemenea, pagini care se duplică reciproc. Este chiar mai ușor să folosiți Netpeak Spider, care va descărca pagini și va găsi duplicate într-un singur clic.

A doua întrebare importantă este de ce motoarele de căutare tratează acest lucru negativ, deoarece aceasta nu este o încercare deliberată de a înșela motoarele de căutare, ci probleme tehnice ale CMS, de care, în principiu, roboții ar trebui să fie conștienți. Faptul este că roboții pot identifica astfel de pagini ca spam intenționat, deoarece, de fapt, același material este furnizat la două adrese diferite. Încercările de a coresponda cu echipa de asistență Yandex nu duc la nimic, așa că ar trebui să încercați să evitați duplicarea paginilor Joomla.

Eliminați duplicatele

Nu permiteți: / search /

Nu permiteți: /*.pdf

Nu permiteți: / * print = 1

Nu permiteți: / * tip = atom

Nu permiteți: / * tip = rss

Nu permiteți: / * task = rss

Nu permiteți: / *? Sl *

Nu permiteți: / *? Sl *

Astfel, baza principală a depozitului este întreruptă, unde Joomla poate împinge duplicatele. Dacă cineva trebuie să deschidă cu adevărat unele pagini, de exemplu, pentru componenta xmap, adică pentru a adăuga un sitemap în panoul webmasterului, atunci paginile necesare pot fi deschise cu ușurință folosind directiva Permite: care este plasată înainte de Disallow :.

Cu toate acestea, personal, nu mi s-a dat viața unor pagini duplicate de Joomla, cum ar fi

Și căutările lungi nu au dus la nimic pozitiv, cu excepția închiderii manuală a sutelor de link-uri din stânga în robots.txt. Cu toate acestea, într-o zi răspunsul a venit ca o inspirație și mi-a deschis ochii la cele mai simple lucruri pe care, știu sigur, nu am fost singurul care s-a confruntat. Mulți oameni practică astăzi (și o fac corect) promovarea site-ului web pe rețelele sociale prin instalarea butoanelor pentru integrare. În același timp, nu toată lumea acordă atenție faptului că unele pluginuri, atunci când se integrează în Twitter, pur și simplu întrerup legătura și pentru a rezolva problema, trebuie să configurați sau să înlocuiți pluginul, deoarece roboții urmează link-ul „tweet”. și ajunge la vizualizarea sa decupată, pe care o intră din cauza ignoranței lor electronice față de index.

Problema s-a dovedit a fi la fel de simplă ca un bazin de cupru, este păcat că doar o parte din prelevări este eliminată în acest fel, deși această parte din mine mă îngrijora mai ales. Se pare că unele dintre erorile de optimizare apar încă din cauza unei combinații a supravegherii webmasterului și a defectelor CMS, deci acest lucru poate și ar trebui tratat. Noroc.

Dacă nu sunteți mulțumit de duplicate precum /sobstven-sate/eksperiment-seo/383.html, adică adresele de pagină prescurtate, utilizați pluginul pentru Joomla Shnodoubles, pe care îl puteți găsi prin Google sau dezabonându-mă în comentarii, cu am rezolvat complet problema în câteva minute. După ce m-am gândit și m-am săturat să vă dezabonați, vă sugerez să descărcați noduluri pentru Joomla direct de pe site.

De asemenea, ofer un videoclip despre eliminarea duplicatelor în Joomla folosind o redirecționare 301 -

Intrebari si raspunsuri

Este posibil să scăpați de duplicatele de pe mașină?

Absența duplicatelor este garantată cu 90% în modul automat. Pentru Joomla, este suficient să configurați roboți și htaccess, precum și să vă ocupați de lipirea paginilor de navigarea principală. Cu toate acestea, în procesul de extindere a site-ului, pot apărea duplicate, așa că urmăriți-le prin Netpeak Spider.

Într-adevăr, păianjenii PS nu înțeleg că duplicatele de pe Joomla sunt o greșeală a dezvoltatorilor?

De ce această eroare nu este corectată de proprietar? Dacă cumperi o mașină cu un defect, atunci nu te vei plânge că ești amendat de poliția rutieră pentru faptul că farurile nu se aprind sau gazele de eșapament nu respectă standardele? Nu are rost să contactați asistența, deoarece CMS nu este plătit.

În zilele noastre rareori penalizează duplicatele, dar ... Dacă la cerere, de exemplu, pagini duplicate aveți în căutare 3-4 documente cu același conținut, dar adrese URL diferite, atunci credeți că greutatea statică va fi maximă pe fiecare dintre ele, sau pete? În cele din urmă, depinde de dvs. să decideți dacă aveți nevoie de un site de gunoi decorativ sau dacă doriți să partajați informații cu utilizatorii și să obțineți un profit pentru aceasta cu configurarea CMS corectă.