SearchEngines.bg

Това е примерно съобщение за гост. Регистрирайте безплатен акаунт днес, за да станете потребител на SearchEngines.bg! След като влезете, ще можете да участвате в този сайт, като добавите свои собствени теми и публикации, както и да се свържете с други членове чрез вашата лична входяща кутия! Благодарим ви!

Избягване на duplicate content във вътрешни страници

bgkulinar

Меринджей
Тук ще стане въпрос не как да избегнем duplicate content на съшествуващите ни страници, а как да го избегнем, ако например сме купили стар домейн, който има индексирани страници, които при нас биха дали 404 error.

Много уебмастери слагат
Код:
ErrorDocument 403 index.php
ErrorDocument 404 index.php
което обаче създава проблема с duplicate content, тъй като редиректва всички ненамерени страници към главната. Друг метод е страниците да се насочат към специално създадени за целта 403 и 404 страници
Код:
ErrorDocument 403 /error403.html
ErrorDocument 404 /error404.html
което пак не е особено елегантно решение. Аз ползвам следното решение:
Код:
ErrorDocument 403 [url]http://www.sajta-mi.com/[/url]
ErrorDocument 404 [url]http://www.sajta-mi.com/[/url]
а именно чрез външен редирект подсказваме на търсачките, че тези страници вече не съществуват, за разлика от първите два случая.

Какво обаче правим с параметрите в УРЛ като q=, page=, id= и т.н., които упорито продължават да стоят? Решението:

От предишната статия за duplicate content на начална страница преписваме
Код:
Options +FollowSymlinks -Indexes
RewriteEngine On

RewriteCond %{HTTP_HOST} ^washiqthost.com$ [NC]
RewriteRule ^(.*)$ http://www.washiqthost.com/$1 [R=301,L]

RewriteCond %{THE_REQUEST} /index\.php\ HTTP/
RewriteRule ^index\.php$ / [R=301,L]
и по надолу поставяме следния
Код:
RewriteCond %{QUERY_STRING} ^page=.*$ [OR]
RewriteCond %{QUERY_STRING} ^q=.*$ [OR] 
RewriteCond %{QUERY_STRING} ^id=.*$ 
RewriteRule .* %{REQUEST_URI}? [R=301,L]
и си решаваме проблема с параметрите.

Един пример за страници с duplicate content заради параметрите (скоро се надявам да изчезнат).

Дерзайте млади СЕО специалисти. Тази информация на български, можете да намерите само в този форум. И ако слушкате, ще ви напиша и други полезни СЕО туиксове
 
Re: Избягване на duplicate content във вътрешни страници

Хубаво е да се знае и виждът видът на грешката. В противен случай може да имаш много главоболия в бъдеще. Аз предлагам следното решение:

Код:
ErrorDocument 400 /error.php?t=400
ErrorDocument 401 /error.php?t=401
ErrorDocument 403 /error.php?t=403
ErrorDocument 404 /error.php?t=404
ErrorDocument 500 /error.php?t=500

и после в error.php си правим една switch конструкция, която да извежда подходящо съобщение при съответната грешка.

Код:
switch($t)
{
	case 400: echo("Грешка 400: Грешна заявка!"); break;
	case 401: echo("Грешка 401: Изискват се определени права!"); break;
	case 403: echo("Грешка 403: Достъпът до страницата забранен!"); break;
	case 404: echo("Грешка 404: Страницата не съществува!"); break;
	case 500: echo("Грешка 500: Вътрешна сървърна грешка!"); break;
	default: echo("Грешка: Непозната за системата грешка!");
}
 
Re: Избягване на duplicate content във вътрешни страници

cloxy каза:
Код:
ErrorDocument 400 /error.php?t=400
ErrorDocument 401 /error.php?t=401
ErrorDocument 403 /error.php?t=403
ErrorDocument 404 /error.php?t=404
ErrorDocument 500 /error.php?t=500
Този тип код прави вътрешен редирект т.е. ботът не разбира, че се зарежда друга страница и всички грешки от един тип ще водят към една и съща страница но с различен УРЛ.

В случая идеята ми е за сайт с вече регистрирани страници, които физически ги няма на нашия сървър.
 
Re: Избягване на duplicate content във вътрешни страници

Тоест искаш да изсипеш рангът на всички вече изчезнали от сайта страници на главната му страница. Признавам, че от гледна точка на това твоят начин е по-добър :icon_thum
 
Re: Избягване на duplicate content във вътрешни страници

Спред мен Google не би проявил никакъв интерес и не би индексирал контента на страница която връща статус "404 Not found", та камо ли да получи или предаде на други страници ранк. Търсачката ще я прерови само за линкове към други страници. Още по-грешно е несъществуващите страници да връщат статус "200 Ok", Google веднага ще се усети че при заявка към случайно URL никога не получава "404 Not found" от сървъра. Има тарикати които правят много елегантни сайтове с статични URL-та, но вместо Mod_Rewrite те прихващат заявката посредством "ErrorDocument 404" !!! В браузера се виждат нормално хиляди нормални страници, но Google не индексира нито една и не им дава ранк, защото всичките връщат статус 404 :)
 
Re: Избягване на duplicate content във вътрешни страници

Сгреших наистина, няма как страница, която връща 404 да се индексира или пък рангът й да се прехвърли автоматично. Преди можеше със статус 200, но Google отдавна го имат предвид и тестват сайта преди това.
 
Re: Избягване на duplicate content във вътрешни страници

Значи когато една страница не съществува вече тя връща в нормалния случай 404, ако се редикректне чрез вътрешен редирект (ErrorDocument 404 /error.php?t=404) тогава УРЛ ще се запази и страницата ще върне 200, а съдържанието й ще бъде същото като на страница error.php?t=404.

С моя случай на външен редирект (ErrorDocument 404 http://www.sajta-mi.com/) страницата ще върне 301, а не 404 и ще укаже на спайдера че е преместена за постоянно. T.e. ако дадена страница е имала някакъв ПР и в последствие е изчезнала по някаква причина, с този метод тя ще прехвърли ПР на приемника.

Ето и един добър тул за чекване на хедъри.
 
Re: Избягване на duplicate content във вътрешни страници

И в двата случая сайта ти никога няма да върне 404, което веднага ще бъде възприето от Google като измама, а в първия случай ако ползваш вътрешен редирект който да връща 200 всички липсващи страници ще имат еднакво съдържание като на error.php?t=404 и тогава ще имаш много много duplicate content от което нямаш никъква полза и по-добре наистина да върнеш 404. Аз лично предпочитам винаги да връщам 404 на всички страници които са празни, изпразнени, ако трябва да покажа страница #88 след като вече имам само 77, изтрити елементи ... и т.н.
 
Re: Избягване на duplicate content във вътрешни страници

Код:
ErrorDocument 404 [url]http://www.sajta-mi.com/[/url]

Това чудо ми връща статус 200 според Google и не ще да ми признае валидацията за Google Webmaster Tools чрез файл.
 
Re: Избягване на duplicate content във вътрешни страници

cloxy каза:
Код:
ErrorDocument 404 [url]http://www.sajta-mi.com/[/url]

Това чудо ми връща статус 200 според Google и не ще да ми признае валидацията за Google Webmaster Tools чрез файл.
Връща 200, защото това връща началната ти страница. Ползвай тула от предния пост за да видиш действително какъв код връща страницата с грешките. А за валидацията ползвай мета таговете, минава безпроблемно.

zeroder, не знам какво те кара да мислиш, че Гугъл приема като измама пренасочване от дадена страница към друга за измама. Просто му указавам че дадената страница е преместена и толкова. По този начин се освободих от доста несъществуващи страници. Виж линка в първия пост.

Пък и редовия юзър веднага затваря стрницата щом попадне на 404 такава. Аз обаче нямам интерес да изпускам който и да е юзър.

Но всеки си знае. Моят съвет за начинаещите е този и заставам зад него. Хубаво е, когато има различни мнения, това дава на хората избор.
 
Re: Избягване на duplicate content във вътрешни страници

Не става въпрос за пренасочване на страници които са изтрити, а за пренасочване на абсолютно всичко което е в URL-то.
http://www.sajta-mi.com/kakvoto-i-da-e/u4j8p4i9y8s7h6-4t5et745n3.html ще пренасочи към заглавната със статус 200, което за Google означава че някой се е престарал с оптимизацията и скоро ще последва песимизация. Защо Webmaster tools писва когато сървъра не връща 404 ? Това че Google не винаги откриват всички такива сайтове мен не ме успокоява. А страниците които връщат статус 404 не е задължително да имат големи червени удивителни и надпис "404 Not found", те може да си имат нормална навигация и просто казват на Google че тук вече няма нищо интересно за индексиране, по този начин не се изпускат юзери.

А моят съвет е никога да не се ползва ErrorDocument, VIVA LA MOD_REWRITE !!! :friday:
 
Re: Избягване на duplicate content във вътрешни страници

zeroder каза:
Не става въпрос за пренасочване на страници които са изтрити, а за пренасочване на абсолютно всичко което е в URL-то.
http://www.sajta-mi.com/kakvoto-i-da-e/u4j8p4i9y8s7h6-4t5et745n3.html ще пренасочи към заглавната със статус 200, което за Google означава че някой се е престарал с оптимизацията и скоро ще последва песимизация.
Ти ли не четеш, или не разбираш, или двете заедно. Точно вътрешният редирект при грешка 404 съм го споменал като проблем и затова препоръчвам външен редирект.

Не започвай първите си постове във форума като показваш, че "чукча писатель. чукча не читатель". Прави лошо впечатление.
 
Re: Избягване на duplicate content във вътрешни страници

Извинявай ;) разбрах те много добре. Исках да кажа само че не трябва да редиректваш всичко, а само тези файлове които искаш, ако се наложи даже и един по един.

RewriteRule mising_dir_1\/(.*)\.html$ http://www.sajta-mi.com [R=301,L]
RewriteRule mising_dir_2\/(.*)\.html$ http://www.sajta-mi.com [R=301,L]
...
RewriteRule mising_file_1\.html$ http://www.sajta-mi.com [R=301,L]
RewriteRule mising_file_2\.html$ http://www.sajta-mi.com [R=301,L]
RewriteRule mising_file_3\.html$ http://www.sajta-mi.com [R=301,L]
RewriteRule mising_file_4\.html$ http://www.sajta-mi.com [R=301,L]
...
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.+)$ /404.php
 
Re: Избягване на duplicate content във вътрешни страници

Аз чак сега схванах разликата между външен и вътрешен редирект :icon16:. Добре че съм в раздел "начинаещи" :)

Горките начинаещи, много ги объркахме ::)
 
Re: Избягване на duplicate content във вътрешни страници

cloxy каза:
Аз чак сега схванах разликата между външен и вътрешен редирект :icon16:. Добре че съм в раздел "начинаещи" :)

Горките начинаещи, много ги объркахме ::)
Аз от самото прочитане на статията , до момента не разбрах каквото и да било от нея ;) Освен че е по добре да се ползва външен редирект ;) За сега нямам индексирани несъществуващи страници , което е добре , дано да не ми се налага да ползвам това ;)
 
Re: Избягване на duplicate content във вътрешни страници

Като купиш стар домейн с 18к индексирани ненужни страници, ще ти се наложи да полваш този трик.
 
Re: Избягване на duplicate content във вътрешни страници

Дори и 18к имената на страниците най-вероятно отговарят на някакъв шаблон за да бъдат прехванати, най-малкото поне имат файлови разширения и/или параметри. А лично за мен употребата на ErrorDocument не е нито трик, нито решение, а лесен и ужасно груб дърводелски метод, който не е редно да се обсъжда във форуми за SEO през 2007 г.
 
Re: Избягване на duplicate content във вътрешни страници

Честно не мога да разбера какъв ти е проблемът? ErrorDocument чрез външен редирект връща 301. Не знам по какъв друг начин да ти го обясня?

Пишете си домашните, преди да пишете глупости по форумите!!!
 
един въпрос от един съвсем начинаещ

един въпрос от един съвсем начинаещ

Здравейте,

ше има паднали от смях от моя постинг, но какво да правя.
Следната история. Направих един сайт с готова CMS преди около два месеца. Не съм програмист и си нямам идея от програмните езици с които работи сайта.Имам предвтава само от HTML. Сайта бе качен онлайн и едно от първите неща които направих е да го регистриам в google. Всичко наред, докато някой не ми каза, линковете ти изгелжва зле.Стандартните линкове на CMS системата изглеждаха от типа на item21id43 и аз си намерих add-on, който да ги оправи.
 
Последно редактирано:

Горе