SearchEngines.bg

Това е примерно съобщение за гост. Регистрирайте безплатен акаунт днес, за да станете потребител на SearchEngines.bg! След като влезете, ще можете да участвате в този сайт, като добавите свои собствени теми и публикации, както и да се свържете с други членове чрез вашата лична входяща кутия! Благодарим ви!

Премахване на остарели линкове

Replace

New member
Здравейте, скоро си правих редизайн на сайта, като промених и съответно структурата на URL адресите. Проблема е, че google crawler-а все още индексира старите линковете, и в webmaster tools постоянно имам грешки при обхождането на бота. Вариант с Redirect, не ми върши работа - тъй като линковете вече нямат нищо общо (пример: index.php?category=1 не води до /category/1/name).
Какво мога да направя, за да оправя ситуацията, или мога ли да подам за премахване на съдържанието базирано на wildcard ( domain.com/index.php?* ) ?
Благодаря предварително!
 
Здравейте, скоро си правих редизайн на сайта, като промених и съответно структурата на URL адресите. Проблема е, че google crawler-а все още индексира старите линковете, и в webmaster tools постоянно имам грешки при обхождането на бота. Вариант с Redirect, не ми върши работа - тъй като линковете вече нямат нищо общо (пример: index.php?category=1 не води до /category/1/name).
Какво мога да направя, за да оправя ситуацията, или мога ли да подам за премахване на съдържанието базирано на wildcard ( domain.com/index.php?* ) ?
Благодаря предварително!

Последното е най-добрия вариант, но го придружи със забрана в роботс текста, защото иначе след време може да започнат отново да търсят старите линкове - случи ми се многократно, докато не ги забраних.
 
Последното е най-добрия вариант, но го придружи със забрана в роботс текста, защото иначе след време може да започнат отново да търсят старите линкове - случи ми се многократно, докато не ги забраних.

Много благодаря за отговора. Disallow-нах го в robots.txt, само да попитам трябва ли да се притеснявам от това съобщение, че повечето паяци не поддържат такъв формат? Т.е. проверих си го в robots checker-a, и той ми изкара това съобщение:

Besides the major search engines, most crawlers don't support wildcard matches and will most likely misunderstand or ignore them.

В смисъл, на мен си ми е най-важно google crawler-a да се спре, но все пак ...
 
Това е нещо ново. Аз също имам една-две звезди в забраните, но не съм виждал това съобщение. Опитай да намериш друг общ признак, който да напишеш последен. Може да е една буква, която я има във всеки адрес, достатъчно е - пример: index.php?cat или пример: index.php?category= .
 
Много благодаря, ще почакам и ще видя дали това е достатъчно. Иначе, това ми е съдържанието на robots.txt:

User-agent: *
Disallow: /index.php*

предполагам няма как да го сбъркам :idea:
 
Да, още като пуснах новата версия си (а то мина вече месец) генерирах sitemap, и го събмитнах в уеб мастър туул.
 
Аз лично не съветвам в случая да се използва robots.txt, защото това ще анулира всички връзки към вътрешни страници от сайта, които са събрани до момента. А това са огромни загуби!

Ако не може да стане с пренасочване, опитай да създадеш въпросния файл index.php и в него напиши скрипт за пренасочване на всичко старо поне към началната страница "/".

Ако и това не може да стане, направи старите адреси да връщат 410, така ще изчезнат много бързо от индекса.
 
Аз лично не съветвам в случая да се използва robots.txt, защото това ще анулира всички връзки към вътрешни страници от сайта, които са събрани до момента. А това са огромни загуби!

Ако не може да стане с пренасочване, опитай да създадеш въпросния файл index.php и в него напиши скрипт за пренасочване на всичко старо поне към началната страница "/".

Ако и това не може да стане, направи старите адреси да връщат 410, така ще изчезнат много бързо от индекса.

Мерси за отговора, сложих един index.php с 301 Moved Permanently към началната страница, засега поне нямам алерти в уеб мастър туулса, да се надяваме че ще е постоянно .:)
 

Горе