SearchEngines.bg

Това е примерно съобщение за гост. Регистрирайте безплатен акаунт днес, за да станете потребител на SearchEngines.bg! След като влезете, ще можете да участвате в този сайт, като добавите свои собствени теми и публикации, както и да се свържете с други членове чрез вашата лична входяща кутия! Благодарим ви!

Индексиране на нов сайт

Здравейте,
Скоро направих нов сайт от платформата, която предлага Гугъл. Взех му домейн.
Вътре в момента има една описана категория и две статии. Google индексира първо оригиналния адрес на Гугъл сайтове, който е на първа страница при търсене, но при отваряне излизат несъществуващи страници. Тези страници ги имаше, но са изтрити. След това със същата ключова дума вече на шеста страница излиза това, което се търси със правилния домейн, който завършва на .com. До скоро имаше проблем с прехвърлянето на домейна, ботовете не можеха да разчетат robot.txt. Вече излиза както трябва, но пък индексира и двата адреса.
Това нормално ли е ли е?
И друго, исках да сложа sitemap и да го добавя в уеб администратори, но ми дава грешка, че страницата не е намерена. Не знам дали въобще трябва да го добавям, защото платформата автоматично си генерира карта на сайта.
Това е съдържанието на robot.txt:

User-agent: *
Disallow: /feeds
Disallow: /*/_/
Sitemap: http://www.otdihbg.com:80/system/feeds/sitemap

Дали правилно съм разбрала, че има забрана за индексиране на картата на сайта?
 

diabolic.bg

The Old Wastelander
За: Индексиране на нов сайт

За: Индексиране на нов сайт

За мен проблемът не е в sitemap-а. Той се се отваря и работи нормално, макар че е малко непълен (липсва датата на публикацията, което е важно). Къде точно се намира картата в структурата на сайта и дали роботът има достъп до нея?
Драмата по-скоро може да е от този роботс текст, който на мен ми прилича на китайска азбука. Първият ред е ясен - забранява индексация на фийдовете. Добре, а какво забранява вторият? Звездата, поставена в него означава "всички", следва под-директория, която е без име и вместо него долна черта (синоним на интервал). Е не ми е ясна логиката на тази забрана и какво точно е блокирано.

Другото странно е изписването на порт 80 в линка за картата - доста нестандартен начин за създаване на адрес. Няма ли как да се премести тази карта така, че линкът да стане http:// www . otdihbg.com /sitemap.hml ?

EDIT

Току що мернах проблема - картата се намира в папката фийдове, която е забранена в роботс текста.
 
Последно редактирано:
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Пробвах да създам такъв адрес, но по никакъв начин не го приема с xml накрая.
Успях да добавя картата в уеб администратори, но взех този адрес:
http://www.otdihbg.com/system/feeds/sitemap
Сега чакам за индексиране, да видим какво съм сътворила.
Проблемът е, че като въведа например "Исторически паметници и забележителности във Видин" ми излиза категорията, а не статията с едноименното заглавие.
За послеписа - сайта е с готови инструменти и аз нищо не съм правила като папки и кодове, къде би трябвало да се намира папката, за която говориш?

Иначе при проверка за блокирани адреси, излиза че няма такива.
Това е сайта:
http://www.otdihbg.com/
 
Последно редактирано:

diabolic.bg

The Old Wastelander
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Пробвах да създам такъв адрес, но по никакъв начин не го приема с xml накрая.
Успях да добавя картата в уеб администратори, но взех този адрес:
http://www.otdihbg.com/system/feeds/sitemap
Сега чакам за индексиране, да видим какво съм сътворила.
Проблемът е, че като въведа например "Исторически паметници и забележителности във Видин" ми излиза категорията, а не статията с едноименното заглавие.
За послеписа - сайта е с готови инструменти и аз нищо не съм правила като папки и кодове, къде би трябвало да се намира папката, за която говориш?

Иначе при проверка за блокирани адреси, излиза че няма такива.
Няма никакво значение дали е с xml накрая. Това, което написах е стандартното положение, което дадох само за пример. Дори без разширението, ботът ще прочете картата, ако има достъп до нея. Това, че излиза категорията също не е обезпокоително. Много често при пускане на нова публикация при мен, в резултатите излиза първо категорията, в която се намира заглавието и едва на другия или по-следващия ден излиза прекият линк към статията.

Дори нищо друго да не правиш за момента, важното е да премахнеш от роботс текста реда Disallow: /feeds и тогава роботът ще чете картата, което ще доведе до нормална индексация. Ако платформата не ти позволява да изтриеш този ред, потърси начин да преместиш сайтмапа в коренната директория, както съм написал в предния си пост като, разбира се, трябва да промениш линка към картата на http:// www . otdihbg.com /sitemap.

Ако можеш постави линк към картата в хедъра по този начин:
Код:
<link rel="sitemap" href="http:// www . otdihbg.com /sitemap" type="xml" />

П. С. Според мен не е добре категорията и статията да имат еднакви заглавия. Трябва с нещо да се различават, за да се индексират и двете.
 
Последно редактирано:
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Махнах картата от хоризонталната навигация и сложих адреса във футъра, защото в хедъра не ми позволява.
Сега май всичко е наред!
Благодаря!
 
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Здравейте отново,
от известно време получавам съобщения, че бота на Google не може да обходи сайта, заради грешка в robot.txt.

Това е част от съобщението:
http://otdihbg.com/: Googlebot не може да осъществи достъп до сайта Ви
През последните 24 часа Googlebot се натъкна на 3 грешки при опита да извлече информацията за DNS за сайта Ви. Общият процент на грешки при заявките към DNS за него е 100.0%.

Имах проблем с трансфера на домейна и оттам идва грешката в robot.txt
В момента сайта е записан като www. otdihbg.com. Другия адрес го изтрих от
уеб администратори. В настройките съм дала да няма предпочитан домейн.
Добавих sitemap към адреса и в момента има от 18 изпратени страници, 13
индексирани.
Дали е възможно проблемът с домейните да се оправи?
И нещо друго - някои от страниците се показват при търсене с оригиналния
адрес на Гугъл сайт. След това, след две три страници се показва страницата
от www. otdihbg.com

Последната статия я качих на 13.04 и все още не излиза при търсене. Предишните излязоха в рамките на 24 часа.
 

diabolic.bg

The Old Wastelander
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Поставете в .htaccess файла, ако имате такъв, следния код:
Код:
RewriteEngine On
RewriteCond %{HTTP_HOST}  ^otdihbg.com [NC]
RewriteRule ^(.*)  http://www.otdihbg.com/$1 [L,R=301]
Той ще пренасочи всички търсения от стария към новия адрес.
 

diabolic.bg

The Old Wastelander
За: Индексиране на нов сайт

За: Индексиране на нов сайт

По подразбиране трябва да е в коренната директория на сайта. Обърни внимание, че това не е разширение, независимо, че пред него има точка. Това точното има на файла. Ако не съществува, ще трябва да провериш дали сървърът е Апачи и ако е, тогава може да си направиш нужния файл.
 
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Единствения вариант е да коригирам файла през хоста, но от host.bg казаха, че не е нужно да се слага този файл. В общи линии, според тях всичко е направено. Наистина вече при търсене излиза добре. Но има друг проблем.
Получи се дублирано съдържание. Явно избързах с картата и пинга на новия адрес. Две от статиите бяха индексирани със стария адрес, а категориите с новия. Сега последната статия излиза с новия адрес, а категорията в която е сложена със стария. Иначе направих всичко необходимо за трансфера на домейна, но явно Гугъл вече е индексирал неправилно сайта. Мога ли да направя нещо, за да се оправи дублираното съдържание и страниците да си излизат само с новия домейн?
Може да видите пример с последната статия:
untitled_1.jpg
untitled_2.jpg
 

diabolic.bg

The Old Wastelander
За: Индексиране на нов сайт

За: Индексиране на нов сайт

Редирект 301 от стария към новия адрес ще реши проблема, а за по-късно може би ще е добре да се постави и каноникъл линк, макар че го измислиха от Гугъл и въпреки него периодично ми дават за някои нови публикации сигнали за дублирана информация, които изчезват до 20 дни.
 

Горе