DMOZ удалён из индекса Яндекс

1 звезда2 звезды3 звезды4 звезды5 звёзд
Loading ... Loading ...

Яндекс

Как можно увидеть из результатов запроса в поисковой строке Яндекса выражения «rhost="org.dmoz.*"|rhost="org.dmoz.www.*"», из индекса Яндекс исчез крупнейший каталог сайтов в Интернете — DMOZ. Русскоязычный раздел Открытого Каталога является одним из крупнейших каталогов сайтов в Рунете. При попытке добавить проект заново в индекс через форму «Добавить URL» выдаётся ошибка «Добавленный вами сайт не индексируется, так как является «зеркалом» http://dmoz.org/». Т. е., как видно, Яндекс неверно определил основное зеркало сайта (с dmoz.org на www.dmoz.org уже несколько месяцев стоит 301-й редирект). В Яндекс.Каталоге URL проекта также ошибочно прописан (dmoz.org вместо канонического www.dmoz.org).

На соответствующий запрос в службу поддержки Яндекс.Ру был получен следующий ответ:

Дело в том, что Ваш сайт может индексироваться Яндексом только по адресу dmoz.org, адрес www.dmoz.org является его зеркалом. В данный момент у Вас установлен серверный редирект с dmoz.org на www.dmoz.org:

$ telnet dmoz.org 80
HEAD / HTTP/1.0
Host: dmoz.org
Accept-Charset: windows-1251
User-Agent: Yandex/2.01.000 (compatible; Win16; Dyatel; C)

HTTP/1.0 301 Moved Permanently
MIME-Version: 1.0
Server: ArtBlast/3.5.5
Date: Mon, 17 Dec 2007 10:24:24 GMT
Expires: Mon, 17 Dec 2007 10:54:24 GMT
Content-length: 86
Content-type: text/html
Location: http://www.dmoz.org/
Connection: close

Страницы, с которых стоит серверный редирект, удаляются роботом из базы. Чтобы вернуть сайт в базу Яндекса, необходимо снять редирект, тогда сайт вновь начнет индексироваться по адресу dmoz.org. Если для Вас важно, чтобы сайт индексировался именно по адресу www.dmoz.org , есть два пути:
1. оставить все как есть, но скорректировать robots.txt, добавив в него:
User-agent: Yandex
Disallow:
Host: www.dmoz.org

Важно: блоки указаний роботам должны разделяться пустой строкой. После этого надо будет дождаться захода на сайт робота зеркальщика, он отследит изменения и переклеит сайты по адресу, указанному в Host. Процесс переклейки в среднем занимает до 4–6 недель, ускорить его, к сожалению, нельзя. В этом случае сайт появится в базе Яндекса только после того, как произойдет «переклейка».

2. снять редирект, скорректировать robots.txt так, как указано выше. В этом случае сайт вернется в базу Яндекса по адресу dmoz.org, после переклейки в базе появится www.dmoz.org.


С уважением, Платон Щукин
Служба поддержки Яндекс.Ру

По состоянию на 30 декабря 2007 года, в индексе Яндекса появилось около 16-и страниц ODP, включая главную — www.dmoz.org, которая теперь выдаётся поисковой машиной на первом месте по запросу «DMOZ». Возможно, совсем скоро, нам предстоит увидеть полное возвращение Каталога в индекс поисковика (добавлено 30 декабря 2007 года).

По состоянию на 12 января 2008 года, в индексе Яндекса появилось 9 052 страницы Открытого Каталога. Теперь, с полной уверенностью можно говорить о том, что DMOZ возвращается в индекс поисковика (добавлено 12 января 2008 года).

11 отклика(ов)

    Трекбеки и пингбеки

  1. Комментарии

  2. Gravatar Kost (1) сказал(а):

    Странно, что это не было сделано заранее. Эти нехитрые премудрости давным-давно написаны в FAQ Яндекса.

  3. Gravatar nejron (146) сказал(а):

    Сомневаюсь, что AOL вообще известно о существовании «великого и могучего» Яндекса со всеми его особенностями. :wink:

  4. Gravatar Русская рыбалка (1) сказал(а):

    Смешно ! :mrgreen:

  5. Gravatar MaulNet (1) сказал(а):

    Судя по всему — уже возвращается в индекс.

  6. Gravatar nejron (146) сказал(а):

    Да, похоже на то. Дополнил пост, однако, писать новый пост о возвращении DMOZ в индекс Яндекса пока не стал, т. к.:

    * не проиндексировано ни одной русскоязычной страницы;

    * при попытке добавить проект в индекс через форму “Добавить URL” до сих пор выдаётся ошибка «Добавленный вами сайт не индексируется, так как является «зеркалом» http : / / dmoz.org/»;

    * в Яндекс.Каталоге URL проекта до сих пор ошибочно прописан (dmoz.org вместо канонического w w w . dmoz.org);

    * проиндексировано всего 16 страниц.

  7. Gravatar vipus (1) сказал(а):

    На данный момент все так и есть. Сайт с www считается не основным сайтом... Это относиться к многим сайтам, и в частности и dmoz.org Это сделано наверно для сокращение количества страниц в базе и создавать меньше нагрузки на сайт.

  8. Gravatar nejron (66) сказал(а):

    Логичнее, наверное, чтобы поисковик зеркалом считал тоже самое, что считает вебмастер, а не канонический URL...

  9. Gravatar Илья (1) сказал(а):

    :lol: полезная статья... нарвался и я на такую немилость... установил редиректы и 153 ссылки стало 3-мя... когда я это увидел, чуть со стула не упал... пришлось редиректы удалить

  10. Gravatar nejron (66) сказал(а):

    Со всеми может случиться...

Оставить комментарий »

Anti-Spam Image Защитный код - обязательно

Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>