FAQ

Основные причины появления Ошибок

 

  1. Ссылки находятся между тегами NOINDEX или теги NOINDEX расставлены некорректно (например, два раза открываются, а закрываются только один раз). Откройте исходный код вашей страницы в браузере и посчитайте количество открытых NOINDEX (<noindex>) и закрытых (</noindex>). Количество должно совпадать. Если количество совпадает, то проверьте, не находятся ли ссылки внутри noindex, чтобы не было такой конструкции: <noindex>ССЫЛКИ</noindex>.
  2. Проверьте, находятся ли ссылки в индексируемой зоне доступного для индексации поисковыми системами документа. Если ссылки закрыты от индексации одним из следующих способов, они не будут найдены роботом системы Sape.
Ссылки закрыты от индексации с помощью тегов <noindex>,  <!--noindex-->, <script>, <frames>,<applet>, <embed>, <object>,  тегов форм  или комментариев.
Страница, на которой размещаются ссылки, закрыта от индексации в файле robots.txt или в метатегах.
К коду ссылки дописывается атрибут nofollow.
При проверке наличия ссылок на страницах, робот получает отличный от 200 код ответа в HTTP заголовках Вашего сервера.
Ссылки не размещены внутри тега бегущей строки <marguee>.
Ссылки размещены за пределами тегов <html> и <body>. Для корректной проверки ссылок теги<html> и <body> должны встречаться в коде страницы один раз и ссылки должны быть размещены между этими тегами. Если это не так, вам нужно исправить ситуацию: поместить ссылки внутрь тегов. Если у вас отсутсутствуют эти теги, добавьте их. Т.е. правильное размещение ссылок должно быть такое:
1 <html>
2    <body>
3    <!-- ссылки -->
4    </body>
5 </html>
  
Другие менее распространенные причины появления статуса "Ошибка"  вы можете найти на странице системы Sape по ссылке.

3. При запросе страницы истек таймаут

Означает, что роботу Sape в течении 30 секунд не возвратился ответ от запрашиваемой страницы. Проверьте доступность страницы и отсутствие санкций хостера к IP робота (подсеть 188.72.80.*).

 
4. Страница запрещена в METAх
 
Проверьте, не запрещена ли страница к индексации в мета-тегах в исходном коде страницы (к примеру, с помощью noindex, nofollow или noarchive).
 
5. Cтраница запрещена robots.txt
 
Проверьте, не запрещена ли страница в файле robots.txt с помощью директивы disallow — для ботов поисковых систем и для IP нашего робота (подсеть 188.72.80.*).
 
6. Не найден ip для домена
 
Скорее всего, на хостинге проблемы с DNS – наш робот не смог сопоставить домен сайта с конкретным IP-адресом. Свяжитесь с хостером и выясните причину. 
 
Кроме того, уточните, не применяются ли хостером какие-либо санкции к подсети 188.72.80.*, с адресов этой подсети заходит робот Sape, проверяющий корректность размещения ссылок.
 
7. На странице нет КОДА
 
 Код для вызова ссылок на странице не установлен. Проверьте корректность его установки.
 
8. Страница не найдена по ссылкам
 
Робот Sape  не смог перейти на целевую страницу по ее урлу в системе. Проверьте корректность урла.
 
9. Cтраница возвращает http-статус, отличный от 200
 
Проверьте, какой http-статус возвращает страница. Если он не равен 200, то возможны несколько вариантов:
1. Хостер блокирует IP-адреса нашего робота (подсеть 188.72.80.* ), попробуйте связаться с ним и выяснить подробности.
2. Специфические настройки сайта также могут вызвать подобную проблему. Возможно, другой статус возвращается только при запросе нашего робота.
 
 
10. Ошибка соединения с сервером
 
Робот Sape не смог соединиться с сервером, на котором размещена площадка. Проверьте доступность сайта и отсутствие санкций хостера к IP робота (подсеть 188.72.80.*)
 
11. Не удалось распаковать страницу из gzip-сжатия
 
Gzip-сжатие страниц не работает или работает некорректно, следует обратиться в техподдержку Вашего хостинга - либо потребовать отключения gzip-сжатия, либо попросить идентифицировать и решить проблему с его неверной работой.
 
12. Пустой ответ сервера
 
Сервер возвращает роботу пустой ответ при запросе. Обратитесь в техподдержку хостинга, причина на их стороне. Кроме того, уточните отсутствие санкций хостера к IP робота (подсеть 188.72.80.*)
 
13. Ошибка при раскодировании частей ответа (problem in the chunky parser)
 
Проблема на стороне хостера, обычно решается отключением gzip-сжатия.
 
14. Сервер редиректит на другую страницу
 
При заходе на страницу происходит редирект на другую страницу. Следует убрать редирект, и в течение некоторого времени ссылки приобретут статус OK.
 
15. Недопустимый Content-type
 
Системой Sape поддерживается только контент вида text/html , соответственным образом прописанный в meta-тегах страницы.
 
16. Использование тега frameset запрещено
 
Если в исходном коде страницы робот Sape обнаружит хотя бы один тег frameset, то ваш сайт  выпадует в статус Ошибка. Следует избавиться от фреймов, это единственно возможное решение проблемы.
 
17. Страница слишком большая
 
Максимально допустимый размер страницы в системе - 2 мегабайта, в соответствии с этим следует скоррелировать размер вашей страницы.
 
18. Ссылки в подвале
 
Робот проверяет подвальность так:
 
- получает исходный код страницы,
- удаляет теги,
- определяет местоположение ссылок в коде,
- если ссылки в последних 15%, то размещение считается подвальным.