После некоторых колебаний я выложил программу – анализатора перелинковки сайта в сеть (обычно такие программы идут как shareware). Буду рад вопросам и комментариям к ней.
Назначение программы
Инструмент предназначен для проверки ссылочных весов страниц сайта или нескольких связанных между собой сайтов.
Ссылочный вес используется поисковыми системами при ранжировании страниц сайтов в поисковой выдаче.
В программе сылочный вес называется как PageRank, так как алгоритм его расчета был запатентован Google, но в целом результаты проверки могут быть отенесены и к другим поисковым системам, в частности к Яндексу.
Принцип действия
При расчете PageRank для страниц выбранных сайтов, автором было сделано предположение о том, что влияние выбранных сайтов на весь веб принебрежимо мало и поэтому изменения внутри сайтов, не влияют на вес входных внешних ссылок. Данное предположение, дало возможность заменить входные ссылки входным PageRank и определить PageRank для страниц сайта локально, не пересчитывая весь веб.
Техническая реализация
Программа написана в виде макросов рабочей книги excel. Для сканирования веба анализатор запускает браузер IExplorer в автоматическом режиме.
Инструкция по применению
Для запуска программы нужно открыть книгу (файл анализатора) с помощью excel и разрешить выполнение макросов в ней. После этого нужно последовательно выполнять инструкции для каждого шага работы (step1, step2…)
Возможные неполадки и их разрешение
- Программа зависает при сканировании веба, сканирование неожиданно останавливается.
- Так как программа сканирует веб с помощью браузера, то активное содержание страниц сайта может вызвать сбои в ее работе. Для разрешения проблем рекомендуется отключить выполнение активного содержания в браузере IExplorer (на время выполнения программы). Для этого надо открыть IExplorer, зайти на вкладку безопасности в свойствах обозревателя и поотключать все, что только возможно.
- Скорость сканирования мала, картинки на страницах сайта долго грузятся.
- Отключить показ картинок в браузере IExplorer. Зайти в свойствах обозревателя на вкладку “дополнительно” и убрать галочку с пункта “Показывать изображения”.
1) Программа выдает отклик Ошибка отклика- “bad” (даже для главной) при проверке вручную страницы открываются….
2) Почему- то вместе с “Проверкой списка страниц” запускается “Рассчитать матрицу связей”… а ведь не все страницы еще спарсила…
3) “Рассчитать матрицу связей”- работает, работает, и – Run-time error 1004
4) “Проверить” (входящие ссылки)- и откуда их парсить (с Page Rank-ом – то? :) )
4) “Очистить список” работает, по-видимому. некорректно- для проверки следующего сайта программу приходится перезапускать, иначе- ERROR 99.
П.С. сайт, на всякий случай вбил в сообщение неправильный.
П.П.С. а если прога будет работать, то ИМХО- полезная штука. еще бы и внутренние ошибки перелинковки выдавала…
Comment by Александр — 22.11.2010 @ 12:56 pm
Спасибо Александр. Если бы Вы мне прислали заполненный файл, я бы проверил. Вообще говоря программа работает, так что наверное, вы что-то не то делали (помощь, конечно, оставляет желать лучшего). Некоторые возможные неисправности могут возникать из-за того, что программа использует браузер для сканирования веба. Как с этим бороться я теперь написал в разделе неисправности. Откуда парсить входящие ссылки – например, из панели веб мастера yandex взять. После вашего замечания я ввел проверку внутренних ссылок, чтобы исключить ситуацию, когда разные внутренние ссылки показывают на один URL.
Comment by admin — 22.11.2010 @ 1:24 pm
снимать защиту нужно?
Comment by Рома — 25.04.2011 @ 6:21 pm
Нет, никакой новой функциональости от снятия защиты не будет.
Comment by admin — 25.04.2011 @ 6:34 pm
я не понял мне нельзя пользоваться чтоли прогой, или как? и сразу вопрос если можно пользоваться, то непонятно куда урл то вводить, просит снять с защиты
Comment by Рома — 25.04.2011 @ 10:40 pm
Роман, делаем по-порядку. Идем сначала на лист step1. Затем в строчке A7 набираем домен – design-sites.ru, например. Ничего здесь больше не делаем и идем на лист step2 – нажимаем на кнопку Check the page list и.т.д.
Comment by admin — 26.04.2011 @ 12:28 am
Какой, кстати, версией excel вы пользуетесь Роман?
Comment by admin — 26.04.2011 @ 12:32 am
Здравствуйте! Неполадка “сканирование неожиданно останавливается”, что значит во вкладке безопасность “поотключать все что только можно? Вроде там и отключать-то нечего… Устранить неполадку не получается :(
Comment by Наталья — 11.08.2011 @ 11:08 pm
Я обычно поступаю следующим образом. Сначала настраиваю IE – уровень безопасности наивысший, картинки отключены. Затем иду на лист setting – и устанавливаю требуемые расширения (php,html, aspx …) у ссылок и убираю галку на “выдавать сообщения о редиректах” – эта опция скорее для отладки, чем для реальной работы. Если сканирование все-таки остановилось, то возможно там какой-то сложный html, может фреймы или еще что-то. Если вы скажете url сканируемого сайта, я скажу точно в чем неприятность.
Comment by admin — 12.08.2011 @ 12:33 am
шикарная программа, спасибо автору за это.
Comment by алексей (vebcams.ru) — 04.11.2011 @ 10:42 pm
А если меня интересует только внутренняя перелинковка, я могу пропустить шаг 3? Я пытаюсь посчитать таким образом, но ничего не получается Выдает все страницам одинаковый PageRank – 0,15, несмотря на то, что у меня некоторіе подразделі имеют большое количество ссылок по сравнению с другими.
Comment by Андрей (marketingbuzz.info) — 08.11.2011 @ 9:32 pm
Шаг 3 я тоже обычно пропускаю и смотрю только внутренние веса, веса обычно разные, кроме того все по 0.15 это странно, большой отток на внешние ссылки.
Comment by admin — 08.11.2011 @ 10:33 pm