Вы здесь

Как собрать трастовую базу (собрать базу трастовых сайтов)

Сделать базу трастов?Раз плюнуть!

Всем привет! Сегодня нас всех ждет ну оооочень подробная и я думаю не менее полезная статейка.

Сегодня мы научимся искать трастовые ресурсы на, которых можно оставить свою ссылку в профиле.
Вы конечно можете и не читать этого всего и пользоваться старым дедовским способом( искать по признакам), но потом часами вычищать такие базы. А если у Вас уже есть какая-никакая база, то почистив новую выяснится, что более половины уже есть. 
Или можете последовать моему совету и научиться парсить базы на раз-два с помощью следующего мануала.

Кароче че я вас гружу? Приступаем!

В чем заключается мой способ:
Нам незачем изобретать велосипед и мы просто возьмем уже чужие прогнанные сайты и получим все ссылки с базы по которой прогонялись такие сайты.
Сперва идем на какой-то не сильно, но спамленый сайт. Я взял сайт webplanet.ru. Находим тут профиль явно оставленный для ссылки. За менее чем минуту я нашел вот этотhttp://www.webplanet.ru/user/68646.

Сделать базу трастов?Раз плюнуть!

Берите профиль который был создан в пределах 2-ух месяцев( Позже объясню зачем)
Видим тут сайт labelleza.ru. Смотрим на его тИЦ.

Сделать базу трастов?Раз плюнуть!

У него 20 – отлично! Теперь смотрим на его ссылки.

Сделать базу трастов?Раз плюнуть!

Куча профилей – это наш клиент. Вот по нему и спарсим нашу базу.
Для этого в Яшку забиваем такой запрос “labelleza.ru” date:20110901..20111020(последняя дата - это наша текущая дата)
По этой фразе парсим всю выдачу. Можно это делать разными программами, но я предпочитаю использовать Яшкалюб’а. После парсинга сохраняем все ссылки в ексель. Дальше мы будем чистить все эти ссылки.

Сделать базу трастов?Раз плюнуть!

Процесс чистки.

Чистка у меня занимает чуть более 2 минут!
Делаем по пунктам. 
1)Сначала массово проверяем тИЦ каждого и удаляем не подходящие(я удаляю только нулевки, но вы можете поступать как хотите). Для этого я пользуюсь сервисом http://www.raskruty.ru/tools/cy/ . Сразу проверяет до 1000 ссылок. 

Сделать базу трастов?Раз плюнуть!

Проверили тИЦ и удалили не нужные сайты – едем дальше.

Сделать базу трастов?Раз плюнуть!

2)Теперь мы будем проверять наличие активной ссылки. Так как при таком парсинге находятся ресурсы и с просто упоминанием этого сайта. Для этого я пользуюсь своим любимым форумом вебмастерс)) Тут есть очень полезный инструмент, http://webmasters.ru/tools/tracker . Проверяем всю нашу базу на наличие обратной кликабельной ссылки.

Сделать базу трастов?Раз плюнуть!

Все сайты на, которых не обнаружено ссылки удаляем из базы. Можете удалить и те на которых ссылка стоит в Ноидекс или ноуфоллов (сервис это показывает). 

Сделать базу трастов?Раз плюнуть!

В итоге мы получаем практически чистую базу(95% сайтов будут профили), на каждом сайте которой можно оставить кликабельную ссылку. Теперь, чтобы удалить эти 5% сайтов вам придется пройти ручками. Но практика показывает, чем больше вы зарегистрируете профилей тем больше будет наметан ваш глаз)))Вы только лишь с одного взгляда на ссылку сможете определить CMS, форум не форум и т.п.
Весь анализ занимает у меня от 3 до 6 минут.
С одного такого сайта я получаю около 15 новых ресурсов. Анализируя штук 5 можно получить какую-никакую приличную базу.
Итак что мы имеем: мы имеем 3-6 минут нашего времени на получение 15 ресурсов. Ресурсы эти все рабочие с активной ссылкой без ноуфоллов и ноиндекс. Все активно индексируются поисковиками. Помните я вам говорил в начале, что нужно брать профили зарегистрированные примерно 2 месяца назад. Это дает гарантию того, что ссылка будет проиндексирована в течении пары месяцев. Но никто вам не запрещает прогнать профили по аддурилкам.

Автора автора