Вы здесь

HwoR

Восстановление сайтов не в индексе из вебархива

Сегодня расскажу как я нахожу контент для своих блогов, сплогов и прочих бело-серых ресов. Тема не сказать, что очень новая, но я ее немного доработал и чуток автоматизировал, так что очень многим будет полезна. Суть идеи такова: есть сайт http://web.archive.org, который собирает в свой архив содержимое почти всех сайтов аж с 1996 года. Очень многие из этих сайтов уже закрылись/проэкспайрились/побанились, но их содержимое все еще бережно хранится этим замечательным сервисом. Как вы уже догадались будем выковыривать оттуда непроиндексированный гуглом уникальный контент.