Помощник
|
Как стянуть весь сайт с webarchive? |
prolisk
|
Сообщение
#1
|
||
|
|
||
|
|||
prohojy_rs |
18.9.2015, 14:40;
Ответить: prohojy_rs
Сообщение
#2
|
|
Актуальный вопрос. Сюда же спрошу, а можно ли как-нибудь вебархив сканировать сразу на несколько доменов, просто на наличие контента? Чтобы пачку закинуть и пустые сразу в сторону отмести.
-------------------- |
|
|
k0ttee |
18.9.2015, 15:44;
Ответить: k0ttee
Сообщение
#3
|
|
Интересует общая концепция На форуме есть мой парсер, который работал... Я давно им не пользовался, так что не дам гарантий о работоспособности сейчас. Вот моя старая тема, где я выкладывал свой парсер - Re: Парсер вебархива на php -------------------- btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9 |
|
|
prolisk
|
Сообщение
#4
|
|
k0ttee, я так понял, если конкретную страну в вебархиве не открывает, то ее не стащишь?
з.ы. там статьи :( -------------------- Блог вебмастера. Добавь свой сайт в белый каталог |
|
|
airman |
18.9.2015, 15:56;
Ответить: airman
Сообщение
#5
|
|
Почитай эти темы
Парсер вебархива на php Сервис для восстановления сайта из вебархива Восстановление заброшенного сайта Добыча уникального контента бесплатно -------------------- |
|
|
k0ttee |
18.9.2015, 16:37;
Ответить: k0ttee
Сообщение
#6
|
|
если конкретную страну в вебархиве не открывает, то ее не стащишь? Ну конечно, если страницы нет - откуда ее тащить? Из астрала что-ли? :D Мой парсер составляет карты страниц, которые удалось открыть в веб-архиве (морда + второй УВ + третий УВ). Если вложенность была больше - то глубокие страницы он не собирает. А потом по карте можно хоть Wget'ом или Teleport'ом скачать сами страницы. -------------------- btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9 |
|
|
prolisk
|
Сообщение
#7
|
|
(k0ttee) если страницы нет - откуда ее тащить Это понятно, просто вначале слюня потекла, увидев свою старые статьи, за которые уплаченные деньги. А потом полез по сайту - а там доступны только иконки и robots :laugh: <_< -------------------- Блог вебмастера. Добавь свой сайт в белый каталог |
|
|
Uhab |
18.9.2015, 20:29;
Ответить: Uhab
Сообщение
#8
|
|
Воровать чужой контент для продажи в биржах, очень плохо.
-------------------- |
|
|
k0ttee |
18.9.2015, 20:43;
Ответить: k0ttee
Сообщение
#9
|
|
очень плохо Зато быстрее и прибыльнее, чем писать свой... :D Какой же я плохой, надо меня отшлепать. :blush: В архиве есть и мои трупы, например pro-dodge https://web.archive.org/web/20140110150 ... -dodge.ru/ Обкатывал на нем правильность шаблона для гугла, а потом угробил в сапе. -------------------- btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9 |
|
|
prolisk
|
Сообщение
#10
|
|
(land) Воровать чужой контент для продажи в биржах, очень плохо. Если статьи висят в архиве несколько лет и никто не пользуется их уникальностью - то почему бы и не заработать? -------------------- Блог вебмастера. Добавь свой сайт в белый каталог |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Ваш сайт блокирует Роскомнадзор? | 23 | hollywooduk | 5091 | Вчера, 10:43 автор: hollywooduk |
|
Тысячи ботовых переходов на сайт | 18 | Suagaring | 4536 | 26.3.2024, 21:42 автор: c4p1t4l15t |
|
Большие ставки для кликов в Я.Директ. Как удешевить? | 2 | rownong27 | 1117 | 26.3.2024, 14:13 автор: knezevolk |
|
Как вы бросили работу и перешли на заработок с сайтов? | 12 | uahomka | 2286 | 25.3.2024, 6:52 автор: Skyworker |
|
Как отозвать банковский платеж фрилансеру? | 28 | metvekot | 3912 | 25.3.2024, 6:34 автор: Skyworker |
Текстовая версия | Сейчас: 28.3.2024, 18:56 |