Помощник
|
Как стянуть весь сайт с webarchive? |
prolisk
|
Сообщение
#1
|
||
|
|
||
|
|||
prohojy_rs |
18.9.2015, 14:40;
Ответить: prohojy_rs
Сообщение
#2
|
|
Актуальный вопрос. Сюда же спрошу, а можно ли как-нибудь вебархив сканировать сразу на несколько доменов, просто на наличие контента? Чтобы пачку закинуть и пустые сразу в сторону отмести.
-------------------- |
|
|
k0ttee |
18.9.2015, 15:44;
Ответить: k0ttee
Сообщение
#3
|
|
Интересует общая концепция На форуме есть мой парсер, который работал... Я давно им не пользовался, так что не дам гарантий о работоспособности сейчас. Вот моя старая тема, где я выкладывал свой парсер - Re: Парсер вебархива на php -------------------- btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9 |
|
|
prolisk
|
Сообщение
#4
|
|
k0ttee, я так понял, если конкретную страну в вебархиве не открывает, то ее не стащишь?
з.ы. там статьи :( -------------------- Блог вебмастера. Добавь свой сайт в белый каталог |
|
|
airman |
18.9.2015, 15:56;
Ответить: airman
Сообщение
#5
|
|
Почитай эти темы
Парсер вебархива на php Сервис для восстановления сайта из вебархива Восстановление заброшенного сайта Добыча уникального контента бесплатно -------------------- |
|
|
k0ttee |
18.9.2015, 16:37;
Ответить: k0ttee
Сообщение
#6
|
|
если конкретную страну в вебархиве не открывает, то ее не стащишь? Ну конечно, если страницы нет - откуда ее тащить? Из астрала что-ли? :D Мой парсер составляет карты страниц, которые удалось открыть в веб-архиве (морда + второй УВ + третий УВ). Если вложенность была больше - то глубокие страницы он не собирает. А потом по карте можно хоть Wget'ом или Teleport'ом скачать сами страницы. -------------------- btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9 |
|
|
prolisk
|
Сообщение
#7
|
|
(k0ttee) если страницы нет - откуда ее тащить Это понятно, просто вначале слюня потекла, увидев свою старые статьи, за которые уплаченные деньги. А потом полез по сайту - а там доступны только иконки и robots :laugh: <_< -------------------- Блог вебмастера. Добавь свой сайт в белый каталог |
|
|
Uhab |
18.9.2015, 20:29;
Ответить: Uhab
Сообщение
#8
|
|
Воровать чужой контент для продажи в биржах, очень плохо.
-------------------- |
|
|
k0ttee |
18.9.2015, 20:43;
Ответить: k0ttee
Сообщение
#9
|
|
очень плохо Зато быстрее и прибыльнее, чем писать свой... :D Какой же я плохой, надо меня отшлепать. :blush: В архиве есть и мои трупы, например pro-dodge https://web.archive.org/web/20140110150 ... -dodge.ru/ Обкатывал на нем правильность шаблона для гугла, а потом угробил в сапе. -------------------- btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9 |
|
|
prolisk
|
Сообщение
#10
|
|
(land) Воровать чужой контент для продажи в биржах, очень плохо. Если статьи висят в архиве несколько лет и никто не пользуется их уникальностью - то почему бы и не заработать? -------------------- Блог вебмастера. Добавь свой сайт в белый каталог |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Арбитражники, как ведете учет расходов и доходов? | 11 | Boymaster | 1773 | 17.4.2024, 23:35 автор: Boymaster |
|
Как вывести деньги в Украине с заблокированного Юмани ? | 29 | freeax | 4795 | 17.4.2024, 1:19 автор: sergio11 |
|
Ваш сайт блокирует Роскомнадзор? | 27 | hollywooduk | 5711 | 17.4.2024, 0:19 автор: Omaxis |
|
Прототипирование + дизайн + вёрстка = красивый и эффективный сайт под ключ | 0 | bunneh | 303 | 16.4.2024, 18:02 автор: bunneh |
|
Если в сайт с одними ключами, которые там долго, добавить новую рубрику с новыми ключами | 2 | Tutich | 1179 | 16.4.2024, 8:27 автор: Tutich |
Текстовая версия | Сейчас: 19.4.2024, 0:07 |