Archivarix.com - Онлайн парсер ВебАрхива, восстановление


Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

https://ru.archivarix.com/ это сервис позволяющий восстанавливать контент из Веб Архива ( web.archive.org ).
- Скачивание контента и обработка происходит на нашем сервере, вы не тратите время и траффик, а только получаете готовый архив с сайтом.
- Восстановленные файлы с текстом (html, css, js) находятся в отдельной папке, чтобы было удобнее делать поиск и замену. Перелинковка сайта воссоздается с помошью mod_rewrite в .htaccess
- Вы получаете готовый работоспособный сайт не содержаший 404 страниц, битых картинок, внешних ссылок, не работающих скриптов и прочего мусора. Все битые файлы заменяются заглушками которые вы можете редактировать, а баннеры, счетчики и прочие внешние скрипты удаляются используя базу данных AdBlock.
- А главное, наш сервис оптимизирует восстанавливаемый сайт в соответствии с рекомендациями Google Developers. Пережимаются файлы изображений и выкидывается из них все EXIF, удаляются из html комментарии, оптимизируются css и js и еще много чего другого. Так что восстановленный сайт может оказаться с точки зрения google лучше изначального.

200 файлов можно восстановить бесплатно, эта цена не зависит от количества восстанавливаемых сайтов - вы можете скачать сколько угодно архивов содержащих менее 200 файлов по цене $0. Если вы захотите скачать сайт большего размера то цена будет $5 за каждые 1000 файлов.
Пожалуйста, после восстановления сайта у нас оставьте отзыв тут, на форуме, или напишите в ответе на е-мейл который приходит на почту вместе с архивом восстановленного сайта. Мы будем рады любым замечаниям а особенно рекомендациям как лучше и удобнее для вебмастера сделать наш сервис.

https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение Cognitive Dissonance »

А есть сайты в вебархиве андроид тематики?
• Скидка 20% на комиссию для биржи — Binance / Обзор Binance.
Crypto Marginal — мой блог и чат о крипте
• Веду Telegram-канал о перспективном проекте, в который инвестировал сам — Новости Fetch и чат русскоязычного сообщества.
Аватара пользователя
Cognitive Dissonance

 
Группа: Специалист ruSEO
Сообщения: 4042
Рефералы: -4
Зарегистрирован: 23 мар 2013
Средств на руках: 68.40
Спонсор
 
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

Cognitive Dissonance писал(а):А есть сайты в вебархиве андроид тематики?


Там есть сайты любых тематик. Можете поискать их с помощью этого сервиса - expireddomains.net
https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

Наша система восстановления сайтов из Веб Архива стала еще лучше, мы научились обходить при скачивании сайтов инструкции robots.txt. Известно что archive.org учитывает параметр Disallow: но он не удаляет этот контент а просто "скрывает" доступ, открыть его можно разрешив индексацию спайдеру архива в файле robots.txt купив домен и загрузив туда этот файл.
Мы разработали алгоритм игнорирующий "скрытость" архивных файлов и позволяющий восстанавливать даже сайты на которых в robots.txt было прописано закрытие от индексации. То есть теперь можно скачать контент с любого имеющегося в archive.org сайта, даже если владельцами его был закрыт вход для ботов параметром Disallow: На сколько я знаю таких возможностей пока не предоставляет ни одна другая программа или сервис по восстановлению из Веб архива.
https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

Мы выпустили новую версию нашего сервиса. Кроме всего что было раньше - восстановление полностью работоспособного сайта без 404 страниц, баннеров, внешних ссылок, неработающих скриптов и негрузящихся картинок мы сделали работу с восстановленным контентом гораздо удобнее.
Теперь у нас есть своя CMS - https://ru.archivarix.com/cms/ которая идет с каждым восстановленным сайтом. В ней вы можете редактировать код в простом текстовом или WYSIWYG редакторе, вставлять или удалять страницы, проводить поиск и замену в коде по регулярным выражениям и многое другое. Наша CMS может работать совместно с дургой, например с Wordpress или Drupal. Теперь ваши восстановленные сайты стало гораздо легче редактировать и использовать для создания TDS дополняя или убирая контент, вставляя на них собственные скрипты и рекламу.
https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

Мы запустили модуль экстракции контента из сайтов находящихся в данных момент онлай, а так же из удаленных сайтов архивированных archive.org. https://ru.archivarix.com/wordpress/ Если при запуске восстановления сайта отметить "Извлечь структурированный контент" во вкладке "Продвинутые параметры", то после завершения скачивания вместе с полным архивом всего сайта формируется архивы статей со ссылками на медиаконтент в формате xml, cvs, wxr и json. При формировании архива статей наш парсер учитывает только значащий контент исключая дубли статей, управляющие элементы и служебные страницы, оставляя только готовые к импорту на ваш сайт статьи с сохранённым форматированием.
Для работы с экстрактором контента мы выпустили свой плагин для Wordpress - Archivarix External Images Importer https://wordpress.org/plugins/archivari ... -importer/ . Он импортирует изображения со сторонних сайтов, ссылки на которые находятся в постах и страницах, в галерею WordPress. Если картинка в данный момент не доступна или удалена, то плагин скачивает её копию из Веб Архива.
Так же теперь у нас есть блог - https://ru.archivarix.com/blog/ Там мы будем выкладывать статьи о том, как работать с нашей системой, с Веб Архивом и другие полезные вещи о восстановлении контента и создании PBN.
https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

Система Архиварикс https://ru.archivarix.com предназначена для скачивания и восстановления сайтов - как уже не работающих из Интернет Архива archive.org, так и живых, находящихся в данный момент онлайн. Задача системы восстановить сайт в таком виде, в котором его можно будет использовать в дальнейшем на своем сервере как источник ссылок и трафика. Вместе с восстановленным сайтом идет бесплатная CMS, что делает Archivarix отличным инструментом для как для построения сетей PBN так и для «оживления» сайтов с целью последующей их продажи.

Недавно мы выпустили обновление нашей CMS, в котором появились:
- Новый дэшборд для просмотра статистики, настроек сервера и обновления системы.
- Возможность создавать шаблоны и удобным образом добавлять новые страницы на сайт.
- Интеграция с Wordpress и Joomla в один клик.
- Теперь в Поиске-Замене дополнительная фильтрация сделана в виде конструктора, где можно добавить любое количество правил.
- Фильтровать результаты теперь можно и по домену/поддоменам, дате-времени, размеру файлов.
- Новый инструмент сброса кэша в Cloudlfare или включения/отключения Dev Mode.
- Новый инструмент удаления версионности у урлов, к примеру, "?ver=1.2.3" у css или js. Позволяет чинить даже те страницы, которые криво выглядели в ВебАрхиве из-за отсутствия стилей с разными версиями.
- У инструмента robots.txt добавлена возможность сразу включать и добавлять Sitemap карту.
- Автоматическое и ручное создание точек откатов у изменений.
- Импорт умеет импортировать шаблоны.
- Сохранение/Импорт настроек лоадера содержит в себе созданные кастомные файлы.
- У всех действий, которые могут длиться больше таймаута, отображается прогресс-бар.
- Инструмент добавления метатега viewport во все страницы сайта.
- У инструментов удаления битых ссылок и изображений возможность учитывать файлы на сервере.
- Новый инструмент исправления неправильных urlencode ссылок в html коде. Редко, но может пригодиться.
- Улучшен инструмент отсутствующих урлов. Вместе с новым лоадером, теперь ведётся подсчёт обращений к несуществующим урлам.
- Подсказки по регулярным выражениями в Поиске & Замене.
- Улучшена проверка недостающих расширений php.
- Обновлены все используемые js инструменты на последние версии.
https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение Marik »

О надо посмотреть. Давно искал что то подобное. Есть там на примете у меня несколько сайтов. Но как забрать не знал music
Аватара пользователя
Marik

 
Группа: Интересующийся
Сообщения: 59
Зарегистрирован: 27 июл 2018
Откуда: Москва
Средств на руках: 0.20
Статус: не указан
Re: Archivarix.com - Онлайн парсер ВебАрхива, восстановление

Сообщение archivarix »

В ближайшее время наша команда планирует запустить уникальный сервис https://archivarix.net/ru/ , сочетающий в себе возможности системы Веб Архива (archive.org) и поисковой системы.
Мы планируем проиндексировать главные страницы всех сайтов, которые когда либо были сохранены Веб Архивом. В нашей базе сайтов будет так же присутствовать архив различных метрик, таких как Alexa, Ahrefs, Majestic, ключевые слова, WHOIS домена и прочие исторические данные за все время существования сайта. Таким образом можно будет осуществлять поиск нужного сайта для восстановления дропов или для извлечения удалённого контента по огромному количеству параметров, таких как ключевые слова в тексте и в тегах, трафик на определённую дату, наличие исторических ссылок, неймсервера и так далее. С помощью этой системы можно будет делать выборки любой сложности, к примеру найти все домены, удалённые в 2018 году, в контенте которых содержались слова webmaster analytics, имевшие тогда Alexa rank менее 300k и которые имели более 30 уников в день по определённому ключевому слову в 2016 году. Наш сервис будет иметь удобный интерфейс для поиска нужных данных и будет содержать в себе скриншоты сайтов со всеми параметрами в виде графиков и таблиц.
Следующим этапом развития системы будет индексация живых сайтов и расширение базы проиндексированного контента. Будут доступны для поиска медиафайлы и некоторые внутренние страницы сайта, выбранные по алгоритму учитывающему значимость этой страницы. В итоге система будет использовать преимущественно свою базу архивированных сайтов и станет не зависимой от Archive.org
https://ru.archivarix.com/ - Восстановление сайтов из Веб Архива. Парсер web.archive.org
archivarix

 
Группа: Cлучайный прохожий
Сообщения: 10
Зарегистрирован: 30 сен 2017
Средств на руках: 6.95
Статус: не указан

Вернуться в Сервисы и программы для SEO

 


  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 41