Помощник
|
Archivarix.com - Онлайн парсер ВебАрхива, восстановление |
archivarix
|
Сообщение
#1
|
||
|
|
||
|
|||
Cognitive Disson... |
30.9.2017, 22:55;
Ответить: Cognitive Dissonance
Сообщение
#2
|
|
А есть сайты в вебархиве андроид тематики?
|
|
|
archivarix
|
Сообщение
#3
|
|
(Cognitive Dissonance) А есть сайты в вебархиве андроид тематики? Там есть сайты любых тематик. Можете поискать их с помощью этого сервиса - expireddomains.net -------------------- |
|
|
archivarix
|
Сообщение
#4
|
|
Наша система восстановления сайтов из Веб Архива стала еще лучше, мы научились обходить при скачивании сайтов инструкции robots.txt. Известно что archive.org учитывает параметр Disallow: но он не удаляет этот контент а просто "скрывает" доступ, открыть его можно разрешив индексацию спайдеру архива в файле robots.txt купив домен и загрузив туда этот файл.
Мы разработали алгоритм игнорирующий "скрытость" архивных файлов и позволяющий восстанавливать даже сайты на которых в robots.txt было прописано закрытие от индексации. То есть теперь можно скачать контент с любого имеющегося в archive.org сайта, даже если владельцами его был закрыт вход для ботов параметром Disallow: На сколько я знаю таких возможностей пока не предоставляет ни одна другая программа или сервис по восстановлению из Веб архива. -------------------- |
|
|
archivarix
|
Сообщение
#5
|
|
Мы выпустили новую версию нашего сервиса. Кроме всего что было раньше - восстановление полностью работоспособного сайта без 404 страниц, баннеров, внешних ссылок, неработающих скриптов и негрузящихся картинок мы сделали работу с восстановленным контентом гораздо удобнее.
Теперь у нас есть своя CMS - https://ru.archivarix.com/cms/ которая идет с каждым восстановленным сайтом. В ней вы можете редактировать код в простом текстовом или WYSIWYG редакторе, вставлять или удалять страницы, проводить поиск и замену в коде по регулярным выражениям и многое другое. Наша CMS может работать совместно с дургой, например с Wordpress или Drupal. Теперь ваши восстановленные сайты стало гораздо легче редактировать и использовать для создания TDS дополняя или убирая контент, вставляя на них собственные скрипты и рекламу. -------------------- |
|
|
archivarix
|
Сообщение
#6
|
|
Мы запустили модуль экстракции контента из сайтов находящихся в данных момент онлай, а так же из удаленных сайтов архивированных archive.org. https://ru.archivarix.com/wordpress/ Если при запуске восстановления сайта отметить "Извлечь структурированный контент" во вкладке "Продвинутые параметры", то после завершения скачивания вместе с полным архивом всего сайта формируется архивы статей со ссылками на медиаконтент в формате xml, cvs, wxr и json. При формировании архива статей наш парсер учитывает только значащий контент исключая дубли статей, управляющие элементы и служебные страницы, оставляя только готовые к импорту на ваш сайт статьи с сохранённым форматированием.
Для работы с экстрактором контента мы выпустили свой плагин для Wordpress - Archivarix External Images Importer https://wordpress.org/plugins/archivari ... -importer/ . Он импортирует изображения со сторонних сайтов, ссылки на которые находятся в постах и страницах, в галерею WordPress. Если картинка в данный момент не доступна или удалена, то плагин скачивает её копию из Веб Архива. Так же теперь у нас есть блог - https://ru.archivarix.com/blog/ Там мы будем выкладывать статьи о том, как работать с нашей системой, с Веб Архивом и другие полезные вещи о восстановлении контента и создании PBN. -------------------- |
|
|
archivarix
|
Сообщение
#7
|
|
Система Архиварикс https://ru.archivarix.com предназначена для скачивания и восстановления сайтов - как уже не работающих из Интернет Архива archive.org, так и живых, находящихся в данный момент онлайн. Задача системы восстановить сайт в таком виде, в котором его можно будет использовать в дальнейшем на своем сервере как источник ссылок и трафика. Вместе с восстановленным сайтом идет бесплатная CMS, что делает Archivarix отличным инструментом для как для построения сетей PBN так и для «оживления» сайтов с целью последующей их продажи.
Недавно мы выпустили обновление нашей CMS, в котором появились: - Новый дэшборд для просмотра статистики, настроек сервера и обновления системы. - Возможность создавать шаблоны и удобным образом добавлять новые страницы на сайт. - Интеграция с Wordpress и Joomla в один клик. - Теперь в Поиске-Замене дополнительная фильтрация сделана в виде конструктора, где можно добавить любое количество правил. - Фильтровать результаты теперь можно и по домену/поддоменам, дате-времени, размеру файлов. - Новый инструмент сброса кэша в Cloudlfare или включения/отключения Dev Mode. - Новый инструмент удаления версионности у урлов, к примеру, "?ver=1.2.3" у css или js. Позволяет чинить даже те страницы, которые криво выглядели в ВебАрхиве из-за отсутствия стилей с разными версиями. - У инструмента robots.txt добавлена возможность сразу включать и добавлять Sitemap карту. - Автоматическое и ручное создание точек откатов у изменений. - Импорт умеет импортировать шаблоны. - Сохранение/Импорт настроек лоадера содержит в себе созданные кастомные файлы. - У всех действий, которые могут длиться больше таймаута, отображается прогресс-бар. - Инструмент добавления метатега viewport во все страницы сайта. - У инструментов удаления битых ссылок и изображений возможность учитывать файлы на сервере. - Новый инструмент исправления неправильных urlencode ссылок в html коде. Редко, но может пригодиться. - Улучшен инструмент отсутствующих урлов. Вместе с новым лоадером, теперь ведётся подсчёт обращений к несуществующим урлам. - Подсказки по регулярным выражениями в Поиске & Замене. - Улучшена проверка недостающих расширений php. - Обновлены все используемые js инструменты на последние версии. -------------------- |
|
|
Marik_rs |
4.9.2020, 21:35;
Ответить: Marik_rs
Сообщение
#8
|
|
О надо посмотреть. Давно искал что то подобное. Есть там на примете у меня несколько сайтов. Но как забрать не знал
|
|
|
archivarix
|
Сообщение
#9
|
|
|
В ближайшее время наша команда планирует запустить уникальный сервис https://archivarix.net/ru/ , сочетающий в себе возможности системы Веб Архива (archive.org) и поисковой системы.
Мы планируем проиндексировать главные страницы всех сайтов, которые когда либо были сохранены Веб Архивом. В нашей базе сайтов будет так же присутствовать архив различных метрик, таких как Alexa, Ahrefs, Majestic, ключевые слова, WHOIS домена и прочие исторические данные за все время существования сайта. Таким образом можно будет осуществлять поиск нужного сайта для восстановления дропов или для извлечения удалённого контента по огромному количеству параметров, таких как ключевые слова в тексте и в тегах, трафик на определённую дату, наличие исторических ссылок, неймсервера и так далее. С помощью этой системы можно будет делать выборки любой сложности, к примеру найти все домены, удалённые в 2018 году, в контенте которых содержались слова webmaster analytics, имевшие тогда Alexa rank менее 300k и которые имели более 30 уников в день по определённому ключевому слову в 2016 году. Наш сервис будет иметь удобный интерфейс для поиска нужных данных и будет содержать в себе скриншоты сайтов со всеми параметрами в виде графиков и таблиц. Следующим этапом развития системы будет индексация живых сайтов и расширение базы проиндексированного контента. Будут доступны для поиска медиафайлы и некоторые внутренние страницы сайта, выбранные по алгоритму учитывающему значимость этой страницы. В итоге система будет использовать преимущественно свою базу архивированных сайтов и станет не зависимой от Archive.org
-------------------- |
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Betatransfer.net - прием платежей для HIGH RISK проектов, интернет эквайринг и мерчант онлайн оплат | 55 | arendator | 35109 | Вчера, 2:12 автор: arendator |
|
A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров. | 354 | Forbidden | 279536 | 22.4.2024, 16:05 автор: AParser_Support |
|
366.cash - Обменник криптовалют онлайн | 7 | DenisP366 | 1906 | 21.4.2024, 16:14 автор: DenisP366 |
|
Прием платежей онлайн c Paykassma | Процессинг платежей с 2019 | Платежный шлюз | Merchant Accounts ✅✅✅ | 0 | paykassma | 465 | 16.4.2024, 13:45 автор: paykassma |
|
Онлайн магазин качественных аккаунтов Продажа аккаунтов - соц сети, почтовые, фрихостинг, популярных служб |
120 | Alanamana | 73186 | 5.4.2024, 7:35 автор: Alanamana |
Текстовая версия | Сейчас: 26.4.2024, 1:39 |