Вопрос по уникальности текста.

Re: Вопрос по уникальности текста.

Сообщение k0ttee »

Запили свой софт.

Сбор на вискас
btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9
ltc: LTsZ8f261j5qS5QUjn7ihzr37hziTvXeA4
Аватара пользователя
k0ttee

 
Группа: Специалист ruSEO
Сообщения: 12039
Рефералы: 2
Зарегистрирован: 02 май 2014
Средств на руках: 5.80
Re: Вопрос по уникальности текста.

Сообщение birds »

зачем он мне? и так заморочек хватает, не знаешь за что хвататься))
Аватара пользователя
birds
Администратор
 
Группа: Зарегистрированные пользователи
Сообщения: 20672
Рефералы: -208
Зарегистрирован: 24 авг 2010
Откуда: местный житель
Средств на руках: -7.67
Статус: летящий вперед
Спонсор
 
Re: Вопрос по уникальности текста.

Сообщение Amney »

Tehnik писал(а):Amney, Думаю, они их просто продают. Лишние деньги никому не помешают.
Расскажу как было дело у меня - я написал 5 статей, проверил их тут. Потом на месяц уехал. Возвращаюсь, ну и подарил подруге для нового сайта. А потом она мне пишет, что 4 из них есть уже на других сайтах. 4 из 5!!! Притом, что я их написал и только проверил так уникальность. Вот так вот.

Второй сервис я уже целенаправлено проверял. 2 статьи проверил, а потом отложил на неделю. Ничего, всё на месте. Работал потом с ним ещё много раз, всё было в порядке.

А текст.ру я теперь стороной обхожу.

Вот я и спросил, потому, что тоже как-то проверял текст свой на текст ру, ну поверил м забыл, текст никуда не выкладывал никуда, и вот вчера вспомнил и проверил его на текст.ру снова - уникальность 40%, а была 90%!

Добавлено спустя 51 секунду:
Шалят ребятки
Аватара пользователя
Amney

 
Группа: Специалист ruSEO
Сообщения: 3103
Зарегистрирован: 09 мар 2014
Откуда: Вечность
Средств на руках: 8.15
Статус: Адм-ие сер-ов,статьи
Re: Вопрос по уникальности текста.

Сообщение prolisk »

Я тоже часто проверял на text.ru, но свои статьи никогда нигде не проверяю.
еще на контентвотч редко смотрю, и давным давно на адвего плагиатус.

Где был скрипт массовой проверки, но опять же - через чье-то API.
Аватара пользователя
prolisk

 
Группа: Супермодераторы
Сообщения: 14498
Рефералы: 5
Зарегистрирован: 07 янв 2011
Откуда: С той стороны экрана.
Средств на руках: -0.20
Статус: django
Re: Вопрос по уникальности текста.

Сообщение bodnari94 »

Amney писал(а):Вот я и спросил, потому, что тоже как-то проверял текст свой на текст ру, ну поверил м забыл, текст никуда не выкладывал никуда, и вот вчера вспомнил и проверил его на текст.ру снова - уникальность 40%, а была 90%!

Добавлено спустя 51 секунду:
Шалят ребятки

На сайт переходили? Который выдавал потом где размещено?
Посмотреть даты побликации и т.д

Одно дело когда сервис просто в первый раз дал не верный результат проверки, другое когда и в правду полностью статью использовали и даты стоят свежие.

Добавлено спустя 3 минуты 15 секунд:
У меня часто бывает что в первый раз проверяю, показывает 100%, потом проверяю через несколько дней, показывает 0%, но размещено ещё в 2013г к примеру. Тупо в первый раз выдало не правильный результат проверки. Такое не массово происходит, но бывает когда большая очередь по проверкам и сервак не справляются с нагрузками.
Аватара пользователя
bodnari94

 
Группа: Интересующийся
Сообщения: 163
Зарегистрирован: 13 янв 2014
Средств на руках: 4.61
Статус: Вебмастер
Re: Вопрос по уникальности текста.

Сообщение k0ttee »

Единственная гарантия, что текст не похитит "проверяющий посредник" - отсутствие посредника между вами и поисковой системой.

Вообще в сети встречаются поделки для проверки, типа этой:
Код: Выделить всё
<?php
include_once('simple_html_dom.php');

$string='проверяемый текст';

$string=explode(".",$string);
$check_uniqueness=array();
foreach($string as $val) {
    if(strlen($val)>100) {
       $check_uniqueness[]=substr($val,0,100);
    }
}
 
$result_array=array();
foreach($check_uniqueness as $val) {
   $time=slice_text($val);
   if(!empty($time)) {
       $result_array = array_merge ($time, $result_array);
   }
}
 
shuffle($result_array);
$result_array = array_slice($result_array, 0,5);
 
foreach($result_array as $val) {
    $find_url=get_page_curl($val,"google");
    $html = str_get_html($find_url);
 
    foreach ($html->find(".onebox_result") as $node){
        $node->outertext = '';
    }
 
    foreach($html->find('div') as $element) {
           $str=strip_tags($element->innertext);
           $str=str_replace(" ","",$str);
           $element->innertext=$str;
    }
    $val_seach=str_replace(" ","",$val);
    if(preg_match("/$val_seach/is",$html)) {
        echo $val."\n";
    }
}
 
function slice_text($text) {
    $text=str_split($text,1);
 
    $find_array;
    $lit="";
    foreach($text as $val) {
        if(preg_match("/[A-Za-z0-9]| |\.|,/is",$val)) {
            $lit.=$val;
        } else {
            $find_array[]=$lit;
            $lit="";
        }
    }
    $find_array[]=$lit;
    foreach($find_array as $k=>$v) {
        if(strlen($v)<40) {
            unset($find_array[$k]);
        }
    }
    return $find_array;
}
 
function get_page_curl($text_search,$resource) {
    switch($resource) {
        case "google" :
            $url="http://www.google.com/search?hl=en&tbo=d&site=&source=hp&q=";
        break;
        case "yandex" :
            $url="http://yandex.ru/yandsearch?&text=";
        break;
    }       
    $useragent = "Opera/9.80 (J2ME/MIDP; Opera Mini/4.2.14912/870; U; id) Presto/2.4.15";
    $ch = curl_init ("");
    $text_search=urlencode($text_search);
    curl_setopt ($ch, CURLOPT_URL, $url.$text_search);
    curl_setopt ($ch, CURLOPT_USERAGENT, $useragent); // set user agent
    curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
    $output = curl_exec ($ch);
    curl_close($ch);
    return $output;
}
?>


На гите можно порыться. В исходном коде хоть можно выявить - куда программа отправляет данные, только в поиск или третьим лицам.
Код: Выделить всё
https://github.com/search?q=Plagiarism+Checker&type=Repositories
Сбор на вискас
btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9
ltc: LTsZ8f261j5qS5QUjn7ihzr37hziTvXeA4

За это сообщение автора k0ttee поблагодарили: 2
Amney, birds
Аватара пользователя
k0ttee

 
Группа: Специалист ruSEO
Сообщения: 12039
Рефералы: 2
Зарегистрирован: 02 май 2014
Средств на руках: 5.80
Re: Вопрос по уникальности текста.

Сообщение Amney »

оффтоп
k0ttee, кот, ты тут как старый, мудреный волшебник, ходишь по темам, махаешь палкой волшебной :D
Доступные VPS под киносайты Дешевые VPS и хостинг - проверено временем и на собственном опыте! Отлично хостимся уже третий год!Заметки сис. админа - уникальные посты
Аватара пользователя
Amney

 
Группа: Специалист ruSEO
Сообщения: 3103
Зарегистрирован: 09 мар 2014
Откуда: Вечность
Средств на руках: 8.15
Статус: Адм-ие сер-ов,статьи
Re: Вопрос по уникальности текста.

Сообщение k0ttee »

Amney, вжух и всё. :-D
Сбор на вискас
btc: 3Hq7X9CosVftRFPqWis1Dkk5MdtM1u6jj9
ltc: LTsZ8f261j5qS5QUjn7ihzr37hziTvXeA4
Аватара пользователя
k0ttee

 
Группа: Специалист ruSEO
Сообщения: 12039
Рефералы: 2
Зарегистрирован: 02 май 2014
Средств на руках: 5.80
Re: Вопрос по уникальности текста.

Сообщение hunter503 »

Кстати на счет слива статей сервисами вроде техт.ру. Как бы если у вас была статья с 90% уникальности, а через месяц она потеряла уникальность и стала = 45% это еще не говорит о том, что данный материал был слит.
Проверку следует выполнять иначе. Берем кусок текста, запиливаем его в кавычки и вставляем в поисковую строку. Если на выдаче есть сайт, где размещена эта статья, значит действительно сервис их сливает (но по собственному опыту скажу, что такого не встречал ни разу). Для более тщательной проверки берем кусок текста из каждого абзаца (если с первого раза найти не удается).
Если же была статья с уник=90, а стала с уник=45%, то получается сервис слил статью, но предварительно сделал рерайт что ли? Т.к. если бы статья полностью была размещена на другом проекте, уникальность была бы 0-10%.
Что же касается вопроса "кто спер мой текст?". Действительно в настоящее время контент имеет огромную ценность и многие мечтают получить его нахаляву. Однако для такого сервиса как техт.ру репутация думаю важнее. Что касается наличия работников, которые воруют статьи = это прям теория мирового заговора :-D.
Если же статья через месяц два теряет уникальность, думаю причины тут следующие:
1) Кто-то действительно написал материал похожий на ваш
2) Несколько изменился алгоритм сервиса подсчета уникальности

Замечал такую тенденцию конкретно в техт.ру. Если статья имеет уникальность = 100%, то данная уникальность сохраняется в течении всего времени. Бывало писал около 100 статей за месяц, проверяя каждую по мере написания. В итоге ни одна из статей написанных в первые дни работы не теряла уникальность.
А вот если уникальность статьи менее 100%, то уже на следующий день результат проверки может быть другим. Например, сегодня это 92%, а завтра уже 81%. Но это не говорит о том, что кто-то украл статью. Здесь скорее вопрос к сервису, каким образом он проверяет уникальность и с какими настройками. Сами подумайте что необходимо проверить ваш текст и сравнить его с миллионами других материалов. Поэтому и возникает такая разница.
Пишу о заработке в интернете здесь - http://vsetyrabota.ru/

За это сообщение автора hunter503 поблагодарили: 3
birds, k0ttee, Денчик
Аватара пользователя
hunter503

 
Группа: Специалист ruSEO
Сообщения: 1048
Зарегистрирован: 06 янв 2017
Средств на руках: 0.65
Статус: не указан
Re: Вопрос по уникальности текста.

Сообщение Tehnik »

hunter503, Статьи были размещены слово в слово. Как ни крути, но либо я дурак, либо они спёрли.

Есть ещё такое понятие как бритва оккама - самое впростое решение, обычно оказывается самым верным.

Про неадекватность модераторов на текс.ру я вообще молчу. Спорить с правилами из учебника русского языка будет только полный дебил.
Аватара пользователя
Tehnik

 
Группа: Супермодераторы
Сообщения: 7109
Рефералы: 3
Зарегистрирован: 08 май 2015
Откуда: Русь
Средств на руках: 34.75
Статус: Писатель
Пред.След.

Вернуться в Блоггинг

 


  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 18