Как проверить видео на уникальность в яндекс браузере
У меня два сайта — они регулярно наполняются новыми публикациями, которые нужно проверять на уникальность.
У меня под рукой всегда несколько бесплатных сервисов для проверки текста: у каждого есть свои особенности, поэтому одного часто бывает недостаточно. В этой статье я поделюсь опытом их использования и покажу на примере, как отличается оценка текстов разными алгоритмами.
Ключевые понятия
Чтобы выбрать подходящий сервис проверки текста, нужно научиться разговаривать с ними на одном языке. Расскажу об основных терминах, которые помогают разобраться в особенностях работы алгоритмов.
Уникальность указывает на пересечения текста с материалами других сайтов: с помощью этой характеристики можно узнать, какой объем текста больше нигде не встречается в интернете.
Важная деталь: при каждой новой проверке процент уникальности одного и того же текста может разниться. Разработчики объясняют это статистической погрешностью и с разницей в ответах поисковых систем на одни и те же запросы.
Шинглование — алгоритм проверки уникальности. Весь текст делится на равные шинглы — фрагменты от 2 до 7 слов, — и сервис сравнивает их со всеми проиндексированными сайтами в интернете. На некоторых сайтах можно настроить длину шингла, от которой и зависит суммарный процент уникальности всего текста.
Рерайт — искусственно переписанный текст: например, вместо «3 октября правительство изменило противопожарные правила» можно написать «3 октября 2019 года на государственном уровне были изменены противопожарные правила, вызвавшие большое волнение в обществе».
SEO-параметры. Удобно, если сервис оценивает не только уникальность, но и технические параметры текста. Например, определяет процент «воды» или «тошноты» — то есть находит слова, которые не несут никакой смысловой нагрузки или слишком часто повторяются.
Домены-исключения — сайты, совпадения с которыми учитываться не будут: некоторые сервисы предлагают настроить такую опцию.
Массовая проверка — возможность одновременно проверять несколько разных текстов: это экономит время, если работаешь с большим количеством авторов.
Вот сервисы, которыми я обычно пользуюсь: расскажу, чем они полезны и как могут дополнить работу друг друга.
Как победить выгорание
Курс для тех, кто много работает и устает. Цена открыта — назначаете ее самиAdvego Plagiatus
Платформы: десктоп-версия, браузер
Максимальная длина текста при бесплатной проверке: в десктопной версии — без ограничений, в браузере — 25 000 символов
Платные тарифы: после превышения ограничения — 1 Р за 1667 символов
По моему опыту, это один из лучших сервисов проверки уникальности: Advego Plagiatus находит даже спрятанный или хорошо переписанный рерайт. А вот проверять им слишком короткие тексты не рекомендую: алгоритм ошибочно учитывает штампы и устойчивые выражения и обязательно найдет множество источников заимствования.
В браузерной версии сервис предлагает меньше возможностей, чем в десктопной. Если хочется вручную настраивать шинглы и проверять большие тексты, придется скачивать программу: онлайн-версия позволяет проверить максимум 95 000 символов за раз. В десктоп-клиенте нет ограничений по объему проверяемого текста, но за одну проверку вам придется расшифровать несколько капч.
Скорость проверки текста одинаковая: сервис определит процент уникальности любого текста за несколько минут.
Платформы: браузер, телеграм-бот
Максимальная длина текста при бесплатной проверке: 15 000 символов
Платные тарифы: от 15 Р в день — цены различаются в зависимости от срока подписки и объема текста, который можно проверить в течение дня
Сервис проверяет тексты с помощью оригинального алгоритма: он работает без шинглования, поэтому хорошо определяет рерайт любой глубины и знает основные приемы, с помощью которых авторы обычно обманывают проверку на антиплагиат. Мусорными словами, перестановкой абзацев, изменением падежей, склонений и форм слов его не провести.
Еще сервис умеет оценивать SEO-параметры текста: например, может найти поисковые ключи и проверить, не слишком ли их много, или обнаружить бессмысленные конструкции, которыми автор искусственно увеличил объем материала. Текст можно отредактировать прямо в окне проверки — в других сервисах такое встречается не всегда.
Выбрать домены-исключения и провести массовую проверку в этой программе не получится. Еще один недостаток — очереди: с утра и днем сервис загружен и ждать оценки приходится долго — 7—10 минут.
Content Watch
Платформы: браузер
Максимальная длина текста при бесплатной проверке: 10 000 символов, максимум — раз в день
Платные тарифы: от 140 Р в месяц, за деньги можно увеличить количество знаков и проверок
Еще один сервис с собственными алгоритмами проверки. Инструмент распознает даже качественный рерайт и отличает цитаты от плагиата — это полезно при проверке рефератов, дипломов, диссертаций и докладов. В отличие от других сервисов, Content Watch проверяет не только текстовые фрагменты, но и сайты: одну страницу, все страницы или несколько нужных.
Content Watch позволяет добавить домены-исключения и провести массовую проверку, а вот с SEO-параметрами не работает.
Там, где Advego показывает уникальность 85%, Content Watch может выдать даже 95%. Это не принципиально, но знать о таких различиях важно, если вы проверяете чужие тексты: всегда уточняйте, каким сервисом оценивал свою работу автор.
Платформы: десктоп-версия, браузер
Максимальная длина текста при бесплатной проверке: 3000 символов до регистрации, 5000 — после
Платные тарифы: есть отдельная онлайн-проверка с ценой 1,5 Р за 1000 символов, максимум — 15 000 символов в одном тексте
eTXT — универсальный сервис: в нем можно проверить на уникальность не только текст, но и изображение.
Перед началом проверки нужно выбрать способ анализа: обнаружение копий или поиск дословных совпадений. В первом случае сервис будет искать точные совпадения с проверяемым текстом, а во втором — рерайт. По моим наблюдениям, eTXT отлично находит источники рерайта, но ошибается с показателями уникальности: например, у полностью заимствованного текста может показать схожесть около 85—90% вместо реальных 100%.
В десктопном приложении можно настроить параметры проверки: размер выборки, число слов в шингле и суммарное количество выборок. Скорость проверки зависит от длины текста: небольшие сервис обрабатывает мгновенно, а проверка объемных может занять несколько минут.
Массовой проверки, а также настройки SEO-параметров и доменов-исключений в eTXT нет.
Платформы: браузер
Максимальная длина текста при бесплатной проверке: 5000 символов до регистрации, 10 000 — после, в день можно проверить не больше 10 текстов
Платные тарифы: от 990 Р в месяц, за деньги можно увеличить количество проверок и провести SEO-анализ
Я люблю Pr-Cy за скорость: сервис проверяет текст быстрее аналогичных программ. Алгоритм умеет отличать цитаты от плагиата, но клише, шаблоны и устойчивые выражения отмечает как неоригинальные: добиться уникальности 100% на этом ресурсе практически невозможно.
Также сервис позволяет настроить SEO-параметры и домены-исключения, а вот массовой проверки в нем нет.
Тест первый: как хорошо и быстро сервисы найдут прямые заимствования
Для примера я проверил уже проиндексированный поисковыми системами текст, размещенный на сайте хостинга Beget. Вот его фрагмент:
Redis (REmote DIctionary Server) — сетевое журналируемое хранилище данных типа «ключ» — «значение» с открытым исходным кодом. По сути Redis представляет собой базу данных (как MySQL), только упрощенную и более быструю за счет отсутствия связи между данными, а также простому механизму работы с данными (подход noSql).
Сначала протестируем скорость проверки, затем — качество обнаружения чужого текста.
Первым с проверкой, ожидаемо, справился Pr-Cy. Он показал уникальность 10%, что даже слишком много для полной «копипасты».
Вторым по скорости был eTXT, и он показал уникальность 2%:
Advego Plagiatus пришел к финишу третьим и ожидаемо показал максимально точный результат — 0% уникальности:
Content Watch был четвертым и показал уникальность 14%:
Тест второй: как хорошо сервисы справятся с рерайтом
Чтобы определить рерайт, сервисы пользуются другими алгоритмами, чем при поиске точных заимствований. Проверим качество их работы на примере небольшого фрагмента текста о картине «Портрет Клариссы Строцци». Вот оригинал из «Википедии»:
«Портрет Клариссы Строцци» (итал. Ritratto di Clarissa Strozzi) — картина итальянского живописца Тициана периода Высокого Возрождения. Создана около 1542 года по заказу отца Клариссы, Роберто Строцци. Художественные особенности картины выделяют ее из общего ряда детских портретов середины XVI века. Ей присущи черты «официального портрета» (портрет в полный рост, богатое убранство комнаты, пейзаж за окном, классический барельеф, комнатная собачка), и вместе с тем изображения ребенка, именно как ребенка, а не как миниатюрного взрослого, что отражает наметившуюся в то время смену парадигмы идеи детства. Картина оказала значительное влияние на способы изображения детей в эпоху барокко. В XVIII веке с нее была сделана гравюра.
А вот что получилось у одного из авторов с биржи копирайтинга, который берет 30 Р за 1000 знаков:
«Портрет Клариссы Строцци» — это известная работа Тициана. На картине изображена девочка в белом платье с собачкой. Несмотря на серьезное убранство помещениях, ребенок здесь уже не преподносится как «взрослый» человек. Скорее это связано с идеями детства как неизбежного этапа жизни, особенно ярко появившимися именно в период Высокого Возрождения. Стоит отметить, что семья Строцци, на момент создания картины, была одной из самых известных во всей Флоренции и пользовалась большой влиятельностью в самых широких кругах населения.
Advego Plagiatus — 100% / 41%. Второй показатель демонстрирует «количество оригинального текста в процентах от общего объема текста»:
Content Watch — 78%:
Advego Plagiatus и Content Watch смогли распознать даже качественный рерайт: а вот другие сервисы даже не заподозрили, что проверяемый текст похож на какой-то другой.
Бонус: каких сервисов стоит опасаться
Кроме платформ, которые я перечислил, есть немало платных. Я не проверял тексты на них, но, судя по отзывам на независимых площадках вроде «Отзовика», их качество оставляет желать лучшего.
Говоря об оценке информации, важно осветить еще одну тему, а именно: как делать проверку (оценку) информации на уникальность. Для чего и в каких случаях нужно делать такую проверку?
Во-первых, всегда проверять свои материалы, чтобы не нарушить чьи-то авторские права, а попросту не стать «пиратом» со всеми вытекающими из этого последствиями (претензии и исковые требования авторов, потеря авторитета в глазах читателей и коллег…). А также, чтобы защитить свои права в случае несанкционированного использования ваших мтериалов.
Во-вторых, чтобы выявить первоисточник информации. Когда вы сделаете запрос на уникальность информации, то у вас появится список ресурсов, где эта информация встречается еще. Это позволяет определить по времени публикаций, анализу материалов авторство, кто первым опубликовал.
В-третьих, уникальные изображения в блоге, на сайте – признак солидности ресурса. Они повышают рейтинг в поисковых системах и увеличивают конверсию.
Рассмотрим несколько интернет-ресурсов для проведения такой проверки.
Проверка на уникальность изображений
Попробуем проверить на уникальность картинку часов, которую я взял из свободных клипартов в интернете для создания коллажа к обложке книги «Relax».
Получаем результат - 33 сайта из 2 с лишним миллионов сайтов, где искомая картинка имеется. Значит, эта картинка не уникальна. Адреса найденных сайтов можно увидеть на сервисе ниже окна результатов.
А как сделать ее уникальной? Изменим картинку или скомбинируем с другими картинками…. В качестве примера покажу это на картинке своей обложки для книги «Relax». Проверка на уникальность этой картинки-обложки дала результат - 0, картинка в процессе комбинирования не уникальной картинки с другими картинками, стала уникальной.
А вот еще результат проверки картинки, которую я рисовал для фильма о процессах запоминания. Этот фильм опубликован на этом канале.
Как видите НЕ "стырнеченные" материалы дают нулевый результат. А "часы" засветились 33 раза.
Проверка на уникальность текста
Перечислю лишь ресурсы, а как ими пользоваться – на тренинге.
· Биржа купли/продажи контента – Advego;
· Программа поиска в интернете частичных или полных копий текстового документа с интуитивным интерфейсом - Advego Plagiatus;
· Проверка текста на уникальность сервисом «CopyScape»;
· Анализатор Keyword density&prominence;
· Программа Дениса Каплунова TEXTUSPRO;
· программы eTXT Антиплагиат;
Самый простой и довольно эффективный способ проверки текста на уникальность – это использование сайтов поисковиков. Уверен, что вы не раз уже пользовались этими сервисами для поиска информации. При этом вы вставляли искомое слово или искомую комбинацию слов в поле поиска. Так вот, алгоритм проверки текста на уникальность через поисковые системы прост: вставляете из своей статьи фразу в поле поиска в кавычках слева и справа. Например, «мой текст».
Поисковик будет искать именно эту фразу, именно это сочетание слов. В результате мы может найти сайты, где искомая фраза повторяется.
Как со мной связаться:
Напишите мне, предлагайте свои идеи для рассылки и веб-сайта. Делитесь своим опытом. Задавайте вопросы. Рассказывайте о себе и своих успехах в обращении с информацией.
Пишите!
Не забывайте оценить статью!
- Cообщений: 818
- Поинты: 115
- Предупреждений: 0
- Онлайн: 36д 1ч 18м
Скачал не лицензионное (разрешенное для скачивания видео), переделал его в видео редакторе. где можно посмотреть на ютуб оно стало уникальным или нет?
Спасибо за ответ
Администрация форума не имеет отношения к пользователям форума и к публикуемой ими информации. Пользовательское соглашение- Cообщений: 507
- Поинты: 2
- Предупреждений: 20
- Онлайн: 11д 6ч 33м
поищи софт проверяющий на уникальность
- Cообщений: 451
- Поинты: 1 301
- Предупреждений: 0
- Онлайн: 3д 15ч 59м
Поиск по картинкам из видео либо тубо вбиваешь ключи того видео и смотришь в поисковике
Как экономить деньги на продвижении? Покупать из первых рук!
partner.soc-proof — именно то, что тебе нужно. SМM панель, у которой покупают все уже более 6 лет.
Самая низкая стоимость на любые услуги:
- Телеграм Подписчики от 17 Р, Просмотры - бесплатно
- Инстаграм лайки от 3 Р, YouTube лайки от 20 Р
Просмотры, комментарии, подписчики, лайки, репосты для ВК, YouTube, Instagram, Facebook, Telegram, Я.Дзен, ТикТок. Гарантированно лучшие цены от создателя услуг. Качественно - не значит дорого.
Присоединяйся. Будь частью лучшего.
- Cообщений: 818
- Поинты: 115
- Предупреждений: 0
- Онлайн: 36д 1ч 18м
поищи софт проверяющий на уникальность
Я о другом, когда загружаешь видео он пишет где оно имеется. Не помню что нажимать, чтобы найти в самом ютубе
такого нет
Я о другом, когда загружаешь видео он пишет где оно имеется. Не помню что нажимать, чтобы найти в самом ютубе
У меня при копировании видео - просто при просмотре в рекомендованных такое же видео, там откуда я скопировал
Скачал не лицензионное (разрешенное для скачивания видео),
Такого нет, если ты про лицензию СС под видео - это никак не подтверждает первоисточник видео, например, видео без этой лицензии может быть спокойно залито до, и после чужого перелива выставлена эта пометка.
Не стало, исходя из твоих же слов. "Чужое". Или ты нечто другое под уникальностью понимаешь. Если полная переработка и лишь взяты некоторые кадры, это уже другое.переделал его в видео редакторе. где можно посмотреть на ютуб оно стало уникальным или нет?
Спасибо за ответ
такого нет
Я о другом, когда загружаешь видео он пишет где оно имеется. Не помню что нажимать, чтобы найти в самом ютубе
Такой "функции" в ютубе для пользователей никогда не было, скорее всего ты путаешь с : 1. Загрузка видео защищенного системой контент айди.
однако, даже в этом случае, если никаких предупреждений не высвечивается, "уникальным" оно у тебя не станет. Контент айди выдают не всем.
2 вариант - есть опция для Авторов. У каналов в студии инструмент поиска совпадений , он находит копии авторских видео , в которой видны все перелитые ролики Даже если изменяют, виден % совпадений
Вряд ли кто-то сможет достоверно ответить на этот вопрос. По логике 100% уникальности не может быть в природе. Так как выдумать текст на 5-6к символов не использовав при этом популярных конструкций очень сложно.
Поэтому уникальность в пределах 80-95% я считаю нормальной.
zonar:Хочется выяснить а как смотрит на это яндекс.
Никак он на это не смотрит.
zonar:Стоит ли вообще убиваться так чтобы ее переиначивать до 100
Это как Вам нравится. Исключительно по желанию.
Уникальность вообще очень понятие относительное. Все, что по этим сервисам более 50% уникальности, уникально по определению, хотя это справедливо и для более низких параметров.
Выше писали, что уникальности в 100% не бывает в принципе. Соглашусь.
ТС, есть не только программная уникальность, но и смысловая. Вот она должна точно присутствовать в тематиках, где есть рерайт рерайта рерайта. Думаю, в будущем и это научатся определять и анализировать.
с чего вы взяли что яндекс вообще интересуется уникальностью текста, тем более в таком примитивном виде как это считают сервисы?
сам яндекс несколько лет назад заявлял о внедрении алгоритма определяющего смысл текста независимо от того какими словами он написан
+сервис уникальных текстов в вебмастере не функционирует
можно догадываться что яндексу наплевать на уникальность
Выше все верно сказали про уникальность, это МИФ )
Плевать всем на уникальность, только слова в неправильном порядке можно расставить что бы получить уникальный текст, все уже обо всем написали.
Но прям идти и тупо копировать текст у конкурента с топа тоже не нужно
adel92:
Выше все верно сказали про уникальность, это МИФ )
Плевать всем на уникальность, только слова в неправильном порядке можно расставить что бы получить уникальный текст, все уже обо всем написали.
Но прям идти и тупо копировать текст у конкурента с топа тоже не нужно
Берете текст с топ яндекс, обязательно ЯНДЕКС, смотрите у кого что там есть. Сразу 10-ть топовых сайтов берите и собирайте сборную солянку, так чтобы как можно больше информации было, чтобы шире тему раскрыть. Далее чуток текст переделывайте и вуаля.
И никого из них там не жалейте, я Вас уверяю, они туда именно так и попали!
kcusha:
Берете текст с топ яндекс, обязательно ЯНДЕКС, смотрите у кого что там есть. Сразу 10-ть топовых сайтов берите и собирайте сборную солянку, так чтобы как можно больше информации было, чтобы шире тему раскрыть. Далее чуток текст переделывайте и вуаля.
И никого из них там не жалейте, я Вас уверяю, они туда именно так и попали!
и я про тоже. отсюда потом и появляются 5 метровые портянки)))
стройка стоматология и женские вообще жуть сплошная пока почитаешь статью уснешь)))
zonar:и я про тоже. отсюда потом и появляются 5 метровые портянки)))
стройка стоматология и женские вообще жуть сплошная пока почитаешь статью уснешь)))
А вот яндекс с вами думаю не согласится. Он только и работает над улучшением алгоритма. Постоянно вводит новые правила, Баден-Баден вот недавно запустил, все для пользователей. А вы все недовольны :)
Мне тоже кажется, что 100% уникальность - миф. И хотя многие тексты проверенные через text говорят о 100%, сама я отношусь к этому с сомнением.
эднат:Мне тоже кажется, что 100% уникальность - миф. И хотя многие тексты проверенные через text говорят о 100%, сама я отношусь к этому с сомнением.
Ну я с пъяну точно могу 100% уникальность написать. Жалко только что поисковики уникальность не ценят 🍿
У меня два сайта — они регулярно наполняются новыми публикациями, которые нужно проверять на уникальность.
У меня под рукой всегда несколько бесплатных сервисов для проверки текста: у каждого есть свои особенности, поэтому одного часто бывает недостаточно. В этой статье я поделюсь опытом их использования и покажу на примере, как отличается оценка текстов разными алгоритмами.
Ключевые понятия
Чтобы выбрать подходящий сервис проверки текста, нужно научиться разговаривать с ними на одном языке. Расскажу об основных терминах, которые помогают разобраться в особенностях работы алгоритмов.
Уникальность указывает на пересечения текста с материалами других сайтов: с помощью этой характеристики можно узнать, какой объем текста больше нигде не встречается в интернете.
Важная деталь: при каждой новой проверке процент уникальности одного и того же текста может разниться. Разработчики объясняют это статистической погрешностью и с разницей в ответах поисковых систем на одни и те же запросы.
Шинглование — алгоритм проверки уникальности. Весь текст делится на равные шинглы — фрагменты от 2 до 7 слов, — и сервис сравнивает их со всеми проиндексированными сайтами в интернете. На некоторых сайтах можно настроить длину шингла, от которой и зависит суммарный процент уникальности всего текста.
Рерайт — искусственно переписанный текст: например, вместо «3 октября правительство изменило противопожарные правила» можно написать «3 октября 2019 года на государственном уровне были изменены противопожарные правила, вызвавшие большое волнение в обществе».
SEO-параметры. Удобно, если сервис оценивает не только уникальность, но и технические параметры текста. Например, определяет процент «воды» или «тошноты» — то есть находит слова, которые не несут никакой смысловой нагрузки или слишком часто повторяются.
Домены-исключения — сайты, совпадения с которыми учитываться не будут: некоторые сервисы предлагают настроить такую опцию.
Массовая проверка — возможность одновременно проверять несколько разных текстов: это экономит время, если работаешь с большим количеством авторов.
Вот сервисы, которыми я обычно пользуюсь: расскажу, чем они полезны и как могут дополнить работу друг друга.
Как победить выгорание
Курс для тех, кто много работает и устает. Цена открыта — назначаете ее самиAdvego Plagiatus
Платформы: десктоп-версия, браузер
Максимальная длина текста при бесплатной проверке: в десктопной версии — без ограничений, в браузере — 25 000 символов
Платные тарифы: после превышения ограничения — 1 Р за 1667 символов
По моему опыту, это один из лучших сервисов проверки уникальности: Advego Plagiatus находит даже спрятанный или хорошо переписанный рерайт. А вот проверять им слишком короткие тексты не рекомендую: алгоритм ошибочно учитывает штампы и устойчивые выражения и обязательно найдет множество источников заимствования.
В браузерной версии сервис предлагает меньше возможностей, чем в десктопной. Если хочется вручную настраивать шинглы и проверять большие тексты, придется скачивать программу: онлайн-версия позволяет проверить максимум 95 000 символов за раз. В десктоп-клиенте нет ограничений по объему проверяемого текста, но за одну проверку вам придется расшифровать несколько капч.
Скорость проверки текста одинаковая: сервис определит процент уникальности любого текста за несколько минут.
Платформы: браузер, телеграм-бот
Максимальная длина текста при бесплатной проверке: 15 000 символов
Платные тарифы: от 15 Р в день — цены различаются в зависимости от срока подписки и объема текста, который можно проверить в течение дня
Сервис проверяет тексты с помощью оригинального алгоритма: он работает без шинглования, поэтому хорошо определяет рерайт любой глубины и знает основные приемы, с помощью которых авторы обычно обманывают проверку на антиплагиат. Мусорными словами, перестановкой абзацев, изменением падежей, склонений и форм слов его не провести.
Еще сервис умеет оценивать SEO-параметры текста: например, может найти поисковые ключи и проверить, не слишком ли их много, или обнаружить бессмысленные конструкции, которыми автор искусственно увеличил объем материала. Текст можно отредактировать прямо в окне проверки — в других сервисах такое встречается не всегда.
Выбрать домены-исключения и провести массовую проверку в этой программе не получится. Еще один недостаток — очереди: с утра и днем сервис загружен и ждать оценки приходится долго — 7—10 минут.
Content Watch
Платформы: браузер
Максимальная длина текста при бесплатной проверке: 10 000 символов, максимум — раз в день
Платные тарифы: от 140 Р в месяц, за деньги можно увеличить количество знаков и проверок
Еще один сервис с собственными алгоритмами проверки. Инструмент распознает даже качественный рерайт и отличает цитаты от плагиата — это полезно при проверке рефератов, дипломов, диссертаций и докладов. В отличие от других сервисов, Content Watch проверяет не только текстовые фрагменты, но и сайты: одну страницу, все страницы или несколько нужных.
Content Watch позволяет добавить домены-исключения и провести массовую проверку, а вот с SEO-параметрами не работает.
Там, где Advego показывает уникальность 85%, Content Watch может выдать даже 95%. Это не принципиально, но знать о таких различиях важно, если вы проверяете чужие тексты: всегда уточняйте, каким сервисом оценивал свою работу автор.
Платформы: десктоп-версия, браузер
Максимальная длина текста при бесплатной проверке: 3000 символов до регистрации, 5000 — после
Платные тарифы: есть отдельная онлайн-проверка с ценой 1,5 Р за 1000 символов, максимум — 15 000 символов в одном тексте
eTXT — универсальный сервис: в нем можно проверить на уникальность не только текст, но и изображение.
Перед началом проверки нужно выбрать способ анализа: обнаружение копий или поиск дословных совпадений. В первом случае сервис будет искать точные совпадения с проверяемым текстом, а во втором — рерайт. По моим наблюдениям, eTXT отлично находит источники рерайта, но ошибается с показателями уникальности: например, у полностью заимствованного текста может показать схожесть около 85—90% вместо реальных 100%.
В десктопном приложении можно настроить параметры проверки: размер выборки, число слов в шингле и суммарное количество выборок. Скорость проверки зависит от длины текста: небольшие сервис обрабатывает мгновенно, а проверка объемных может занять несколько минут.
Массовой проверки, а также настройки SEO-параметров и доменов-исключений в eTXT нет.
Платформы: браузер
Максимальная длина текста при бесплатной проверке: 5000 символов до регистрации, 10 000 — после, в день можно проверить не больше 10 текстов
Платные тарифы: от 990 Р в месяц, за деньги можно увеличить количество проверок и провести SEO-анализ
Я люблю Pr-Cy за скорость: сервис проверяет текст быстрее аналогичных программ. Алгоритм умеет отличать цитаты от плагиата, но клише, шаблоны и устойчивые выражения отмечает как неоригинальные: добиться уникальности 100% на этом ресурсе практически невозможно.
Также сервис позволяет настроить SEO-параметры и домены-исключения, а вот массовой проверки в нем нет.
Тест первый: как хорошо и быстро сервисы найдут прямые заимствования
Для примера я проверил уже проиндексированный поисковыми системами текст, размещенный на сайте хостинга Beget. Вот его фрагмент:
Redis (REmote DIctionary Server) — сетевое журналируемое хранилище данных типа «ключ» — «значение» с открытым исходным кодом. По сути Redis представляет собой базу данных (как MySQL), только упрощенную и более быструю за счет отсутствия связи между данными, а также простому механизму работы с данными (подход noSql).
Сначала протестируем скорость проверки, затем — качество обнаружения чужого текста.
Первым с проверкой, ожидаемо, справился Pr-Cy. Он показал уникальность 10%, что даже слишком много для полной «копипасты».
Вторым по скорости был eTXT, и он показал уникальность 2%:
Advego Plagiatus пришел к финишу третьим и ожидаемо показал максимально точный результат — 0% уникальности:
Content Watch был четвертым и показал уникальность 14%:
Тест второй: как хорошо сервисы справятся с рерайтом
Чтобы определить рерайт, сервисы пользуются другими алгоритмами, чем при поиске точных заимствований. Проверим качество их работы на примере небольшого фрагмента текста о картине «Портрет Клариссы Строцци». Вот оригинал из «Википедии»:
«Портрет Клариссы Строцци» (итал. Ritratto di Clarissa Strozzi) — картина итальянского живописца Тициана периода Высокого Возрождения. Создана около 1542 года по заказу отца Клариссы, Роберто Строцци. Художественные особенности картины выделяют ее из общего ряда детских портретов середины XVI века. Ей присущи черты «официального портрета» (портрет в полный рост, богатое убранство комнаты, пейзаж за окном, классический барельеф, комнатная собачка), и вместе с тем изображения ребенка, именно как ребенка, а не как миниатюрного взрослого, что отражает наметившуюся в то время смену парадигмы идеи детства. Картина оказала значительное влияние на способы изображения детей в эпоху барокко. В XVIII веке с нее была сделана гравюра.
А вот что получилось у одного из авторов с биржи копирайтинга, который берет 30 Р за 1000 знаков:
«Портрет Клариссы Строцци» — это известная работа Тициана. На картине изображена девочка в белом платье с собачкой. Несмотря на серьезное убранство помещениях, ребенок здесь уже не преподносится как «взрослый» человек. Скорее это связано с идеями детства как неизбежного этапа жизни, особенно ярко появившимися именно в период Высокого Возрождения. Стоит отметить, что семья Строцци, на момент создания картины, была одной из самых известных во всей Флоренции и пользовалась большой влиятельностью в самых широких кругах населения.
Advego Plagiatus — 100% / 41%. Второй показатель демонстрирует «количество оригинального текста в процентах от общего объема текста»:
Content Watch — 78%:
Advego Plagiatus и Content Watch смогли распознать даже качественный рерайт: а вот другие сервисы даже не заподозрили, что проверяемый текст похож на какой-то другой.
Бонус: каких сервисов стоит опасаться
Кроме платформ, которые я перечислил, есть немало платных. Я не проверял тексты на них, но, судя по отзывам на независимых площадках вроде «Отзовика», их качество оставляет желать лучшего.
Читайте также: