Как отличить текст, написанный нейросетью, от авторского

Анастасия Семенчинская /
10.05.2023

В сети с каждым днём становится всё больше статей, сгенерированных нейросетью. И порой он настолько хорошо написаны, что их легко спутать с авторскими. На самом деле любой машинный текст можно выявить по нескольким признакам (если, конечно, с ним не поработал хороший редактор). Расскажем, как отличить текст нейросети от авторского, какие сервисы в этом помогут, и зачем вообще это нужно.

Зачем проверять текст на генерацию нейросетью?

Нейросети быстро генерируют тексты, чем серьёзно экономят владельцам сайтов время и ресурсы. Они пишут сео-тексты, заполняют карточки товаров, подбирают метатеги к статьям и даже пишут лонгриды.

Однако кроме удобства такие статьи могут принести сайту немало проблем. Например, они плохо ранжируются поисковиками – Google из-за низких технических показателей считает их бесполезными и отправляет в самый низ поисковой выдачи. А значит, читатели могут их просто не увидеть.

Кроме того, некоторые читатели интуитивно определяют «искусственный» текст, и просто закрывают страницу – им больше нравится читать живой «человеческий» текст. Поэтому охваты у сайта с текстами ИИ будут падать. Чтобы не столкнуться с неприятными последствиями, машинные тексты нужно либо редактировать, либо сразу выбирать вместо них авторский контент.

7 признаков того, что текст написала нейросеть

Пока искусственный интеллект не научился на 100% имитировать естественную человеческую речь, в его текстах легко можно отыскать «маркеры» машинного текста. Мы выявили 7 признаков, по которым можно понять, что текст сгенерировала нейросеть.

1. Поверхностно, без углубления в тему

У нейросетей недостаточно экспертности, чтобы написать действительно «глубокий» текст. Она берёт релевантный опыт миллионов людей из своей базы и генерирует на его основе новую уникальную статью. Поэтому тексты получаются шаблонные, без конкретики и глубокого погружения в тему.

О том, что текст написала нейросеть, говорят:

  • клише, общие фразы, вода («всем известно», «широкий ассортимент», «высокое качество»);
  • отсутствие анализа и рассуждений, просто перечисление фактов;
  • несвязные, непоследовательные предложения.

Так получается, потому что робот пишет тексты на основе закономерностей, которые увидел в своей базе из миллиардов тысяч символов. Не всегда они содержат конкретику и полезную информацию. Если отредактировать такой текст и оставить только главное, он может сократиться в 2-3 раза.

2. Неэмоциональные тексты

Нейросети не испытывают эмоций, не могут творчески мыслить и придумывать новые идеи. Если при генерации не задавать стиль текстов, они всегда получаются примерно в одной стилистике – формальные, сухие, излишне вежливые, без эмоций и метафор. При чтении текста ИИ создаётся ощущение, будто читаешь Википедию технической инструкции или статьи с Википедии.

Если попросить ИИ добавить эмоции, он это сделает и даже сможет поставить себя на место человека. Но текст всё равно получится неестественным, например:

Наша команда победила в финале чемпионата благодаря своей превосходной игре и усилиям. Мы гордимся нашей командой и надеемся на большие успехи в будущем.

Авторский текст более живой, в нём есть сравнительные обороты и рассуждения, а не только факты. Даже если он написан в нейтральном стиле, за ним чувствуется эмоция и попытка вовлечь аудиторию.

3. Смысловые, фактические ошибки

Чтобы сгенерировать текст, ИИ берёт информацию из всех возможных источников, в том числе устаревших, неточных и даже фейковых. Выглядит такой текст правдоподобно, но это не значит, что факты в нём достоверные. Например, ChatGPT любит придумывать несуществующие достопримечательности, праздники, города, додумывать исторические факты.

Пример от нейросети:

Люди могут летать на Луну каждый день благодаря развитой космической технологии.

На самом деле это не так – люди всего 6 раз успешно высадились на Луну. Нейросети обычно не ссылаются на первоисточники, поэтому не получается сразу проверить факты на достоверность. Если человек не погружен в тему, при проверке статьи он может пропустить критическую ошибку.

4. Неуместные повторы

Явный признак того, что текст сгенерированный – неуместные повторы. Нейросети строят предложения на основе предыдущих высказываний, и иногда повторяют простые фразы, даже если это не имеет смысла. К середине текста могут повторяться целые словосочетания или даже предложения.

Например:

Я хотел бы рассказать вам о своей собаке. Моя собака – это золотистый ретривер по кличке Бобби. Он очень любит играть в мяч и бегать за мячом.

В авторском тексте, если он хорошо вычитан, не бывает необоснованных повторов. Там используются синонимы и аналогии, с которыми нейросеть обращаться не умеет. Вообще у ИИ словарный запас весьма ограничен, несмотря на большую базу.

5. Сложно для восприятия

Современные авторы стараются писать в инфостиле, простым и понятным языком. У нейросети такой цели нет – её тексты всегда полны сложных модальных конструкций, из-за которых читать статью становится трудно.

Пример от нейросети:

С воцарением зимы наступает сезон не только холодов, но и пониженного настроения у значительного количества людей, что связано с изменениями в длительности дневного света.

Воспринимать текст нейросети сложно ещё и из-за длины предложений. Они составляются по шаблону, поэтому длина всегда примерно одинаковая. Люди же пишут неравномерно – длинные предложения сменяются короткими, за счёт чего текст становится динамичным.

6. Несогласованность текста

ИИ использует разные источники информации, мнения в которых могут не совпадать друг с другом. Поэтому иногда нейросети дают противоречивые ответы на один и тот же вопрос или по-разному преподносят тему даже внутри одной статьи.

Например, по теме влияния соцсетей на психическое здоровье один источник рассмотрит плюсы – соцсети помогают общаться, чувствовать связь с близкими и т.д. Другой сосредоточится на негативе – зависимость, усиление чувства одиночества и прочее. Нейросеть может объединить источники таким образом, что две части статьи будут друг другу противоречить.

Хороший копирайтер таких ошибок не допускает – он придерживается одного мнения с самого начала и до конца статьи. Если взгляд на тему противоречивый, он либо напишет две статьи, либо корректно преподнесёт обе точки зрения.

7. Технические параметры

Нейросеть уже научилась писать тексты с уникальностью 100%, а вот другие параметры пока проигрывают авторским текстам. В машинном тексте много воды, переспама, завышен процент академической тошноты по Advego. Общий риск стандартного машинного текста по сервису Тургенев – от 10 до 13, что считается критическим показателем. Чтобы алгоритмы поисковиков подняли такой текст в выдаче, придётся подгонять все эти параметры вручную.

Как определить ИИ-текст с помощью сервисов

Программы, которые выявляют тексты от нейросетей, стали популярны почти одновременно с самими нейросетями. Это такие же языковые модели, только обученные на подборках пар текстов: один написан человеком, второй – искусственным интеллектом.

Такие инструменты анализируют загруженную статью, находят закономерности в длине предложений и выявляют паттерны ИИ-текста. После этого в процентном соотношении выдают вероятность того, что текст сгенерирован роботом.

Сейчас пользуются популярностью 5 таких инструментов:

  • GPTZero – простой и эффективный сервис, сейчас считается одним из самых точных детекторов ИИ-контента;
  • AI-Classifier – инструмент от создателей ChatGPT, выпущен в феврале 2023 года и пока на стадии тестирования;
  • Content at Scale – создан экспертом в области SEO и контент-маркетинга, проверяет тексты по трём показателям: предсказуемость, вероятность, шаблонность;
  • SEO.ai – работает по 4 разным моделям обнаружения контента ИИ, но поддерживает только английский язык;
  • GLTR – анализирует тексты по предсказуемости следующего слова, угадывает статьи от ИИ в 66% случаев.

Все сервисы бесплатные. Правда, они либо вообще не работают с русскоязычными текстами, либо неверно их распознают. С англоязычными тоже бывают проблемы – например, AI-Classifier в 9% случаев заявляет, что авторский текст на английском написал робот. Пользоваться можно, но с осторожностью и критическим подходом.

Отличить текст нейросети от авторского может быть сложно, но не невозможно. Уникальные слова и фразы, эмоциональная окраска, конкретика, глубокое погружение в тему говорят о том, что текст писал человек. Но нейросети с каждым днем становятся всё более продвинутыми, и в будущем отличить авторский текст от машинного может быть ещё сложнее.

Оставьте комментарий
Ваш адрес email не будет опубликован. Обязательные поля помечены *
Запишитесь
на консультацию!

от 5000 руб.

записаться

Свяжитесь с нами,
и мы поможем решить вашу задачу!