30 ноября 2022 года в открытом доступе появился ChatGPT,
Учитывая истории успешного использования ИИ, на первый взгляд его применение в бизнесе выглядит вполне перспективно. Но, поскольку речь идёт о текстах, то остро встаёт вопрос об их качестве, ведь низкокачественный контент на сайте компании может повлечь репутационные и финансовые риски.
В этой статье попробуем разобраться, насколько качественный текст выдаёт ИИ на русском языке, и стоит ли публиковать его на сайте.
Мы провели исследование, во время которого попросили ChatGPT написать несколько текстов на разные темы: про стоматологию, парикмахерское дело, ремонт помещений, музыкальные инструменты и биохимию. Полные версии текстов, которые написал ChatGPT, зафиксированы в документе, а далее в статье приведены отдельные примеры.
Готовые тексты проверили на уникальность и удобочитаемость. А потом подключили несколько специалистов из разных ниш, чтобы они оценили правдивость контента.
На старте мы столкнулись с парой ограничений:
В ответ на замечание ChatGPT сказал:
«Извините, если мой предыдущий ответ не был полезен. Как языковая модель, я не имею доступ к актуальной или будущей информации про тренды цвета в дизайне или цвета года. Мои знания основаны на информации, которая была доступна в период обучения, т. е. в 2021. Я рекомендую проконсультироваться с профессиональными дизайнерами или поискать, чтобы узнать об актуальных трендах цвета в 2023».
Кстати, сейчас на стартовой странице чата появился дисклеймер о том, что ИИ использует базу данных с информацией по 2021 год.
Для проверки придумали несколько тем и попросили экспертов задать вопросы. В результате у нас получилось 10 текстов разного объёма, уникальность которых мы замерили с помощью трёх разных сервисов: text.ru, Advego, Antiplagiarism.net.
В среднем, уникальность текстов — 96 %. Самые низкие показатели у рецепта — в среднем 85 %. Но для этой ниши это нормальная цифра, так как объём текста небольшой, а названия ингредиентов и шагов вида «пожарьте», «смешайте» пересекаются со многими другими материалами в сети.
В плане уникальности текста ChatGPT показал себя отлично. А ещё такой результат демонстрирует, что отличить текст, созданный ИИ, от написанного человеком по проценту уникальности не получится.
|
|
text.ru | Адвего | Antiplagiarism.net | ||
---|---|---|---|---|---|---|
1 |
|
100 % | 98 % | 99 % | ||
2 |
|
100 % | 94 % | 97 % | ||
3 |
|
100 % | 91 % | 96 % | ||
4 |
|
100 % | 97 % | 97 % | ||
5 |
|
100 % | 98 % | 98 % | ||
6 |
|
100 % | 88 % | 100 % | ||
7 |
|
100 % | 76 % | 78 % | ||
8 |
|
100 % | 94 % | 94 % | ||
9 |
|
100 % | 100 % | 100 % | ||
10 |
|
100 % | 98 % | 100 % |
Пока мы проверяли тексты ИИ на уникальность, возник закономерный вопрос: «Что будет, если два разных человека спросят об одном и том же?» Его мы и задали ChatGPT. Вот что он ответил:
— Есть ли вероятность, что если этот же вопрос задаст другой пользователь, ты предоставишь такой же текст?
— Как у искусственного интеллекта, у меня нет личного опыта или воспоминаний, поэтому я не способен вспомнить конкретные взаимодействия в прошлом или ответы. Тем не менее я был создан, чтобы предоставить последовательную и точную информацию по широкому кругу вопросов. В связи с этим возможно, что информация, которую я предоставляю в ответ на конкретный вопрос, может совпадать с информацией, которую я предоставляю другому пользователю, задающему тот же или похожий вопрос. Если у вас
Получается, ChatGPT генерирует практически на 100 % уникальный текст, но при этом он не гарантирует, что через неделю, месяц или полгода
Следующий параметр, который мы оценивали, — правдивость текста. Он, на наш взгляд, самый важный для текстов, потому что люди приходят на сайты компаний за ответами. В связи с этим ошибки в фактах и «вредные советы» могут навредить репутации бренда и повлечь финансовые потери. Только представьте, что на сайте, например, производителя детского питания для аллергиков размещены ошибочные рекомендации. В целом, это щекотливая тема для всех ниш, где присутствует влияние на здоровье и благополучие человека.
Правдивость текста важна и для того, чтобы исключить риски с точки зрения SEO. Например, Google использует алгоритм
Результаты анализа оказались смешанными. С текстами на общие темы — «Какие закуски подходят к белому вину» и «Как узнать количество подписчиков
Чтобы оценить тексты на узкоспециализированные темы, мы привлекли несколько специалистов и попросили их прокомментировать ответы ИИ. Важное уточнение — эксперты в одной и той же сфере могут иметь разное мнение и следовать разным подходам, поэтому мы всегда советуем привлекать тех специалистов, которым вы доверяете. Нам помогали те, кому верим мы.
Вопрос: «Чем отличаются лигатурные брекеты от самолигирующих брекетов?»
Фрагмент ответа: «Лигатурные брекеты и самолигирующие брекеты — это два разных типа брекетов, которые используются в стоматологии для исправления неправильной позиции зубов. Хотя они используются для одной цели, они отличаются друг от друга несколькими ключевыми особенностями.
Лигатурные брекеты — это традиционный тип брекетов, которые состоят из металлической рамки, которая фиксируется на внешней стороне зуба. Они требуют использования цемента или адгезивного материала для крепления к зубу, и их нельзя снимать самостоятельно. Лигатурные брекеты часто используются для исправления серьезных нарушений формы и позиции зубов, таких как криворотые зубы или скользкие клыки.
Самолигирующие брекеты — это более совр {обрыв текста}».
Комментарий практикующего
Такой текст точно не должен попасть ни на сайт клиники, ни на любой другой
Вопрос: мы попросили ChatGPT рассказать про особенности липидных масок для волос.
Ответ: «Липидные маски для волос отличаются от обычных масок в первую очередь тем, что содержат в своем составе масла и эмульгаторы. Это позволяет им сохранять влагу в волосах и улучшать их структуру. Обычные маски, как правило, не содержат таких компонентов и не способны дать такой же эффект.
Липидные маски хорошо подходят для тех, у кого сухие и поврежденные волосы. Они способны устранить сухость и шелушение, восстановить структуру волос и сделать их более упругими и эластичными. Обычные маски, напротив, менее эффективны в увлажнении и питании волос, поэтому чаще всего используются для обычного ухода за здоровыми волосами».
Комментарий эксперта. Как оказалось, эксперт задала вопрос с подвохом. Дело в том, что все маски для волос липидные, а разница между ними в том, что отдельные группы липидов более эффективны, чем другие. ИИ же нашёл несколько различий — двойка за ответ.
Второй вопрос: попросили ИИ рассказать, кто придумал технику окрашивания Airtouch.
Ответ: ChatGPT считает, что автор техники — компания L'Oreal.
В этом же ответе ИИ решил описать технику Airtouch, хотя его не просили:
«Она представляет собой специальную технологию окрашивания, которая использует баллон с газом, чтобы разбавить краску и сделать ее более легкой и нежной для волос. Это позволяет достичь более естественного результата окрашивания, который менее вреден для волос и кожи головы».
Комментарий эксперта. ИИ ошибся с автором техники, на самом деле авторство принадлежит В. Б. Сарбашеву (патент от 2020 года, товарный знак AIRTOUCH зарегистрирован в 2018 году).
Описание самой техники тоже неверно:
Вопрос: «Какую штукатурку использовать в ванной комнате для выравнивания стен для последующей облицовки кафельной плиткой?»
Фрагмент ответа: «В ванной комнате рекомендуется использовать штукатурку, специально разработанную для таких условий. Она должна быть морозоустойчивой, водонепроницаемой и устойчивой к высокой влажности. Такие штукатурки обычно содержат специальные добавки, которые помогают защитить стены от грибка и бактерий».
Комментарий эксперта. Мастер по отделке с тринадцатилетним стажем работы остался в недоумении, прочитав текст. ИИ советовал выбирать морозоустойчивый материал и разделял штукатурку на два вида: с гладкой поверхностью и шероховатой. Возможно, ChatGPT перепутал базовую и финишную штукатурку, но в любом случае этот ответ нельзя считать правильным.
Вопрос: «Чем отличаются Precision и Jazz Bass?»
Фрагмент ответа: «Оба эти
Precision Bass (также известный
Jazz Bass (также известный
Комментарий эксперта. Музыкант, который играет на инструменте около 25 лет, сказал, что текст на удивление неплохой.
Пожалуй, это единственный ответ на вопрос специалиста, который не содержит фактических неточностей.
Вдохновившись статьёй про качественные ответы ChatGPT на тест по микробиологии, мы решили задать вопрос ещё и по биохимии.
Вопрос: «Сравни специфические пути метаболизма углеводов и липидов».
Фрагмент ответа: «Специфические пути метаболизма углеводов и липидов различаются по нескольким основным признакам.
Метаболизм углеводов включает в себя такие процессы, как гликолиз, кислотный путь Кребса и Энтерик и окисление глюкозы в порядке преобразования углеводов в энергию, необходимую для функционирования организма.
Метаболизм липидов включает в себя такие процессы, как окисление жиров, глицеролиз
Комментарий доктора наук, заведующей кафедрой биохимии медицинского института. Ответ не впечатлил эксперта:
С точки зрения правдивости качество текста оставляет желать лучшего. Во всяком случае на текущем этапе развития ИИ.
В целом все тексты можно назвать читабельными. Тем не менее мы заметили ряд серьёзных проблем:
Но одна из самых больших проблем, на наш взгляд, это обилие «воды». Часто в текстах много лирики и мало полезной информации,
Наш опыт работы на проектах показывает, что тексты должны быть и удобными для чтения, и правдивыми, и уникальными одновременно. Когда тексты ещё и отвечают рекомендациям
ChatGPT и ИИ в целом оставляют неоднозначное впечатление. Тексты очень похожи на «человеческие», да и уникальность радует. Однако есть вероятность, что другому человеку на тот же вопрос ИИ может сгенерировать идентичный ответ.
Фактическая составляющая хромает на обе ноги. Проблема заключается в отсутствии актуальной базы данных и правдивости в целом. В основном эксперты не были готовы поставить «пятёрку» или даже «четвёрку» ответам ChatGPT.
В статьях довольно много «воды», которая усложняет восприятие информации и не даёт пользователю то, ради чего он пришёл на сайт. С точки зрения SEO и здравого смысла важно не писать текст ради текста. Если контент не несёт полезной информации, он почти наверняка не нужен на странице.
Если у компании есть tone of voice, могут возникнуть проблемы с тем, чтобы объяснить ChatGPT, что именно от него хотят.
Для тематик, которые оказывают влияние на здоровье и благополучие человека, мы не рекомендуем использовать автоматически сгенерированные тексты. Если пропустить
В таком случае целесообразнее или сразу писать тексты силами эксперта, а потом отдавать на вычитку редактору, или интервьюировать специалиста, а потом отдавать автору черновой контент для доработки. Например, у нас был опыт, когда автор ездил на встречи со специалистами клиники, чтобы получить материал для статьи, а потом писал статью с настоящими фактами.
По состоянию на конец декабря 2022 года это многообещающий сервис, который однозначно может быть полезен, ведь его функциональность не ограничивается только созданием статей. Но полноценно использовать его в нынешнем виде вместо хороших копирайтеров, к сожалению, не получится. Учитывая огромный интерес к теме и перспективность инструмента, почти наверняка его будут постепенно дорабатывать, поэтому будем внимательно наблюдать за его дальнейшим развитием.
Записали Мария Лем, Лариса Васина
Отредактировала Лариса Васина
18 января 2023
Устройство агентства
Презентация подходаУстройство агентства
Правила выживания для стажёров и сотрудниковУстройство агентства
Оценка 360: взгляд на сотрудника глазами коллегИнструменты
Кластеризатор ключевых слов на Power QueryПродолжая пользоваться сайтом, вы принимаете соглашение о передаче данных.