«99% текстового контента через пять лет может быть доверено ИИ»: интервью с сооснователем YAi Digital Вячеславом Лукиным

Фото: 123rf.com
Фото: 123rf.com

Резкий прорыв в развитии генеративного искусственного интеллекта моментально взбудоражил рынок труда: создатели контента массово бросились подыскивать себе дополнительные источники заработка. Но насколько реальны перспективы того, что уже скоро многие потеряют работу из-за ИИ? Компания YAi Digital планирует в сентябре выпустить на рынок приложение ContentLift, которое не создает контент, а форматирует его под поставленные пользователем задачи, причем с упором на маркетинг, и с его помощью любой устаревший контент можно будет оживить и наполнить новыми смыслами. Мы встретились с Вячеславом Лукиным, техническим директором и сооснователем компании, чтобы, во-первых, выяснить все плюсы и минусы нового приложения, а во-вторых, узнать, стоит ли контентмейкерам в ближайшей перспективе переучиваться на другую профессию или их опасения преждевременны. 

— Какие три профессии в сфере цифрового контента исчезнут или кардинально изменятся из-за ИИ в ближайшие пять лет?

— Думаю, в ближайшие пять лет ни одна профессия не исчезнет полностью, но спрос на некоторые будет снижаться. Все зависит от развития технологий. Например, специалисты по созданию видеоконтента — операторы и монтажеры — могут стать менее востребованными. Уже сейчас появляются инструменты, позволяющие создавать видео голливудского качества прямо с ноутбука, без камер и дополнительного оборудования. Пока это не стало массовым, но через два-три года такие решения будут распространены повсеместно. По некоторым оценкам, более 90% текстового контента в этом году будет создано с помощью ИИ. Через пять лет этот показатель может достигнуть 99%. Однако качество пока оставляет желать лучшего: ИИ не умеет читать мысли и точно воплощать задуманное. Поэтому останутся специалисты, которые будут редактировать, корректировать и адаптировать контент под конкретные задачи. Копирайтеры и контент-специалисты не исчезнут, но их роль изменится: вместо написания текстов с нуля они будут заниматься их доработкой, проверкой и приведением в соответствие с брендом. Наша задача — создать инструменты, которые сократят время на рутинную работу.

— Какие направления или ниши останутся защищенными от ИИ?

— Это универсальное правило для любой индустрии: чем глубже экспертиза, тем меньше вероятность, что ИИ быстро ее заменит. Речь идет о креативности, способности анализировать информацию и находить неочевидные решения. Также защищенными останутся области, где критически важны закрытые данные или специфические знания. Например, оборудование мобильных операторов для обработки цифровых сигналов — информация о таких технологиях не находится в открытом доступе. Чтобы ИИ мог работать в этой сфере, его нужно долго и тщательно обучать, особенно если речь идет о критической инфраструктуре. Здесь требуется валидация и гарантии, что система справляется с задачами на высоком уровне.

— Могут ли малые бизнесы полностью заменить контент-команды вашими инструментами?

— В ближайшей перспективе — нет, и у нас такой цели нет. Мы стремимся повысить эффективность маркетинговых команд, а не заменить людей. Возможно, через несколько лет технологии достигнут такого уровня, но это зависит от их развития. Креативный процесс требует придумывания, а ИИ пока лучше справляется с повторением, чем с созданием чего-то принципиально нового. Поэтому наша задача — помочь людям тратить меньше времени на рутину и больше на творчество, а не заменять их.

— Какие ниши в создании контента еще не заняты ИИ? Где вы видите потенциал для стартапов?

— В области создания контента конкуренция везде высокая, особенно если речь идет о видео. Если говорить про текстовый контент, то, мне кажется, в лонг-формате (документы, книжки) ее меньше. Одна из проблем — технические ограничения самой технологии: большие языковые модели (LLM) не позволяют это сделать, потому что нельзя сделать контекстное окно в миллионы токенов, чтобы загрузить полностью книгу и с ней работать. Потому что кроме текста уже ничего больше не поместится, а нужно еще промпт написать, получить ответ. Это отталкивает компании, потому что нужно придумывать, как обходить такое ограничение. Это не так просто. С другой стороны, есть понимание, что и сам формат отмирает. Но пока еще рынок есть.

— Что бы вы посоветовали сделать владельцу иностранного стартапа, который планирует выйти на британский рынок?

— Для каждого продукта, индустрии будет своя уникальная история, универсального совета нет. Но основное — нужно физически находиться в Британии, встречаться и общаться с людьми, чтобы получить уровень доверия. Здесь это особенно актуально, рукопожатия очень важны. То есть нужно быть готовым приехать сюда, участвовать в конференциях, презентовать свой продукт, компанию, создавать определенный бренд, в том числе личный, персональный. Важно быть очень сфокусированным, четко понимать, кто покупатель, кто целевая аудитория, и искать точечно таких людей, выходить с ними на контакт, знакомиться и разговаривать, получать обратную связь. Для меня это в свое время сработало, я смог дойти до первой продажи даже в условиях санкций. 

— Помогла ли британская экосистема (гранты, акселераторы) вам в развитии? Как вы оцениваете регуляторную политику Британии в сфере искусственного интеллекта? 

— Расскажу о нашем опыте. Мы взаимодействуем с Innovate UK — госструктурой, помогающей стартапам и компаниям привлекать инвестиции, запускать пилотные проекты и так далее. Мы подавались на несколько грантов, но не привлекли через них деньги. Это связано тем, что у британского искусственного интеллекта есть основные направления для развития — строительство, медицина, создание беспилотников и чипов. Это глубокие технологии, требующие много времени и финансовых вложений для тестирования и создания прототипов. Маркетинг в приоритетную сферу деятельности не входит. Нам даже отказали в патенте технологии, потому что она не связана с каким-то реальным сектором экономики. Сложилось такое неправильное отношение к маркетингу, что в нем нельзя сдать deeptech, поэтому и сложно привлечь госинвестиции. Сейчас мы попали в программу Innovate UK Business Growth, у нас появилось несколько эдвайзеров, которые помогают нам правильно упаковать продукт, чтобы его можно было представлять, в том числе и на гранты, и через их нетворк тестировать разные гипотезы на другой целевой аудитории. Например, помимо маркетинговых агентств, которые являются основной целевой аудиторией нашего продукта, продавать технологию университетам. То есть сейчас мы работаем в связке с Innovate UK, но будет ли результат и какой, пока сложно сказать.

Однозначно понятно, что регуляция в большей мере тормозит, чем помогает, потому что есть довольно трудные вещи, связанные с ИИ, особенно если мы говорим про направление responsible AI (системы искусственного интеллекта, учитывающие этические, правовые и социальные последствия применения ИИ.— Прим. ред.). Это требует значительных инвестиций в upfront, то есть начальные затраты, а также развитие и разработку продукта. Любой стартап так делает, мы в том числе, и это нормально. Мы не можем сделать что-то на коленке, показать пользователю, получить обратную связь и начинать продавать. Поэтому возникает вопрос: какая часть регулирования находится в серой зоне, когда еще нет четких требований? С одной стороны, постоянно дорабатываются какие-то стандарты, особенно в области ИИ, с другой стороны, меры регулирования могут замедлять стартап — например, есть жесткие требования по безопасности, связанные с хранением и передачей данных (здесь мы зависим от специфики работы провайдера). Такие вещи, конечно, тормозят развитие, потому что приходится инвестировать время не в него, а в подготовку договоров, пользовательских соглашений и так далее.

— Есть ли особенности британского рынка, которые повлияли на архитектуру ваших приложений, например локализация, интеграция в местные сервисы?

— С позиции интеграции влияния нет, потому что мы пытаемся строить международный продукт, который можно будет использовать в любой части мира. Но языковая локализация, конечно, есть. Она сразу необходима, потому что даже британский и американский английский различаются. Если мы выводим продукт, где нет британского английского, на рынок Британии, то к нему отношение сразу будет определенное. Поэтому одна из первых функций — мы разделили британский и американский английский, чтобы пользователь мог выбрать.

— YAi Digital вошел в топ-100 ИИ-компаний Великобритании по версии F6S, крупнейшей международной площадки для поиска программ и привлечения инвестиций, объединяющей более 4 млн стартапов и инвестфондов. Что, на ваш взгляд, стало ключевым фактором в вашем успехе? 

— Здесь сложилось несколько факторов, один из которых — это то, что мы работаем в довольно инновационной области с технологиями (генеративный ИИ, ChatGPT), связанными с большими языковыми моделями. Мы создаем продукт в сфере маркетинга под таким углом, под которым, наверное, еще немногие смотрят на языковые модели. В первую очередь LLM используется для создания различного контента — текста, картинки, видео, аудио,— но мало кто задумывается о его качестве: будет ли он интересен, востребован, читабелен, достигнет поставленной цели или нет? Цель нашего стартапа — сделать некий инструмент для того, чтобы понимать, соответствует ли задачам то, что создает LLM. Поможет ли контент, например, в конкретном маркетинге продвигать продукт, доносить его ценность пользователю? И чтобы это понять, нужно разложить понятие качества на метрики, показатели, которые потом можно измерить. Например, взять блог или статью и попросить искусственный интеллект оценить его с точки зрения качества, установив необходимые вводные (компания, бренд, продукт), чтобы достичь определенной целевой аудитории. Система анализирует текст, резюмирует, где контент соответствует поставленным задачам, а какую его часть необходимо доработать, и предлагает рекомендации с правками и причинами. Компаний, создающих контент, множество, и все говорят, что у них он качественный, но чтобы понять это качество, его нужно уметь измерять. Мы как раз и работаем над этой измеряемой частью.

— Как вы тестируете эффективность, какие метрики применяются?

— Мы специализируемся на маркетинговом контенте. У меня есть два кофаундера, которые более пятнадцати лет занимаются маркетингом. Они обладают высоким уровнем экспертности. И мы строим метрики исходя из их экспертизы. Мы пытаемся понять, что важно для маркетингового контента. Контент бывает разных форматов: длинный (книги, документы), короткий (социальные медиа), и для каждого будут свои метрики. Например, если это короткий пост в соцсетях, то должен быть высокий коэффициент вовлеченности, взаимодействия с аудиторией, лонгрид должен быть читабельный, понятный, без жаргонизмов. Вся специфика маркетингового контента раскладывается на метрики с помощью доменной экспертизы нашего маркетолога. Он оценивает сильные и слабые стороны текста и вносит свою корректуру, затем этот набор данных загружается в ИИ, который использует, по сути, доменную экспертизу живого человека, чтобы потом оценивать контент примерно в таком же формате.

— Получается, что маркетологи за счет своего опыта обучают ИИ-модель, правильно?

— Прямого обучения а-ля «учитель — ученик» у нас пока нет, но передача экспертизы через данные для ИИ в некоем виде и формирование программного обеспечения с пониманием этой экспертизы происходит.

— ContentLift позиционируется как инструмент для оживления устаревшего контента. Как именно ИИ анализирует, обновляет материалы, обеспечивает точность фактов (например, в новостях или научных текстах)? Приведите примеры такого спасения контента.

— Одно из ценностных предложений продукта — можно взять устаревший контент, загрузить в нашу интерактивную систему, работающую с участием пользователя (мы делаем ИИ-помощника, который будет помогать в работе, а не ИИ-агента, который все делает сам), где документ анализируется по нашим метрикам. Сейчас их в системе четыре: читабельность, понятность, фактчекинг (проверка источников, ссылок) и стиль подачи (tone of voice). Например, у вас есть контент, который написан формальным языком для госструктур, но сейчас этот продукт больше востребован на рынке B2C. Для актуализации его нужно переписать. Загружаем текст на платформу ContentLift, меняем стиль с формального на дружеский, к примеру. Система анализирует текст и предлагает замены, пользователь проходит по всем корректировкам и выбирает в ручном режиме: какие нравятся, оставляет, а какие нет, удаляет. Затем переходим к следующей метрике, например фактчекингу. Это сложный механизм — для начала, ИИ-помощник работает с поисковой системой, пытается найти разные источники информации. При этом он ранжирует источники по достоверности. Если это, например, New York Times или научный журнал, он присвоит высокую степень доверия такому источнику, если это неизвестный ресурс, то низкую. В зависимости от этого делается кроссреференс: информация в тексте проверяется дважды — сначала по поисковой системе сам текст, а потом ссылка на его источник. Если информация не подтверждается, то помощник сразу указывает, что ее нельзя использовать. Если мэтчится, то он говорит: все хорошо, это можно использовать. 

— Почему вы выбрали июль и август для бета-тестирования продукта, несмотря на сезон отпусков? 

— Есть две причины. Первая — это закрытое бета-тестирование, в котором участвуют порядка тридцати пяти пользователей (маркетологи, представители бизнеса). Мы с ними обсудили время и получили положительный отклик: июль и август — это период, когда у бизнеса затишье, и у них будет возможность спокойно поработать с нашей системой. Вторая причина — в сентябре мы планируем делать презентацию нашего продукта. Возможно (это пока на уровне идеи), мы ее проведем в формате хакатона для маркетологов, копирайтеров и контентмейкеров (пока мероприятия в таком формате проводились только для айтишников). 

— Вы отметили важность стиля подачи. Как ИИ учится адаптировать его под разные бренды?

— В системе будут две метрики. Tone of voice (нейтральная относительно бренда) — метрика по идентификации стиля контента. Brand voice — определенный гайдлайн, брендбук, то, как это должно быть написано для бренда. И тогда мы можем сравнить. Мы определили, что текст написан в неформальном стиле, например, а нужно в профессиональном. Система определяет по двум моментам — доменной экспертизе и работе с данными. Чем больше данных для обучения у нас есть, тем нам проще получить высокое качество, но это небыстрый процесс. Сейчас мы больше работаем с доменной экспертизой, что доступнее в моменте. Потенциально система не будет зависеть от доменного эксперта. Набрав достаточный объем данных, она будет принимать решения на их основе самостоятельно.

Яна Лапицкая, Джесси Конфлон и Вячеслав Лукин, сооснователи YAi Digital

— Кто ваши главные конкуренты в британском сегменте ИИ-контента и приложений? В чем уникальность YAi Digital?

— Конкуренты есть, и это хорошо. Потому что если нет конкурентов, то, возможно, и рынка нет. Уникальность заключается в команде — большой опыт в запуске стартапов с нуля, высокая техническая экспертиза в маркетинге. Одно из ключевых отличий — это фокус на качестве контента. Изначально, при запуске, мы планировали сделать продукт, который позволит быстро создавать контент (таких предложений на рынке много). На стадии разработки продукта мы поняли, что создавать контент могут все, а качественно с ним работать — единицы. 

Вам может быть интересно

Все актуальные новости недели одним письмом

Подписывайтесь на нашу рассылку