Настоящая угроза новостному бизнесу — искусственный интеллект (The Washington Post, США)

Материалы ИноСМИ содержат оценки исключительно зарубежных СМИ и не отражают позицию редакции ИноСМИ

Искусственный интеллект стал угрозой для новостного бизнеса, пишет WP. СМИ смогут вернуть себе статус ведущего поставщика достоверного контента, только если смогут создавать эксклюзивную информацию, проверять и дополнять ее, отмечается в материале.

Джим Альбрехт (Jim Albrecht)

Новостная индустрия всегда ругала новые технологии, будь то радио или телевидение, Интернет или генеративный искусственный интеллект. В конце концов, газеты долгое время обладали монополией на распространение информации, и с каждым нововведением эксклюзивность франшизы снижается.

Читайте ИноСМИ в нашем канале в Telegram

Эта проблема касается и меня лично. Последние семь лет я руководил командой в компании Google, которая занималась тем, чтобы сделать веб-экосистему благоприятнее для новостных изданий. Мы создавали продукты для удешевления производства дорогостоящей публицистики (предоставляя им передовые инструменты анализа документов с использованием искусственного интеллекта), упрощения покупки пользователями подписки и предоставления издателям возможности демонстрировать редакционную точку зрения и, таким образом, эффективнее находить аудиторию. Благодаря этому издания всего мира получили многомиллиардную прибыль.

Но это не отменило факта обесценивания периодики Интернетом. Раньше, чтобы узнать результат спортивных матчей, котировки акций, время показа фильмов, место проведения гаражных распродаж и расписание концертов, люди заглядывали в газету. Теперь всю эту информацию можно быстро найти в Интернете. Если раньше у потребителей было 20 причин купить газету, то теперь осталась всего одна — новости, то есть трудоемкая и дорогостоящая работа, с которой рекламодатели не особенно рады ассоциироваться.

Чтобы противостоять такому повороту событий, новостные издания (поначалу в Европе, а затем и по всему миру) начали обращаться к регулирующим органам и законодателям с просьбой помочь восстановить былое господство — или хотя бы рентабельность. И мне предстояло выяснить, как на эти требования отреагирует Google.

Издания жаловались, что веб-платформы вроде Google и Facebook* обкрадывают их, публикуя заголовки и рекламные объявления со ссылкой на их статьи. Глупый шаг, ведь универсальная истина Интернета гласит: трафик нужен всем! Только посмотрите, сколько времени и денег издания тратят на размещение на этих платформах своих ссылок и контента, а потом еще и приплачивают компаниям по поисковой оптимизации и менеджерам соцсетей за популяризацию. Мы оказались в малопонятной ситуации, когда одни говорят: “Вы воруете у нас статьи”, а другие требуют размещать их ссылки как можно чаще и выше в поиске.

ChatGPT и наука: система искусственного интеллекта обрела настоящую мощь в 2023 году — как добрую, так и злуюНейросети и искусственный интеллект (ИИ) наделали много шума и даже смогли попасть в научный рейтинг, в котором обычно отмечают только людей, пишет Nature. Технология ознаменовала собой начало революции генеративного ИИ. И пути назад уже нет.

07.01.202400

Это не значит, что у новостных изданий вообще не было реально законных жалоб: до 2017 года Google редко давал ссылки на статьи с платным доступом, что наносило ущерб той модели подписки, на которую начинали полагаться веб-издания. Подборка новостных результатов была несовершенной: иногда сайт, подготовивший кропотливый оригинальный репортаж, размещался ниже менее авторитетного ресурса, который просто взял и быстренько переписал эту сенсационную информацию; и вообще пользователей интересовали только заголовок, а не переход по ссылке к самой статье. Google исправил первый пункт и добился устойчивого прогресса во втором, но совершенно бессилен в отношении третьего — битвы, которую дизайнеры обложек и редакторы передовиц десятилетиями вели еще до появления Интернета.

В любом случае, регулирующие органы в ответ предложили платформам платить изданиям за каждое размещение заголовка/подводки, а иногда и за саму ссылку. По мере распространения этих правил по миру — в Европе, Австралии, Индонезии, Бразилии, Канаде — я тратил все больше времени на подготовку к отключению новостных продуктов и поисковиков, а также созданию систем учета для фиксации “сниппетов” (фрагмент исходного текста или кода программы, применяемый в поисковых системах и текстовых редакторах. – Прим. ИноСМИ) и расчета платежей. Соответственно, на предоставление журналистам средств исследования и копирования и на создание механизмов для удержания подписчиков времени оставалось все меньше.

Что касается Facebook*, то обмен данными с новостными изданиями падал с каждым годом. Есть известный экономический факт: когда берешь вещь с установленной рыночной ценой и продаешь дороже, то спрос падает. До принятия этих законов никто никогда не спрашивал разрешения на создание ссылки на веб-сайт и не платил за это. Наоборот: если кому-то и платили, то стороне, разместившей ссылку. Почему? Потому что трафик нужен всем! В конце концов, именно поэтому реклама процветает везде: как у изданий, так и у платформ. Они предлагают рекламодателям распространение, и те им платят, потому что распространение имеет ценность и редко бывает бесплатным.

Между тем, большие языковые модели (LLM) приблизились к воспроизведению задач на уровне человека. Во многих продуктах начали появляться функции на основе LLM: проверка грамматики, автозаполнение и так далее — и это работало. Для меня наблюдение за тем, как издания препираются из-за места в поисковике, пока LLM тихо, но стремительно развиваются, — все равно что наблюдать за перепалкой из-за цветочных композиций для свадьбы под открытым небом на фоне бесшумно приближающейся большой грозовой тучи.

А затем, словно раскат грома, возник ChatGPT, и все стало на свои места. Проблема никогда не состояла в том, что платформы размещают ссылки на новостные статьи — им это положено. Проблема в том, что новые технологии создали среду, в которой им, возможно, вообще не нужно делать отсылок к новостным сайтам — они могут просто взять новость, попросить нейросеть переписать ее и опубликовать на собственной платформе.

И мир внезапно перевернулся для меня с ног на голову. Скоро абсурдное требование новостных изданий об оплате трафика вытеснит не менее абсурдное предложение от индустрии высоких технологий: “Как насчет того, чтобы мы создали продукт на основе вашего контента, а трафика взамен перенаправляли мало или вообще нисколько?”. В долгосрочной перспективе ни одна из этих иррациональностей не выстоит. Они либо зачахнут ввиду собственной экономической абсурдности, либо попадут под прицел судов, законодателей и регулирующих структур.

Но, увидев воочию, сколь беспомощно последние выстроились в очередь за первым из этих предложений, я полагаю, что дело дойдет и до второго. Ставки максимально высоки. По одну сторону конфликта находится экзистенциальный риск для издательской индустрии; по другую —для технологических инноваций.

Сначала идут суды. В декабре газета New York Times дала первый залп, подав иск против OpenAI и Microsoft за нарушение авторских прав, начиная с использования ее документов при обучении LLM.

Вполне вероятно, что первый раунд выиграют IT-компании. ИИ-продукты преобразуют текст в геометрические соотношения, которые принципиально отличаются от новостных сюжетов, откуда были взяты, и заменить оригинал этим математическим “векторам” не под силу. Иными словами, LLM, похоже, проходят проверку на добросовестное использование.

Только внедрив модель в потребительский продукт наподобие чат-бота или поисковой системы, можно увидеть потенциальное нарушение авторских прав. В конце концов, LLM может создавать вариации любого текста. Но даже несмотря на их очевидную способность заменять оригиналы, на которых обучалась модель, они все же представляют собой лишь вариации — сродни рерайтингу, к которому часто прибегают разного рода издания (обратите внимание: Times в своем иске представляет доказательства того, что ChatGPT абзацами цитировал ее контент — явное нарушение авторских прав, — но это можно легко исправить, как и рерайтеров можно научить не переписывать материалы из других источников дословно). Более того, не бывает авторских прав на факты. И все же, как защитить права производителей контента?

Ответ, как мне кажется, в том, что LLM склонны выдумывать нереальное, и их обучение настолько дорого обходится, что модели обновляются не днями или неделями, а месяцами. Как указывает в иске Times, продукты с генеративным ИИ, как правило, полагаются на так называемое “обоснование”, в ходе которого изречения нейросети сверяют с соответствующими исходными документами, чтобы исключить выдумки. Этот процесс особенно важен, если пользователь спрашивает о недавнем событии, в котором на момент обучения LLM соответствующих фактов не существовало. В таких случаях ИИ может дать точный ответ только в том случае, если извлекает факты из свежих обосновывающих документов. Они-то и есть суть работы, которую выполняют газеты (поиск и сообщение новых фактов), и плоды этого труда должны принадлежать тем, кто его осуществляет.

Выборы в 77 странах в 2024 году: победит ли на них искусственный интеллект?Избиратели 77 стран мира в этом году столкнутся с дезинформацией с использованием искусственного интеллекта, пишет AM. Инструменты ИИ доступны каждому, позволяя создавать фейковый контент, фальшивые голоса, фото и видео и манипулировать поведением людей, отмечает автор статьи.

04.02.202400

Суды могут счесть, а могут и не счесть убедительным различие между обучением и обоснованием. Если не сочтут, Конгресс будет обязан вмешаться. Законодательно закрепляя защиту авторских прав на контент, используемый ИИ в целях обучения, Конгресс получает возможность создать систему авторского права, которая достигает многих конкурирующих социальных целей. Это позволит продолжать внедрение инноваций в области искусственного интеллекта посредством обучения и тестирования LLM; это потребует лицензирования контента, который ИИ-приложения используют для проверки высказываний и поиска новых фактов; а лицензионные платежи позволят финансово поддерживать и стимулировать важнейший элемент работы СМИ — поиск и проверку новой информации — вместо того, чтобы заставлять технологическую индустрию платить за переписывание уже давно известной информации.

Такое законодательство предоставит изданиям новые возможности для получения дохода. Если обучение LLM сочтут правомерным, а обоснование — нет, способность изданий проверять информацию и дополнять ее актуальными фактами станет не просто ценной, но и потенциально эксклюзивной. Небольшая местечковая медиакомпания может предпочесть лицензировать статьи и фактическую информацию для услуг генеративного ИИ, а крупная медиакомпания — предложить подписчикам собственный дифференцированный ИИ-сервис на основе OpenID или Google API, но обогащенный при этом недоступной другим поставщикам конфиденциальной информацией. Такая услуга станет для подписчиков более своевременной, всеобъемлющей и актуальной, чем собственные продукты поставщиков технологий, и позволит изданиям вернуться к тем категориям информации, в которых они последний раз эффективно конкурировали в далекую эпоху расцвета печати.

Если суд или Конгресс возьмут и действительно перепишут таким образом правила, на что будет похож мир новых СМИ? Во-первых, чтобы воспользоваться преимуществами новой структуры, медиакомпаниям необходимо понять, что ожидания потребителя вот-вот кардинально изменятся.

В эпоху печатных изданий статьи создавались, печатались на бумаге и распространялись среди читателей. Интернет изменил все, что касалось распространения и бумаги, в то время как сам контент остался нетронутым. Но в будущем изданиям придется больше думать не о статьях, а о коммуникации с пользователем. Последний будут все меньше и меньше взаимодействовать с самими статьями и вместо этого обсуждать новости с теми, кого в технологической индустрии раньше называли “интеллектуальными агентами”.

Еще в 1990-х компания Microsoft представила Clippy — анимированную улыбчивую скрепку, которая хлопает глазами и прерывает вас в неподходящий момент вопросом, не нужна ли помощь. И хотя Microsoft давно положила конец ее страданиям, идею, как это часто бывает, в конце концов подхватила IT-индустрия.

Новое поколение Clippy на базе LLM будет делать все то, о чем в 1996 году Microsoft могла только мечтать: информировать вас о новостях, распорядке дня и электронных письмах; отвечать за вас и на ваши вопросы; помогать в работе. Однажды вы проснетесь и узнаете, что “The Washington Post объявила о запуске нового ИИ-помощника по имени Марти”. На запрос о дополнительной информации вам предложат получить его прямо сейчас на правах подписчика. Марти присоединится к беседе и расскажет о последних новостях, ответит на вопросы с помощью соответствующей инфографики, проинформирует о политических сплетнях и порекомендует новый сериал на основе ваших интересов (поскольку вы подписчик, он знает, что вам нравится). “Не поможешь найти ресторан в четверг вечером?” — спросите вы, и Марти расскажет о лучших заведениях в округе и предложит в одном из них скидку.

Конечно, в реальности все может сложиться совсем иначе, в зависимости от исхода текущих споров об авторских правах и способности изданий представить будущее, совершенно непохожее на все, что они знали прежде. Но одно можно сказать наверняка: как и 30 лет назад в случае с Интернетом, эти детали определят то, удастся ли новостному бизнесу вернуть себе статус ведущего поставщика достоверной информации или же он придет в окончательный, необратимый упадок.

*деятельность Meta (соцсети Facebook и Instagram) запрещена в России ка экстремистская