
Представители компании Gartner назвали дипфейк (технологию, позволяющую выполнять реалистичную подмену видео-, фото-, аудио- и других материалов посредством нейросетей) трендом следующего года. Многих взбудоражила эта новость, так как подобная тенденция может породить массу фальшивок и дать зеленый свет мошенникам, которые и без того заполонили Сеть.
Но так ли все на самом деле, как может показаться на первый взгляд? С какой целью планируется массовое использование данной технологии, опасны ли дипфейки и какие результаты может дать их популяризация? Со всем этим попробуем разобраться в нашем обзоре.
В чем суть генеративного ИИ?
Одним из стратегических трендов 2022-го представителями Gartner был назван некий генеративный ИИ. Специалисты пояснили, что речь идет о методах обработки всевозможной информации посредством интеллектуальных технологий с целью формирования новых, уникальных материалов.
Первое, что приходит на ум, – дипфейки. Это контент, созданный посредством использования генеративно-состязательных нейросетей, которые генерируют новые материалы на основе заданного набора.
Дипфейки используются повсеместно, особенно когда создаются фото- и видеоматериалы юмористического характера. Подменять можно абсолютно все, например, лицо одного человека подставить к телу другого. Можно менять голоса, движения губ, мимику и многое другое.
Но далеко не всегда подобные трансформации вызывают смех и умиление. Особенно несладко приходится тем, кого они касаются напрямую. Например, берется лицо какой-то девушки и соединяется с неприглядным телом пожилой женщины и вдобавок ко всему искажаются улыбка, мимика и пр. Неоднократно встречались случаи, когда пользователи видоизменили людей с целью мести, например, делая их героями порнофильмов.
Общество содрогнулось, увидев статистику, продемонстрированную специалистами Gartner. Последние уверены, что через 3-4 года дипфейки займут около 10% от всего контента и данных, находящихся в Сети. Это огромная цифра, поэтому возникает вполне закономерный вопрос: неужели стратегическим трендом развития технологий эксперты считают приближающуюся “лавину фальшивок”?
Специалисты Gartner успокаивают интернет-пользователей, уверяя, что все далеко не так, как может показаться на первый взгляд. На самом деле использование генеративного ИИ имеет множество преимуществ и открывает новые перспективы, о которых ранее могли только говорить.
Вторая сторона медали
Эксперты подчеркивают, что возможности искусственного интеллекта, способного генерировать новый контент, неограничены. Если сейчас о способах его использования только разговаривают (и лишь частично внедряют в реальность), то уже через несколько лет они продемонстрируют потрясающие результаты.
Одно из главных достижений, которое перевернет интернет-бизнес и другие сферы, развивающиеся в Сети, с ног на голову, – возможность генерировать новые тексты посредством специальных алгоритмов либо создавать их с нуля, используя готовые шаблоны, по которым их пишут люди.
Это явление не новое. Ранее в Сети уже неоднократно поднимался вопрос касательно так называемой автоматизированной (роботизированной) журналистики. Суть идеи заключается в том, что специальные компьютерные программы:
- генерируют существующие новостные статьи, отбирая важные факты;
- сканируют и прорабатывают большие объемы данных;
- выбирают одну из заранее запрограммированных структур текста;
- сортируют и упорядочивают места, имена, даты, статистические данные, цифры, рейтинги и пр.;
- интерпретируют и систематизируют материал, выдавая оригинальный новостной контент.
Некоторые владельцы новостных порталов уже начали пытаться использовать данное решение на практике. Но оно еще недостаточно развито и продумано, поэтому существует множество “камней преткновения”. Например, подобные ИТ-решения справляются только с ограниченным количеством тем (спорт и финансы).
Однако подобные технологии, как уверяют эксперты в ИТ-сфере, имеют большое будущее и хорошие перспективы, особенно в журналистском деле. Здесь во главе угла стоят высокая скорость получения и обработки данных, их систематизация и точность указанной информации. Особенно это важно для тех, кто занимается спортивными новостями, где на вес золота каждая секунда.
Решающим в данном вопросе иногда становится человеческий фактор (указали не ту цифру, дали недостоверный комментарий, отстали от конкурентов и пр.), что негативным образом сказывается на репутации и финансовом положении того или иного новостного портала, ТВ-канала и др. Поэтому автоматизированная журналистика, по мнению большинства специалистов, – идеальное решение.
Многие считают, что так как весь процесс создания контента основывается исключительно на интеллектуальных технологиях, кроме сухих сводок, можно ничего большего от них не ожидать. Однако информационное агентство из Китая “Синьхуа” продемонстрировало другую картину. Оно не только воспользовалось данным решением, но и поэкспериментировало с “внедрением” виртуальных ведущих новостных программ. Результаты такого эксперимента наглядно показали, что генеративное ИИ не только может использоваться с целью дезинформации и создания негативного контента, но и позволяет:
- урезать затраты компании на наем сотрудников (в данном случае ведущего);
- ускорить доставку новостного контента конечному потребителю информации;
- исключить возможные ошибки или искажение данных.
Эксперты прогнозируют, что со временем данные технологии будут совершенствоваться, и это касается в том числе применения специального кода компьютерных программ при создании текста.
В июне этого года сервис GitHub, который является одним из крупнейших электронных хранилищ данных, представил общественности решение для программистов под названием Copilot. Его работа основана специальных компьютерных кодах, которые программа в случае необходимости дописывает самостоятельно.
Буквально на днях представители веб-сервиса для хостинга IT-проектов GitHub прокомментировали, что теперь ⅓ всех кодов на сервисе помогает писать программа, так называемый “виртуальный пилот”. Вместе с тем они подчеркивают, что сервис пишет код не самостоятельно, а только помогает ускорить и усовершенствовать этот процесс.
Использование синтетических данных
Оно сопряжено с рядом трудностей, так как для достижения определенных целей нужны большие объемы данных, доступ к которым порой бывает невозможным или затруднительным. Речь идет о видоизменении изображений человеческих лиц. Далеко не всегда получается использовать фото тех или иных людей для рекламы или в других целях. Это грозит значительными штрафными санкциями.
Благодаря генеративным алгоритмам можно решить эту проблему. Используя разные технологические решения, есть возможность менять черты используемых лиц, цвет кожи, добавлять или убавлять возраст, искажать мимику и пр. Таким образом, визуально создается совершенно иной человек, лицо которого можно применять в личных целях, не боясь юридической ответственности.
Подобные услуги сегодня предоставляют многие компании. Их специалисты подчеркивают, что в работе используют миллионы человеческих лиц, но на выходе получаются оригинальные изображения, которые, по сути, не принадлежат никому. В этом и заключается уникальность использования синтетических данных.
Они применяются не только для изменения “человекочитаемых” объектов. Подобные технологии актуальны практически повсеместно, просто для каждой сферы предусмотрены свои алгоритмы и массивы данных. Они позволяют создавать разные новые уникальные предметы на основе уже существующих в реальности. Соответственно, их применение не нарушает ничьи права, так как фактически они не охраняются на законодательном уровне.
Одним из показательных примеров является база медзаписей около 3 млн пациентов (более 400 тысяч переболели коронавирусом), созданная компанией Syntegra. В реальности же пользователи не могут проиндексировать представленные таблицы с конкретными людьми. Но их можно смело применять с целью проверки всевозможных гипотез, которые связаны с симптоматикой, протеканием, лечением заболеваний.
Без использования синтетических данных сложно себе представить и создание/развитие транспортных средств, передвигающихся без экипажа на борту посредством специальной системы автономного управления. Алгоритмы, которые используются для управлениями автомобилями, должны быть протестированы на всех уровнях, чтобы ТС было готово к разным аварийным и другим непредвиденным ситуациям. Для этого применяется огромное количество сгенерированных синтетических данных, которые воспроизводят информацию, поступающую с датчиков беспилотника.
Также алгоритмы машинного обучения используются промышленными предприятиями, компаниями, работающими в торговой и других сферах. Они позволяют применять разные цифровые технологии, не имеющие двойников.
Учитывая такую тенденцию, специалисты в ИТ-сфере прогнозируют, что уже в следующем году технологии генеративного искусственного интеллекта будут активно проникать в разные сферы, и большинство используемых данных будет синтетическим.