Официальный блог Google Россия

Корпоративная ответственность: наши планы по борьбе с недостоверной информацией

21 февраля 2022 г.

Нил Мохан, директор по продукту YouTube

Миллиарды людей во всем мире заходят на YouTube по самым разным причинам, например, чтобы посмотреть редкую запись концерта или обучающее видео. На платформе собрано невероятное количество материалов под любой запрос — и все благодаря тому, что в основе всех наших решений и разработок лежит намерение защищать интересы сообщества.

Я планирую несколько раз в год рассказывать вам о том, как команда YouTube решает сложные задачи и какие компромиссы стоят за этим процессом. В последующих письмах мы можем изучить такие темы как разработка политики YouTube, или обсудить острые вопросы и ответственность в целом. Но в этом первом письме я хочу рассказать больше о нашей текущей работе по борьбе с потенциально опасной ложной информацией на YouTube.

Последние пять лет мы активно инвестируем в поддержку четырех принципов корпоративной ответственности: быстро удаляем недопустимые материалы с помощью сочетания технологий машинного обучения и человеческих ресурсов, сдерживаем распространение сомнительного контента, продвигаем авторитетные источники информации и поощряем добросовестных авторов. С помощью этих ключевых инструментов нам удалось сократить число просмотров нежелательных видео и при этом сохранить открытость платформы. Однако в связи с тем, что ложная информация стала появляться и распространяться быстрее, чем когда-либо, нам предстоит модернизировать наш подход. Ниже мы расскажем о трех задачах, которые предстоит решить команде в ближайшем будущем.

Поиск очагов недостоверной информации до ее распространения

Долгие годы в поле недостоверной информации в интернете господствовало всего несколько тем — теории о теракте 11 сентября 2001 года, высадке на Луну и плоской Земле. Поскольку материалов о них достаточно, это позволило нам обучить систему урезать рекомендации видео на подобные темы по шаблонам этого типа контента. Однако в последнее время стал быстро появляться и набирать популярность совершенно новый контент. Более того, даже в рамках одного видео риторика может меняться – и вот безобидный, на первый взгляд, ролик о здоровье в итоге вызывает у зрителей сомнения в необходимости вакцинации. Ложная информация принимает разные формы и по-разному распространяется, иногда становясь таргетированной даже на небольшую целевую аудиторию.

Мы столкнулись с подобными проблемами в начале пандемии COVID-19. Тогда возникла конспирологическая теория, что в распространении инфекции виноваты сети 5G, и в результате в Великобритании было подожжено несколько вышек сотовой связи. В ответ на риск причинения реального вреда мы сразу же обновили правила, запретив размещать контент на эту тему. Быстро принять меры нам помогло то, что на YouTube уже действовали требования к контенту о COVID-19, основанные на рекомендациях местных и всемирных органов здравоохранения.

Однако не для каждой быстро развивающейся теории будут разработаны экспертные руководства и составлены правила. И чем свежее ложная информация, тем меньше примеров у нас есть для обучения системы. Чтобы решить эту проблему, мы постоянно обучаем нашу систему на основе новых данных. Мы стремимся использовать еще более точное сочетание классификаторов, ключевых слов на многих языках и сведений от региональных аналитиков для выявления контента, который не охватывает наша основная программа. Со временем это позволит нам быстрее и точнее выявлять недостоверный вирусный контент.

Сдерживать распространение недопустимых материалов – не единственная наша задача. Мы также знакомим зрителей с видео с достоверной информацией в результатах поиска и в рекомендациях. Например, рассмотрим быстро распространяющееся новостное событие, такое как стихийное бедствие, сразу после которого мы можем увидеть непроверенный контент, спекулирующий на причинах произошедшего и информации о пострадавших. Для создания нового видеоконтента надежным источникам может потребоваться время, а когда дезинформация распространяется быстро, не всегда бывает достаточно авторитетного контента, на который мы сразу же можем ссылаться.

Для крупных новостных событий, таких как стихийное бедствие, мы разрабатываем новостные панели с целью направить аудиторию к текстовым публикациям по теме. Для нишевых тем, которые крупные СМИ могут не освещать, мы предлагаем аудитории специальные флажки достоверности данных. Но проверка фактов также требует времени, и не каждая тема может быть охвачена. Для таких случаев мы рассматриваем дополнительные типы меток, которые можно добавить к видео или к результатам поиска, например, дисклеймер, предупреждающий аудиторию об отсутствии проверенной информации. Мы также должны оценить, может ли появление ярлыка непреднамеренно привлечь внимание к теме, которая в противном случае могла бы не получить огласки. Мы активно обсуждаем все варианты и пытаемся найти правильный подход.

Распространение потенциально недостоверной информации за пределами платформы

Ещё одна проблема – распространение спорного контента за пределы YouTube. В таких видео нет явных нарушений, поэтому мы не можем их удалить, но мы также не обязательно хотим их рекомендовать к просмотру. Мы пересмотрели наши алгоритмы, и теперь спорные видео, которые попадают в наши рекомендации, составляют менее 1% от просматриваемого контента. Однако даже без наших рекомендаций зрители по-прежнему могут находить спорные видео на других сайтах и смотреть их во встроенном проигрывателе или переходить на страницу просмотра по ссылке.

Одним из решений этой проблемы может быть отключение кнопки "Поделиться" или ограничение возможности ссылки на спорные видео, которые мы уже убрали из рекомендаций. Тогда на других сайтах не получится встраивать эти ролики или оставлять ссылку на них. Однако мы против того, чтобы подобные меры ограничивали свободу на платформе. Наши системы сокращают количество спорного контента в рекомендациях, но предоставление ссылки может быть осознанным выбором пользователя, в отличие от более пассивного действия, такого как просмотр рекомендуемого видео.

Большое значение имеет и контекст. Спорные материалы, встроенные в исследование или новостной репортаж, могут потребовать исключений или совсем другого подхода. Необходимо быть аккуратными в поиске этого баланса, и мы ищем способы ограничить потенциально опасный контент, сохранив свободу обсуждать спорные темы и затрагивать их в образовательных целях.

Другой выход: показывать предупреждение, что встроенное или связанное видео может содержать ложную информацию, перед его просмотром. Такие объявления похожи на «лежачего полицейского»: заставляют зрителя сделать паузу, прежде чем начать просмотр или поделиться контентом. На самом деле, мы уже используем их в материалах с возрастными ограничениями, сценами насилия и неприятными изображениями и считаем их важным инструментом, позволяющим зрителям самим решать, смотреть видео или нет.

Мы продолжим тщательно взвешивать все за и против, чтобы ограничить распространение вредоносной и ложной информации в Интернете.

Усиление мер по борьбе с недостоверной информацией по всему миру

Наша борьба с ложной информацией уже дала результаты, но мы все еще сталкиваемся со сложностями, поскольку сейчас работаем над адаптацией своих методов для более чем 100 стран и десятков языков.

У людей разных культур может различаться представление о том, что такое надежные источники информации. В одних странах телекомпании пользуются доверием (например, BBC в Великобритании), а в других к государственным телеканалам относятся с меньшим доверием. Кроме того, в стране бывает много новостных и информационных агентств, и не во всех действуют строгие требования к проверке фактов и качеству материалов. Так политическая среда, исторический контекст и новости могут приводить к исключительно локальному распространению ложной информации. Например, во время эпидемии вируса Зика в Бразилии некоторые жители этой страны выдвигали теории международного заговора. А в Японии в прошлом году стали популярными появившиеся онлайн слухи о том, что землетрясение было вызвано вмешательством человека.

Сталкиваясь с локальным различиями, наши специалисты видят одни и те же проблемы распространения информации: от смены риторики до отсутствия достоверных источников. В начале пандемии оказалось, что не во всех странах органы здравоохранения предоставляют людям доступ к последним исследованиям, а официальные рекомендации иногда различаются.

Единого взгляда на спорный контент тоже нет. Разрабатывая правила оценки контента, мы всегда думаем о том, как их могут интерпретировать в контексте разных культур и языка. Работа с местными экспертами требует больше времени, но зато позволяет лучше понять культурный контекст, влияющий на оценку достоверности видео.

Сейчас мы расширяем команды специалистов, которые разбираются в региональных тонкостях в контексте распространения ложной информации. Мы планируем инвестировать в партнерские отношения с экспертами и неправительственными организациями по всему миру. Кроме того, поскольку видео с местными недостоверными теориями выявляются так же, как ролики на новые вирусные темы, мы будем активнее совершенствовать модели поиска на разных языках.

Обеспечение прозрачности

Мы продолжим свою работу по сокращению ложной информации во всех наших сервисах, стараясь поддерживать открытость YouTube. У нас не всегда есть решения, но мы считаем нужным рассказывать о том, какие задачи стоят перед нами. Сейчас наша работа важна как никогда – от нее зависит безопасность и благополучие сообщества. Я буду рад информировать вас о наших шагах в этом направлении.

Итоги второго сезона программы акселерации для разработчиков мобильных игр Game Drive

21 февраля 2022 г.

Максим Браверман, директор по продажам, Google.

Мы завершили второй сезон программы акселерации для разработчиков мобильных игр Game Drive, которую Google проводит совместно с MGVC, инвестиционным направлением MY.GAMES.

В этот раз мы значительно усилили образовательный компонент Game Drive: заинтересованные в участии в программе студии могли присоединиться к бесплатным АMA-сессиям с экспертами из Google и MGVC. Сессии были посвящены ключевым направлениям разработки мобильных игр: например, UA, исследованию рынка и монетизации. Это помогло нам повысить качество заявок, увеличить их количество и расширить географию участников. Мы получили более 80 заявок от команд из стран Европы, Африки, Ближнего Востока и СНГ.

Команды Google и MGVC детально проанализировали каждую из них и отобрали 10 финалистов из Германии, Польши, Эстонии, Украины, Казахстана, Беларуси, Турции и России. Они приняли участие в закрытой конференции Game Drive Demo Day, где получили подробную персональную консультацию по улучшению продуктов от экспертов Game Drive. А один из разработчиков — новосибирская студия Game Mavericks — получит инвестиции от MGVC в размере 15 млн рублей.

Мы вместе с MGVC запустили программу Game Drive в 2020 году, чтобы помочь перспективным игровым студиям масштабировать свои проекты и выходить на международные рынки. В состав экспертной группы программы пошли сотрудники из MGVC и команд Google AdMob и Google Play, а во втором сезоне к ним присоединилась компания AppsFlyer.

Итоги второго сезона Game Drive открыли еще больше перспектив для дальнейшего развития Game Drive. Третий сезон мы запланировали на вторую половину 2022. Следите за новостями!

2022 год для YouTube: сообщество, сотрудничество и коммерция

10 февраля 2022 г.

Нил Мохан, директор по продуктам YouTube

В прошлом году я представил серию материалов об инновациях, стремясь рассказать больше о том, как наша команда переосмысляет процесс работы с видео начиная с 2021 года. С точки зрения инноваций это был продуктивный год для YouTube. Мы обновили то, как зрители взаимодействуют с контентом, начиная с улучшения поиска и инфраструктуры — основ платформы — и заканчивая продвижением приложений и форматов: YouTube TV, YouTube Shorts и YouTube Music. Мы также предложили авторам новые способы заработка и расширили возможности для родителей, которые следят за тем, что их дети смотрят на YouTube. Кроме того, мы заключили партнерства с авторами, чтобы поддержать их в занятии тем, что у них лучше всего получается.

Однако во многих аспектах мы только приступили к работе. В 2022 году мы запустим новые продукты и инструменты, а также представим несколько горячо ожидаемых функций. Во время разработки каждого обновления мы проводили множество обсуждений, анализировали большое количество данных, учитывали отзывы от представителей сообщества YouTube. Иногда во время принятия решений нам приходится идти на компромисс. Но мы всегда тщательно анализируем, что лучше для долгосрочного благополучия и процветания нашей экосистемы. (Чтобы узнать больше о том, как мы принимаем решения о продуктах, посмотрите мой недавний разговор с Лью.) Сегодня мы расскажем, что мы приготовили для авторов, зрителей и партнеров в этом году.

Для креаторов

Авторы YouTube — это душа и сердце нашей платформы. Мы хотим, чтобы они всегда могли достигать самых амбициозных творческих целей. Поэтому мы продолжим инвестировать в разные форматы: Shorts, Live и видео по запросу (VOD). В следующие месяцы мы предложим для всех трех форматов еще больше возможностей, которые позволят вовлекать зрителей и монетизировать контент.

Короткий контент сегодня невероятно популярен — видео на платформе YouTube Shorts посмотрели уже более пяти триллионов раз. Самые разные авторы и исполнители — от Джейка Феллмана и Лизы Нгуен до BTS и Марины Сена — оценили то, как короткие видео помогают устанавливать связь с поклонниками по всему миру с невероятной скоростью и размахом. В 2022 году мы продолжим совершенствовать продукт и упрощать процесс создания видео. В прошлом году мы представили функцию, которая позволяет комбинировать аудио из видео на YouTube. На ее основе мы предложим новые возможности, которые также помогут автором самовыражаться: видеоэффекты, инструменты для редактирования и многое другое. Кроме того, для более эффективного взаимодействия с аудиторией авторы смогут короткими видео отвечать на отдельные комментарии.

В прошлом году мы создали Фонд YouTube Shorts, чтобы награждать авторов за их работу. Это только первый шаг в этом направлении, но мы уже активно помогаем новому поколению творческих предпринимателей. Более 40 процентов авторов, которые получили выплату от фонда в прошлом году, ранее не монетизировали свой контент на YouTube. В скором времени мы начнем тестировать другие источники дохода от Shorts: возможность создавать брендированный контент с помощью BrandConnect, спонсируемые фанатами интеграции, такие как “Суперчат” (Super Chat), а также опции для совершения покупок напрямую в Shorts.

Еще одна область, которую мы усовершенствуем в этом году, — это прямые эфиры. С января 2020 по декабрь 2021 года ежедневное время просмотра подобного контента увеличилось втрое. И скоро мы представим функцию совместных прямых эфиров. Благодаря ей креаторы получат еще больше возможностей для взаимодействия с аудиторией. Мы знаем, что авторы часто волнуются “о чем мне следует говорить”? И в этом случае совместные эфиры помогут авторам видео вести непринужденную беседу, создать живой, веселый контент. К тому же, подобный формат — отличная возможность расширить аудиторию, ведь зрители разных креаторов смогут познакомиться и наладить общение.

Такие функции, как «Суперчат» и «Спонсорство», помогли новому поколению тех, кто проводит прямые эфиры, стать частью креативной экономики. В этом году мы планируем активно развивать это направление. Для небольшой группы каналов мы недавно начали тестировать возможность купить спонсорство в подарок другому зрителю прямого эфира. Мы знаем, что многие этого ждут, и скоро представим эту функцию более широкой аудитории.

Для всех видео на YouTube мы хотим усовершенствовать процесс взаимодействия с аудиторией. Одной из приоритетных задачей было улучшить работу с комментариями, сделав их более полезными как для создателей, так и для зрителей. Например, мы тестируем возможность для владельцев каналов устанавливать свои правила, формируя подходящую тональность обсуждения на своем канале. А у зрителей появится возможность фильтровать комментарии относительно просматриваемого момента в видео.

Авторы много раз говорили, что им сложно находить новые идеи для съемок и трудно понять, какие из них станут успешными. Чтобы помочь им, мы планируем создать специальный инструмент в Творческой студии YouTube. Он будет анализировать данные YouTube и Google и предоставлять авторам более подробную информацию о запросах зрителей, помогая находить подходящие идеи для новых видео.

Web3 также открывает новые возможности для авторов. Мы считаем, что новые технологии, такие как блокчейн и NFT, позволят сформировать более глубокие отношения со зрителями. Авторы и зрители смогут вместе работать над новыми проектами и монетизировать их недоступными ранее способами. Например, если подписчик получит подтвержденный уникальный контент: видео, фотографии, произведения искусства или даже впечатления от любимых креаторов, это может стать захватывающим опытом как для авторов, так и для зрителей. Мы считаем, что эти технологии обладают огромным потенциалом, и учитываем, что для их ответственного внедрения предстоит учесть много факторов.

Мы планируем предложить авторам еще больше способов по развитию бизнеса и монетизации видео. В 2021 году количество участников Партнерской программы YouTube достигло двух миллионов человек, этим креаторам доступны 10 способов монетизации. Мы добились успеха, потому что всегда прислушивались к мнению авторов, и продолжим делать это в будущем.

Для зрителей

Мы заботимся не только об авторах, предоставляя им все больше форматов и возможностей, но и о зрителях. Мы также сосредоточены на том, чтобы опыт использования нашей платформы был исключительно позитивный, а пользоваться ею было удобно практически с любого устройства, подключенного к сети.

В 2021 году быстрее всего росло число зрителей, смотрящих YouTube с экрана телевизора. В январе 2022 года пользователи ежедневно проводили в среднем более 700 миллионов часов за просмотром платформы на ТВ. В этом году для этих зрителей мы хотим упростить навигацию и внедрить интерактивные функции при просмотре видео. Например, этого можно добиться с помощью устройства, которое всегда под рукой, — телефона. Скоро мы предложим новые способы по использованию телефона при просмотре YouTube на телевизоре: зрители смогут читать и оставлять комментарии, делиться видео с друзьями и многое другое. Следите за новостями!

Мне радостно слышать, как сильно людям нравится смотреть YouTube на ТВ. И мы продолжим разрабатывать инновационные функции для наших пользователей. В прошлом году мы анонсировали несколько обновлений, например, пакет 4K Plus. Он включает в себя не только контент в 4K качестве, но и дает возможность просматривать неограниченное количество одновременных потоков для любых устройств, которые находятся в домашней сети Wi-Fi пользователя, а также позволяет смотреть шоу офлайн. Этот пакет пришелся по душе любителям спорта, в том числе мне. С радостью сообщаю вам, что в этом году мы проведем редизайн, чтобы улучшить пользовательский интерфейс. Мы обновим библиотеку и раздел прямых трансляций, чтобы зрителям было удобнее организовывать и смотреть любимый контент.

Однако мы заботимся не только об удобстве просмотра, но и о безопасности, особенно когда речь идет о детях и семьях. Благодаря YouTube Детям и контролируемым аккаунтам дети любого возраста могут безопасно изучать видео в соответствие со своими разнообразными растущими интересами. В прошлом году мы запустили контролируемые аккаунты специально для родителей детей 9–12 лет и подростков, которые уже готовы смотреть YouTube. В таких аккаунтах есть три варианта настроек, которые отличаются ограничениями контента для детей до подросткового возраста и старше. В этом году мы открыли возможность контролировать YouTube Music, приложение YouTube для телевизоров и Ассистента.

На YouTube Music мы продолжаем расширять богатую музыкальную базу, предлагая более 80 миллионов официальных синглов, альбомов, ремиксов, каверов и уникальных музыкальных произведений. В прошлом году мы запустили бесплатное фоновое прослушивание музыки для слушателей в Канаде. И нам не терпится расширить это предложение на других слушателей в этом году - мы сообщим заранее, когда это станет возможным.

Конечно, говоря об инновациях, мы не могли обойти стороной тему метавселенной! Наша команда уже работает над идеями, как усилить эффект погружения во время просмотра видео. И первая область, которая испытает это влияние на себе - гейминг. Мы будем работать над процессом взаимодействия в играх и постараемся сделать его более живым. Это только первые идеи, но мы взволнованы от мысли, что можем превратить виртуальный мир в реальность для наших пользователей.

Для партнеров

Благодаря своему масштабу YouTube предлагает глобальным партнерам, от крупных брендов и рекламодателей до издателей в сфере музыки и игр, уникальные возможности достучаться до аудитории, которую невозможно найти где-то еще. В свою очередь партнеры финансируют авторов YouTube.

Одно из самых ожидаемых решений для брендов в этом году — это покупки. Авторы, которые завоевали большое доверие в своих сообществах, смогут помогать нашим партнерам расширять бизнес в стремительно развивающейся сфере электронной торговли. Мы думаем над тем, как добавить покупки в видео, в прямые эфиры и в приложение в целом. Это решение позволит зрителям покупать товары в видео любимых авторов, как в случае с партнерским контентом Black-owned Friday.

Покупки во время прямых эфиров — это интерактивное решение, которое позволяет зрителям взаимодействовать с авторами во время представления новой продукции, объявления эксклюзивных предложений или обсуждения последних покупок. В ноябре прошлого года мы провели мероприятие “Holiday Stream and Shop”, в котором приняли участие такие авторы, как MrBeast, Merrell Twins и Гордон Рамзи, а также международные бренды Walmart, Samsung и Verizon. Зрители положительно оценили покупки в прямом эфире на YouTube — мы зафиксировали более 2 миллионов просмотров и 1,4 миллиона сообщений в чате. Вот что говорит Manny MUA, который представил свою линейку Lunar Beauty во время трансляции: «Я не ожидал таких продаж. Я полагал, что если мои продукты уже были доступны для покупки в течение нескольких недель, люди не будут покупать их так активно. Но я был очень и очень впечатлен!». Мы видим большой потенциал данного формата, и в 2022 году продолжим работать над ним.

Новая глава YouTube

Сегодня инновации в видео на YouTube развиваются так быстро, что нам это кажется только началом чего-то большего. Похоже, что мы говорим так каждый год с момента запуска платформы в 2005 году.

Возможно, с наступлением невероятной эпохи перемен и инноваций мы, авторы, зрители и партнеры оказались на пороге новых начинаний. Благодарю нашу команду, которая превращает YouTube в ведущую платформу для взаимодействия, развлечения и обогащения миллиардов людей по всему миру.

В 2022 году нас ждет много нового. Вперед, к удивительным начинаниям!

К 150-летию Государственного исторического музея: Google и ГИМ ответили на сложные и необычные вопросы об истории России

9 февраля 2022 г.

Анна Шпынтова, менеджер по связям с общественностью Google Россия

9 февраля свое 150-летие отмечает один из символов нашей истории и культуры — Государственный исторический музей. В честь этого юбилея мы создали специальный дудл, который подчеркивает, какую важную роль музей с его богатыми коллекциями и уникальными экспонатами играет в сохранении истории России и ее культурных традиций и формировании исторической памяти.

А еще мы вместе с музеем подготовили для наших пользователей интересные и познавательные активности

Погрузиться в тайны экспозиции музея можно будет с помощью игрового теста в Instagram Stories официальных аккаунтов Google Россия и официального аккаунта ГИМ. В подборку попали самые необычные экспонаты, угадать название и предназначение которых будет непросто даже заядлым историкам. Ответы подскажет приложение Google Lens — оно легко определяет предмет по фотографии.

Проверить свои знания истории России поможет специальный тест от издания МЕЛ: он объединит несколько интересных фактов и забавных вариантов ответов, которые подготовили научные сотрудники ГИМ.

Это еще не все! Каждый день Google Поиск помогает пользователям найти информацию об истории и о культуре России. Вместе с сотрудниками Исторического музея мы подобрали самые необычные вопросы и ответили на каждый из их. Когда в России появилась реклама? Существовала ли «удаленка» в царской России? Почитать, как сотрудники ГИМ ловко отвечают на эти и другие сложные вопросы, можно на сайте и в печатной версии газеты Metro и на сайте журнала Популярная механика.

Узнать больше об истории России смогли не только взрослые: Google сделала целую подборку смешных детских вопросов на серьезные исторические темы. А ответили на них музейные работники ГИМ! Читайте об этом на сайте Афиша.Дети.

Google поздравляет Государственный исторический музей с юбилеем! Мы рады, что благодаря совместным инициативам мы можем не только рассказать, как музей вот уже 150 лет хранит культурное и историческое наследие России, но и показать, что изучать историю своей страны может быть просто и весело.

Открыт набор на новый поток акселератора Google Growth Lab

8 февраля 2022 г.

Арсен Исрапилов, руководитель экспортного направления Google Россия

Сегодня мы открываем набор на новый поток акселератора для стартапов Google Growth Lab! Мы создали эту программу, чтобы помогать перспективным стартапам расти и выходить на международные рынки.

Чтобы присоединиться к Google Growth Lab стартап должен иметь уже готовый продукт и клиентов, развивать бизнес в digital-среде, демонстрировать кратный рост выручки, находиться на стадии масштабирования и иметь гибкий бюджет для маркетинговых тестов и экспериментов после завершения акселератора. В этот раз впервые в отборе стартапов примут участие не только эксперты Google, но и партнеры Google Growth Lab — представители фондов и инвесторы. Многие из них продолжат работу с участниками в течение всей программы

Подать заявку на участие в Google Growth Lab можно до 13 марта. А для тех, кто хочет подробнее узнать об акселераторе, 1 марта мы проведем АМА-сессию с экспертами программы, венчурными инвесторами и выпускниками предыдущих потоков.

Обучение в Google Growth Lab начнется уже 12 апреля и продлится три месяца. Программа акселератора включает в себя тематические занятия и индивидуальные консультации с менторами, среди которых — профильные специалисты Google, отраслевые эксперты и венчурные инвесторы. Все проходит в онлайн-формате и занимает 4-7 часов в неделю.

В начале программы стартапы поставят себе цели по развитию бизнеса на следующие три месяца. У каждого участника будет свой наставник, который поможет подобрать менторов под поставленные задачи. Мы составили программу так, чтобы на выходе участники не только получили полезные знания и навыки, но и смогли по-настоящему улучшить те или иные аспекты своего бизнеса и закончить Google Growth Lab с реальными результатами.

Участники Google Growth Lab узнают:

— как построить успешную долгосрочную стратегию развития, что такое уникальное ценностное преимущество и как достичь конкурентного преимущества.

— что такое дизайн-мышление и прототипирование и как разработать позиционирование своего бренда.

— как оценить возможности масштабирования бизнеса и подобрать подходящие регионы для расширения.

— как улучшить клиентский опыт и как наладить систему обратной связи для его дальнейшего развития.

— как разработать креативную стратегию бренда, максимизировать прибыль и ускорить рост с помощью рекламных инструментов Google.

Программа Google Growth Lab стартовала в 2020 году, и за два года в ней приняли участие 28 ярких стартапов! Мы гордимся тем, что бизнес-акселератор помог многим из них не только пережить пандемию, но и ускорить свой рост.

Мы рады, что бизнес-акселератор Google Growth Lab помогает перспективным талантливым предпринимателями достигать новых высот и добиваться поставленных целей. Новый поток — это возможность вывести свой стартап на ощутимо новый уровень: прокачать маркетинговую стратегию, выйти на глобальный рынок, а также встретить специалистов, которые будут помогать в развитии вашего бизнеса и после завершения программы.

Следите за новостями и подавайте заявки на участие в Google Growth Lab!

Исследование Google: тренды машинного обучения 2021

21 января 2022 г.

Джефф Дин, старший научный сотрудник и вице-президент Google Research

За последние несколько десятилетий я стал свидетелем больших изменений, которые произошли в машинном обучении (ML) и информатики. Думаю, результатом этого долговременного прогресса станет ряд научных прорывов, которые мы увидим уже в ближайшие несколько лет. Эти достижения в конечном итоге принесут пользу миллиардам людей и окажут большое влияние на наши жизни. В этом материале я выделю пять направлений, на которые серьезно повлияет ML.

Тренд 1. Более мощные модели ML общего назначения

Сейчас исследователи работают с более крупными, мощными моделями машинного обучения. К примеру, в сфере лингвистики несколько лет назад модели с миллиардами параметров тренировались на десятках миллиардов сегментов данных. Сегодня на триллионах сегментов данных тренируются модели с сотнями миллиардов или даже триллионами параметров (например, разреженные нейросети, такие как наша модель GShard с 600 млрд параметров). Рост объема данных и размеров самих моделей способствовал существенному увеличению точности выполнения различных языковых задач.

Многие из таких передовых моделей показали удивительную способность к генерализации, которая позволяет выполнять новые языковые задачи. В качестве примера можно рассмотреть нашу технологию LaMDA, в которой модель демонстрирует нетривиальную способность вести открытый диалог, не теряя нити беседы даже при многократной смене темы.

Модели-трансформеры играют большую роль в области распознавания изображений, видеоматериалов и речи. Как прогнозировалось в работе о закономерностях масштабирования моделей Vision Transformer, модели-трансформеры существенно выигрывают при их масштабировании. Трансформеры, распознающие изображения и классифицирующие видео, лидируют по многим показателям. Мы ранее демонстрировали, что добавление изображений к видеоматериалам при тренировке моделей по распознаванию может повысить эффективность их работы, особенно при сравнении с моделями, которые тренировались только на видеоматериалах. Были разработаны механизмы разреженного осевого внимания для трансформеров, работающих с изображениями и видео, что позволило более эффективно использовать вычислительные мощности. Также были усовершенствованы методы токенизации изображений для моделей Vision Transformer, и теперь мы лучше понимаем принципы функционирования моделей Vision Transformer благодаря сравнительному анализу их работы со сверточной нейронной сетью. Внедрение в трансформеров сверточных операций позитивно сказалось на способности этих моделей выполнять задачи по распознаванию визуальных образов и речи.

Качество выходных данных у генеративных моделей также существенно улучшается. За последние несколько лет эти модели достигли значительных успехов, научившись создавать реалистичные изображения лишь на основании описания (например, «ирландский сеттер» или «трамвай»). Они даже могут «додумывать» изображение с низким разрешением, создавая вполне естественный экземпляр высокого разрешения («Компьютер, улучши качество!») или создавать «бесконечную природу» — генерировать природные панорамы из одного изображения. Также изображения могут быть преобразованы в последовательность из отдельных фрагментов, которые затем можно синтезировать с высокой четкостью, используя авторегрессионную генеративную модель.

Мы видим в этих разработках не только мощный потенциал, но и большую ответственность, поэтому мы тщательно отбираем возможные сценарии использования таких моделей в соответствии с принципами применения искусственного интеллекта.

Кроме передовых одномодальных моделей начинают появляться и крупномасштабные мультимодальные. На сегодняшний день это одни из самых совершенных нейросетей, поскольку они способны не только понимать разные модальности (например, язык, изображения, речь, видео), но и выдавать в них результат: например, генерировать изображения на основе предложений или параграфа или давать понятное описание визуальной составляющей изображения. Это невероятно интересно, ведь, как и в обычной жизни, многие вещи легче воспринимать сразу в нескольких форматах (например, гораздо эффективнее не только почитать о чем-либо, но и просмотреть презентацию об этом). Поэтому сопровождение текста изображениями может помочь при извлечении мультиязычной информации, а более четкое понимание того, как сочетать текст и изображения на этапе ввода, улучшит подписи изображений. Похожим образом использование для тренировки одновременно графических и текстовых данных может улучшить точность и надежность выполнения задач по визуальной классификации, в то время как совмещение обучения на графических, видео- и аудиоматериалах повышает способность модели к генерализации всех модальностей. Помимо этого, существуют предположения, что естественный язык используется для осуществления манипуляций с изображениями, для обучения роботов взаимодействию с миром и для контроля программных систем. Вполне возможно, что в разработке пользовательских интерфейсов грядут изменения.

Все это указывает на то, что вскоре мы сможем тренировать высокопроизводительные модели общего назначения, способные обрабатывать несколько модальностей данных и решать тысячи или миллионы задач. Добиться более высокой эффективности мультимодальных моделей можно, если обеспечивать в них разреженность, чтобы для выполнения конкретной задачи активировались только наиболее подходящие части модели. В течение следующих нескольких лет мы реализуем это видение в новой архитектуре искусственного интеллекта — Pathways. Мы ожидаем значительный прогресс в этой области, поскольку будут объединены многие идеи, которые до сих пор разрабатывались относительно независимо.

Тренд 2. Повышение эффективности машинного обучения

Повышение эффективности, обусловленное достижениями в разработке компьютерного оборудования, совершенствования алгоритмов ML, а также исследованиями в области метаобучения, расширяют возможности моделей машинного обучения. Многие аспекты процесса разработки ML — от оборудования, на котором обучается и выполняется модель, до отдельных компонентов архитектуры МО — можно сделать более эффективными, при этом сохранив или даже повысив общую производительность модели. По сравнению с предыдущими годами, сейчас удается тратить на каждый аспект меньше ресурсов, а также уменьшать выбросы в эквиваленте CO2 (CO2e). Повышение эффективности позволило осуществить ряд прорывных достижений, которые открыли дорогу к дальнейшей оптимизации МО. Это позволит разрабатывать еще более масштабные, качественные и доступные модели с меньшими финансовыми затратами. Я считаю это направление исследований очень перспективным.

Продолжение работы над улучшением производительности ускорителей ML

Каждое новое поколение ускорителей машинного обучения лучше предыдущего. Чипы становятся производительнее, а масштабы систем увеличиваются. В прошлом году было анонсировано четвертое поколение тензорных процессоров TPUv4, которые в 2,7 раз производительнее TPUv3 в тестах MLPerf.

Совершенствование компиляции и оптимизация рабочих задач ML

Даже если аппаратное обеспечение не претерпело изменений, улучшения в компиляторах и другие оптимизации системного программного обеспечения ускорителей МО могут привести к значительному повышению эффективности. Например, в работе «Гибкий подход к автонастройке многопроходных компиляторов машинного обучения» показано, как применять ML при выполнении автонастройки параметров компиляции, чтобы без изменения аппаратной конфигурации получить прирост производительности набора программ ML на 5–15% (иногда с повышением производительности в 2,4 раза). Система автоматического распараллеливания на основе компилятора XLA GSPMD способна масштабировать большинство сетевых архитектур глубокого обучения, не ограничиваясь объемами ускорителя МО. Применение такой системы в крупных моделях, например GShard-M4, LaMDA, BigSSL, ViT, MetNet-2 и GLaM позволило достичь выдающихся результатов в различных сферах применения ML.

Наши активные поиски возможностей совершенствования архитектуры и алгоритмов моделей ML, включающие обучение с подкреплением и эволюционные техники, вдохновили других специалистов проводить исследования в своих сферах деятельности. Чтобы помочь им в этом, мы открыли свободный доступ к платформе Model Search, которая позволяет выполнять поиск параметров моделей в других областях.

Внедрение разреженности

Разреженность подразумевает, что при обучении на примере либо на фрагменте данных или при выполнении определенной задачи активируется лишь наиболее подходящая для этого часть высокоемкой модели. Это важное алгоритмическое усовершенствование может значительно повысить производительность. Проект GLaM показал, что путем объединения трансформеров и технологии комбинации узкоспециализированных слоев можно создать модель, которая в среднем превосходит по точности нейросеть GPT-3 в 29 эталонных тестах и при этом использует в 3 раза меньше энергии для обучения, а для вывода ей требуется произвести в 2 раза меньше вычислений.

Тренд 3. Машинное обучение становится все более полезным как для человека, так и для общества в целом

Ряд новых разработок стал возможными благодаря инновациям в области МО и новым полупроводникам мобильных устройств, которые стали лучше воспринимать контекст и ощущать окружающую среду. Они стали доступнее и проще в эксплуатации, а их вычислительная мощность возросла. Это важный фактор в развитии популярных функций, таких, как мобильная фотография, живой перевод и другие. Примечательно, что последние технологические достижения стали более персонализированными, при этом были усилены меры по обеспечению конфиденциальности.

Как никогда много людей сегодня используют камеры телефонов в жизни и творчестве. Правильное применение машинного обучения в вычислительной фотографии продолжает расширять возможности телефонных камер. Их использование становится проще, повышается производительность. Все это позволяет делать более качественные изображения. Такие функции, как улучшенный HDR+, съемка при слабом освещении, обработка портретов, а также стремление сделать камеры более универсальными, чтобы они могли работать с любыми оттенками кожи, позволяют получать фотографии, которые выглядят профессионально, точнее передают детали объекта фотосъемки и видение фотографа. Эти снимки могут быть дополнительно усовершенствованы с помощью мощных инструментов на основе ML, которые стали доступны в Google Фото, например, фото с киноэффектом, подавление шума, уменьшение размытости и волшебный ластик.

Для коммуникации в режиме реального времени с носителем другого языка или с человеком на расстоянии многие используют функцию мгновенного перевода в мессенджерах и возможности автоматических субтитров во время телефонных звонков. Точность распознавания речи продолжает расти благодаря таким методам, как обучение с самоконтролем и обучение в режиме «шумное занятие студентов». Во многих языках улучшилось восприятие речи с акцентом, а также в шумных условиях и с наложением другого голоса. Функция перевода живой речи в приложении Google Переводчик стала лучше благодаря стабилизации переведенных фраз, сгенерированных мгновенно. Новые проекты по внедрению технологий ML в традиционные методы речевого кодека Lyra и аудиокодека SoundStream позволили повысить качество передаваемой речи, музыки и других звуков при использовании гораздо более низкого битрейта.

Благодаря технологиям МО реализованы новые методы обеспечения безопасности отдельных пользователей и целых сообществ. Например, функция оповещений о подозрительных сообщениях предупреждает о возможных фишинговых атаках, а безопасная навигация позволяет избежать применения экстренного торможения, предлагая альтернативные маршруты в обход небезопасных участков.

Тенденция 4. Растущее влияние машинного обучения на науку, здравоохранение и экологию

В последние годы растет влияние машинного обучения на развитие фундаментальных наук — от физики до биологии. В смежных областях открываются новые, удивительные перспективы применения ML, например в области возобновляемой энергетики и медицины. Технология становится все более совершенной, надежной и доступной, помогая нам искать решения самых острых глобальных проблем.

Широкомасштабное применение компьютерного зрения

Достижения в области компьютерного зрения за последнее десятилетие позволили использовать компьютеры для решения самых разных задач. В неврологии методы автоматизированной реконструкции могут воспроизвести нервную соединительную структуру тканей головного мозга, основываясь на изображениях тонких срезов ткани головного мозга, полученных с помощью электронной микроскопии высокого разрешения. Ранее совместно с научным сообществом, мы смогли воссоздать структуру мозга плодовой мушки, мыши и певчей птицы. В прошлом году вместе с лабораторией Лихтмана Гарвардского университета мы проанализировали крупнейший визуализированный и реконструированный образец мозговой ткани и провели первое крупномасштабное исследование синаптических связей в коре головного мозга человека, охватывающее несколько типов клеток. Цель этой работы — создать новый ресурс, который поможет ученым в изучении ошеломляющей сложности строения человеческого мозга.

Технология компьютерного зрения активно используется и для решения глобальных проблем. Метод прогнозирования погоды, основанный на глубоком обучении на основании спутниковых, радиолокационных изображений в сочетании с другими атмосферными данными, дает более точный прогноз погоды и осадков на ближайшее 12 часов, чем традиционные физические модели. При этом такой прогноз составляется гораздо быстрее, что во время экстремальных погодных условий может иметь решающее значение.

Исследование возможностей автоматического моделирования

Еще один подход, показавший отличные результаты — это способность алгоритма ML изучить и смоделировать пространство для последующего автоматического поиска решений. Так, например, вариационный автокодировщик обучился созданию эстетически привлекательных и практичных макетов документов по принципу трансформера. Этот же подход можно использовать для создания эскизов мебели. В другом эксперименте модель МО применили для автоматического поиска возможностей усовершенствования дизайна компьютерной игры с целью улучшить ее играбельность и другие атрибуты игрового процесса.

Применение ML в области здравоохранения

Помимо влияния на развитие фундаментальных наук, машинное обучение также может сыграть ведущую роль в развитии медицины и здравоохранения. Идея использовать достижения в этой области существует уже давно. Одной из первых наших задач стала разработка программного обеспечения, которое помогало анализировать эпидемиологические данные. Но постепенно мы открываем новые возможности ML и, конечно же, ставим новые задачи.

Возьмем, к примеру, область геномики. С момента возникновения этой науки компьютерные технологии играли важную роль в ее развитии. Появление машинного обучения разрушило старые парадигмы и подарило новые возможности. Мы запустили бесплатное программное обеспечение DeepConsensus, а позже в сотрудничестве с UCSC выпустили PEPPER-DeepVariant, которые поддерживают существующие технологии и значительно ускоряют процесс секвенирования биополимеров.

Наш метод фенотипирования на основе ML помогает преобразовать тяжелые изображения и массивы текстовых данных в фенотипы, пригодные для исследования. А наш метод DeepNull позволяет работать с большими объемами данных в области генетических исследований.

Мы надеемся, что в будущем схожие алгоритмы машинного обучения будут применяться для диагностирования рака молочной железы, рака легких, ускорения лечения раковых больных с помощью лучевой терапии, определения аномалий на рентгеновских снимках и помощи в проведении биопсии рака простаты.

Применение МО для преодоления климатического кризиса

Недавно мы представили функцию построения экологически безопасных маршрутов в Google Картах. По нашим оценкам, это поможет сократить выбросы газа более чем на 1 млн тонн в год и позволит снизить расходы на топливо. Подобный результат сравним с сокращением количества автомобилей на дорогах до 200 000 единиц.

В 2021 году наша инициатива по прогнозированию наводнений была расширена и охватила большее количество людей, а именно — 360 миллионов человек. Мы отправили более 115 миллионов предупреждений об угрозе наводнения на мобильные устройства пользователей — это в 3 раза больше, чем годом ранее.

Тенденция 5. Более глубокое и широкое понимание ИИ

Поскольку ML все чаще используется в сфере технологий и в обществе в целом, мы считаем необходимым разрабатывать новые методы обеспечения справедливого и равноправного применения этой технологии. Это основное направление деятельности нашей исследовательской группы, отвечающей за ИИ и технологии, ориентированных на человека, и мы проводим множество исследований на тему ответственного применения МО.

Мы пристально изучаем системы рекомендаций, основанных на данных об активности пользователей в онлайн-сервисах. Эти системы часто состоят из нескольких отдельных компонентов, и чтобы понимать, насколько справедливо и объективно они работают, важно знать, как работают компоненты вместе и по отдельности. Недавние исследования помогли разобраться в этих взаимоотношениях и открыли методы, с помощью которых можно повысить «справедливость» ее индивидуальных компонентов и всей рекомендательной системы в целом.

Кроме того, при обучении системы на неявной активности пользователя важно, чтобы системы рекомендаций обучались непредвзято, поскольку прямой подход к обучению на элементах, которые были показаны предыдущим пользователям, демонстрирует формы предвзятости.

Создание общедоступных всеобъемлющих и менее предвзятых баз данных — возможность усовершенствовать машинное обучение для всех. В 2016 году мы представили набор данных Open Images, состоящий примерно из 9 миллионов изображений с описаниями, охватывающими тысячи категорий объектов и аннотациями для 600 различных классов.