Google представляет следующий рубеж в развитии ИИ на I/O 2025: от Beam до Gemini
21.05.2025   14:00

Google представляет следующий рубеж в развитии ИИ на I/O 2025: от Beam до Gemini

На ежегодной конференции Google I/O 2025, Сундар Пичаи, глава корпорации, поделился информацией о том, как компания, занимающая лидирующие позиции в сфере технологий, трансформирует результаты многолетних исследований в области искусственного интеллекта в эффективные решения, применяемые на практике, причем делает это с беспрецедентной скоростью. В своей программной речи Пичаи рассказал о прорывных достижениях в рамках семейства моделей Gemini, об инновационной инфраструктуре и смелых экспериментах, которые стремительно становятся неотъемлемыми компонентами всей экосистемы Google.

Искусственный интеллект развивается стремительными темпами, представляя новинки еженедельно.

В отличие от прошлых лет, когда Google обычно приберегала самые громкие анонсы для I/O, Пичаи подчеркнул, что с приходом "эры Gemini" меняется подход компании к внедрению новых продуктов. "Мы стремимся предоставить вам наши лучшие модели и продукты в максимально короткие сроки. Поэтому мы ускоряем темпы их выпуска", – заявил он. Такая скорость стала возможной благодаря мощной инфраструктуре. Новейшие процессоры Ironwood TPU седьмого поколения от Google, разработанные специально для задач искусственного интеллекта, обеспечивают десятикратное увеличение производительности по сравнению с предыдущими версиями, достигая впечатляющих 42,5 экзафлопс на модуль. Это позволяет Google не только масштабировать свои решения быстрее, но и существенно снижать затраты на услуги ИИ. Результат впечатляет: Gemini 2.5 Pro теперь занимает лидирующую позицию в рейтинге LMArena, опережая оригинальную модель Gemini Pro на 300 баллов Elo.

От Starline к Beam: курс на очеловечивание коммуникаций

Футуристический эксперимент Google по созданию 3D-видеосвязи под названием Project Starline эволюционировал в более амбициозный проект – Google Beam. Разработанный в сотрудничестве с HP, Beam объединяет возможности искусственного интеллекта с комплексом из шести камер, преобразующих плоские видеопотоки в реалистичные 3D-разговоры. Платформа обеспечивает отслеживание положения головы с точностью до миллиметра и частотой 60 кадров в секунду, создавая эффект полного погружения. Это не единственное направление, в котором Google стремится переосмыслить виртуальное взаимодействие. "В Google Meet мы добавляем функцию перевода речи в режиме, максимально приближенном к реальному времени, с сохранением интонаций и даже мимики", – сообщил Пичаи. На начальном этапе эта функция будет доступна для английского и испанского языков для подписчиков AI Pro и Ultra, а в дальнейшем планируется тестирование бизнес-пользователями на других языках.

Ваш персональный ИИ-ассистент стал еще более продвинутым: премьера Gemini Live и режима агента

Проект Astra, представляющий собой исследования Google в области контекстно-зависимых ИИ-помощников, воплотился в виде Gemini Live. Пользователи могут взаимодействовать с ним через камеру своего смартфона или через общий экран, используя его для решения широкого спектра задач – от подготовки к собеседованиям до планирования тренировок. Gemini Live уже доступен на Android и постепенно выходит на iOS. В свою очередь, прототип системы агентов Google, ранее известный как Project Mariner, получил возможности многозадачности и новый метод обучения, основанный на принципе "обучение и повторение". Экспериментальный режим агента в приложении Gemini в скором времени поможет пользователям в решении сложных задач, таких как поиск жилья или бронирование экскурсий, используя такие инструменты, как Zillow. Ведущие тестировщики, такие как Automation Anywhere и UiPath, уже разрабатывают решения на его основе.

Новый взгляд на поиск, раскрытие творческого потенциала

Искусственный интеллект также вносит изменения в процесс поиска информации с помощью нового "режима ИИ" – специальной вкладки, позволяющей пользователям формулировать более длинные и сложные запросы и уточнять результаты с помощью дополнительных действий. Пичаи подтвердил, что функция "Обзор ИИ" теперь доступна более чем 1,5 миллиардам пользователей по всему миру и способствует повышению вовлеченности в поиск на ключевых рынках, таких как США и Индия. Творческим профессионалам также есть чему порадоваться. В приложении Gemini теперь доступны Imagen 4, самая мощная на сегодняшний день модель обработки изображений от Google, и Veo 3, модель обработки видео с функцией генерации звука. Для кинематографистов Google представила Flow – инструмент, который преобразует короткие видеоролики в кинематографические сцены.

Искусственный интеллект, который понимает вас: персональный контекст в Gemini

Одним из наиболее интересных аспектов внедрения искусственного интеллекта в Google является концепция "личного контекста". С вашего согласия Gemini теперь может использовать данные из Gmail, Google Диске и Документов, чтобы создавать ответы, которые будут звучать именно так, как вы этого хотите. В качестве примера можно привести интеллектуальные ответы в Gmail, которые отражают ваш тон, выбор слов и привычные маршруты поездок. "Он будет соответствовать вашему типичному приветствию и отражать ваш тон, стиль и даже любимые выражения", – пояснил Пичаи. Эта функция станет доступна подписчикам в конце текущего года.

Создание фильмов с использованием искусственного интеллекта

Google также представила Flow, инструмент для создания фильмов с использованием искусственного интеллекта, предназначенный как для профессионалов, так и для начинающих, и основанный на моделях Gemini, Imagen и Veo. Ключевые функции включают управление камерой для настройки движения и ракурса, Scenebuilder для редактирования и расширения кадров, управление ресурсами для организации подсказок и Flow TV — демонстрацию видеозаписей, созданных ИИ, с видимыми подсказками, которые вдохновляют создателей. Veo 3, интегрированный в Flow, поддерживает звуковые эффекты, фоновые шумы и диалоги персонажей, что упрощает создание видео.

➔ Смотрите новости на смартфоне? Подпишитесь на новости Турпрома в  Google News  (в браузере  ХРОМ ): это свежие новости о туризме, лучшие цены на туры и билеты, здоровье, технологии, жизнь знаменитостей, еда и рецепты, астрологические прогнозы, лайхаки о саде и огороде и многое другое! Также рекомендуем подписаться на наш канал новостей в  Telegram или на Дзен.

Подписатся на новости: