Google представляет следующий рубеж в развитии ИИ на I/O 2025: от Beam до Gemini

21.05.2025 14:00
Google представляет следующий рубеж в развитии ИИ на I/O 2025: от Beam до Gemini

На ежегодной конференции Google I/O 2025, Сундар Пичаи, глава корпорации, поделился информацией о том, как компания, занимающая лидирующие позиции в сфере технологий, трансформирует результаты многолетних исследований в области искусственного интеллекта в эффективные решения, применяемые на практике, причем делает это с беспрецедентной скоростью. В своей программной речи Пичаи рассказал о прорывных достижениях в рамках семейства моделей Gemini, об инновационной инфраструктуре и смелых экспериментах, которые стремительно становятся неотъемлемыми компонентами всей экосистемы Google.

Искусственный интеллект развивается стремительными темпами, представляя новинки еженедельно.

Спасибо что смотрите рекламу, это поддерживает проект. Прокрутите, чтобы продолжить читать
реклама

В отличие от прошлых лет, когда Google обычно приберегала самые громкие анонсы для I/O, Пичаи подчеркнул, что с приходом "эры Gemini" меняется подход компании к внедрению новых продуктов. "Мы стремимся предоставить вам наши лучшие модели и продукты в максимально короткие сроки. Поэтому мы ускоряем темпы их выпуска", – заявил он. Такая скорость стала возможной благодаря мощной инфраструктуре. Новейшие процессоры Ironwood TPU седьмого поколения от Google, разработанные специально для задач искусственного интеллекта, обеспечивают десятикратное увеличение производительности по сравнению с предыдущими версиями, достигая впечатляющих 42,5 экзафлопс на модуль. Это позволяет Google не только масштабировать свои решения быстрее, но и существенно снижать затраты на услуги ИИ. Результат впечатляет: Gemini 2.5 Pro теперь занимает лидирующую позицию в рейтинге LMArena, опережая оригинальную модель Gemini Pro на 300 баллов Elo.

От Starline к Beam: курс на очеловечивание коммуникаций

Футуристический эксперимент Google по созданию 3D-видеосвязи под названием Project Starline эволюционировал в более амбициозный проект – Google Beam. Разработанный в сотрудничестве с HP, Beam объединяет возможности искусственного интеллекта с комплексом из шести камер, преобразующих плоские видеопотоки в реалистичные 3D-разговоры. Платформа обеспечивает отслеживание положения головы с точностью до миллиметра и частотой 60 кадров в секунду, создавая эффект полного погружения. Это не единственное направление, в котором Google стремится переосмыслить виртуальное взаимодействие. "В Google Meet мы добавляем функцию перевода речи в режиме, максимально приближенном к реальному времени, с сохранением интонаций и даже мимики", – сообщил Пичаи. На начальном этапе эта функция будет доступна для английского и испанского языков для подписчиков AI Pro и Ultra, а в дальнейшем планируется тестирование бизнес-пользователями на других языках.

Спасибо что смотрите рекламу, это поддерживает проект. Прокрутите, чтобы продолжить читать
реклама

Ваш персональный ИИ-ассистент стал еще более продвинутым: премьера Gemini Live и режима агента

Проект Astra, представляющий собой исследования Google в области контекстно-зависимых ИИ-помощников, воплотился в виде Gemini Live. Пользователи могут взаимодействовать с ним через камеру своего смартфона или через общий экран, используя его для решения широкого спектра задач – от подготовки к собеседованиям до планирования тренировок. Gemini Live уже доступен на Android и постепенно выходит на iOS. В свою очередь, прототип системы агентов Google, ранее известный как Project Mariner, получил возможности многозадачности и новый метод обучения, основанный на принципе "обучение и повторение". Экспериментальный режим агента в приложении Gemini в скором времени поможет пользователям в решении сложных задач, таких как поиск жилья или бронирование экскурсий, используя такие инструменты, как Zillow. Ведущие тестировщики, такие как Automation Anywhere и UiPath, уже разрабатывают решения на его основе.

Новый взгляд на поиск, раскрытие творческого потенциала

Спасибо что смотрите рекламу, это поддерживает проект. Прокрутите, чтобы продолжить читать
реклама

Искусственный интеллект также вносит изменения в процесс поиска информации с помощью нового "режима ИИ" – специальной вкладки, позволяющей пользователям формулировать более длинные и сложные запросы и уточнять результаты с помощью дополнительных действий. Пичаи подтвердил, что функция "Обзор ИИ" теперь доступна более чем 1,5 миллиардам пользователей по всему миру и способствует повышению вовлеченности в поиск на ключевых рынках, таких как США и Индия. Творческим профессионалам также есть чему порадоваться. В приложении Gemini теперь доступны Imagen 4, самая мощная на сегодняшний день модель обработки изображений от Google, и Veo 3, модель обработки видео с функцией генерации звука. Для кинематографистов Google представила Flow – инструмент, который преобразует короткие видеоролики в кинематографические сцены.

Искусственный интеллект, который понимает вас: персональный контекст в Gemini

Одним из наиболее интересных аспектов внедрения искусственного интеллекта в Google является концепция "личного контекста". С вашего согласия Gemini теперь может использовать данные из Gmail, Google Диске и Документов, чтобы создавать ответы, которые будут звучать именно так, как вы этого хотите. В качестве примера можно привести интеллектуальные ответы в Gmail, которые отражают ваш тон, выбор слов и привычные маршруты поездок. "Он будет соответствовать вашему типичному приветствию и отражать ваш тон, стиль и даже любимые выражения", – пояснил Пичаи. Эта функция станет доступна подписчикам в конце текущего года.

Спасибо что смотрите рекламу, это поддерживает проект. Прокрутите, чтобы продолжить читать
реклама

Создание фильмов с использованием искусственного интеллекта

Google также представила Flow, инструмент для создания фильмов с использованием искусственного интеллекта, предназначенный как для профессионалов, так и для начинающих, и основанный на моделях Gemini, Imagen и Veo. Ключевые функции включают управление камерой для настройки движения и ракурса, Scenebuilder для редактирования и расширения кадров, управление ресурсами для организации подсказок и Flow TV — демонстрацию видеозаписей, созданных ИИ, с видимыми подсказками, которые вдохновляют создателей. Veo 3, интегрированный в Flow, поддерживает звуковые эффекты, фоновые шумы и диалоги персонажей, что упрощает создание видео.

➔ Смотрите новости на смартфоне? Подпишитесь на новости Турпрома в  Google News  (в браузере  ХРОМ ): это свежие новости о туризме, лучшие цены на туры и билеты, здоровье, технологии, жизнь знаменитостей, еда и рецепты, астрологические прогнозы, лайхаки о саде и огороде и многое другое! Также рекомендуем подписаться на наш канал новостей в  Telegram или на Дзен.

Спасибо что смотрите рекламу, это поддерживает проект. Прокрутите, чтобы продолжить читать
реклама

Подписывайтесь на новости туризма

Спасибо что смотрите рекламу, это поддерживает проект. Прокрутите, чтобы продолжить читать
реклама