Фото ArenaEV. Google встроила нейросеть Gemini в камеру электромобиля

Отмечается, что Gemini получил доступ к изображению с камеры, направленной вперед, и смог отвечать на вопросы о зданиях, достопримечательностях и других объектах, встречающихся по маршруту. ИИ впервые объединил языковую модель с системой визуального восприятия окружающей среды автомобиля.

Презентацию провели на территории кампуса Google в Маунтин-Вью. Во время тестовой поездки Gemini успешно распознал несколько объектов, включая арт-объект The Orb, солнечную крышу здания Gradient Canopy и концертную площадку Shoreline Amphitheatre, рассказав об их особенностях и истории.

Система не ведет постоянную видеосъемку. Камера активируется только после того, как водитель задает вопрос, а доступ к изображению автоматически прекращается сразу после формирования ответа. Такой подход призван минимизировать риски для конфиденциальности пользователей.

Пока технология остается на ранней стадии разработки. Во время демонстрации наблюдалась заметная задержка, связанная с передачей данных на серверы. Кроме того, интерфейс не отображает изображение с камеры на дисплее мультимедийной системы автомобиля, а водитель получает только голосовой ответ.

В качестве одного из наиболее перспективных сценариев использования Google рассматривает помощь в поездках за границей. Например, водитель сможет попросить Gemini прочитать и перевести дорожный знак на незнакомом языке, не отвлекаясь на смартфон во время движения.