Еще в мае 2023 года компания Google объявила о том, что планирует использовать две свои исследовательские группы — Brain Team и DeepMind — для одного большого проекта. Компания хотела объединить их в единое подразделение под названием Google DeepMind. Эта новая команда по замыслу должна была отвечать за работу над моделью искусственного интеллекта Google следующего поколения — Gemini. И вот, спустя несколько месяцев, технологический гигант объявил о запуске трех версий Gemini, причем две из них будут доступны уже сегодня.
Искусственный интеллект Google
В своем блоге компания Google официально представила новую архитектуру искусственного интеллекта Gemini. Описываемая как обладающая самой современной производительностью, Gemini, по словам Google, была создана с нуля, чтобы быть мультимодальной.
Отдельной презентации такое большое событие не удостоилось, но пару слов об этом нам все же сказали. Вот, что компания включила в свое заявление по этому поводу.
До сих пор стандартный подход к созданию мультимодальных моделей предполагал обучение отдельных компонентов для разных этапов работы, а затем сшивание их вместе для грубой имитации некоторых из этих функций. Такие модели иногда хорошо справляются с определенными задачами, например, с описанием изображений, но испытывают трудности с более сложными рассуждениями.
Это уже само по себе звучит хорошо и многообещающе, но компания добавляет еще кое-какие детали, чтобы у нас было еще больше информации о том, что нас ждет с приходом новой модели искусственного интеллекта.
Мы разработали Gemini так, чтобы она была изначально мультимодальной, предварительно обученной на разных модулях. Затем мы доработали его с помощью дополнительных данных, чтобы еще больше повысить его эффективность. Благодаря этому Gemini с нуля понимает и рассуждает обо всех видах входных данных гораздо лучше, чем существующие мультимодальные модели, а его возможности являются передовыми практически во всех областях. — завершает свой рассказ о новом продукте Google.
Самая умная нейросеть
Как сообщается, Gemini будет выпускаться в трех разных размерах, чтобы эффективно работать для различных нужд. Самая большая и самая производительная версия называется Gemini Ultra и, как утверждается, предназначена для выполнения очень сложных задач. Ниже находится Gemini Pro, который предназначен для использования на различных устройствах. Третья версия ИИ — Gemini Nano — призвана стать самой эффективной моделью для решения задач на устройстве. По словам Google, для первой версии Gemini было принято решение об оптимизации в рамках трех моделей. Из этого можно сделать вывод, что в будущем система может быть масштабирована на еще несколько уровней, а мы с вами получим готовый продукт для новых типов устройств или иных типов задач.
Не забывайте о нашем Дзен, где очень много всего интересного и познавательного!
Что касается производительности, то, по утверждению компании из Маунтин-Вью, Gemini Ultra превосходит 30 из 32 академических бенчмарков для современных результатов, используемых для LLM. По сообщениям, новинка превосходит GPT-4 от OpenAI во всех категориях, кроме работы над повседневными задачами, связанными с текстом.
Опасен ли ИИ
В связи с расширением возможностей Google признает необходимость принятия дополнительных мер безопасности. Компания заявляет, что добавляет новые системы защиты к своей текущей политике «Принципы ИИ». Она также заявляет, что «провела новые исследования потенциальных зон риска», применила методы состязательного тестирования, работала с «разнообразной группой внешних экспертов и партнеров», чтобы выявить «слепые зоны», и «создала специальные классификаторы безопасности», чтобы исключить насилие и негативные стереотипы.
Если ищите что-то интересное на AliExpress, не проходите мимо Telegram-канала "Сундук Али-Бабы"!
Что касается сроков внедрения, то тут все становится еще более интересным. Как утверждает Google, Gemini 1.0 будет распространяться сразу с момента анонса. То есть она уже начала свое существование в открытом мире. Одним из продуктов, получающих LLM сегодня, является Bard, который, как сообщается, будет использовать доработанную версию Gemini Pro.
Присоединяйтесь к нам в Telegram!
Смартфоны с искусственным интеллектом
Не забыли и о мобильных устройствах. Pixel 8 Pro также уже должен был получить ИИ в лице Gemini Nano. Он будет использовать Summarize в приложении Recorder и Smart Reply в Gboard для WhatsApp. Кроме того, с помощью Gemini будет усовершенствован поисковый генеративный опыт Google, что, как сообщается, снизит задержку на 40%. Правда, последнее пока относится только к английскому языку и только в США, но нет никаких сомнений, что в ближайшее время будут добавлены другие языки. Рано или поздно среди них появится и русский.
Gemini Ultra будут запущен позже, поскольку, как утверждается, он проходит «обширную проверку доверия и безопасности». Однако Google заявляет, что в начале следующего года сделает Ultra доступной для раннего тестирования избранными клиентами, разработчиками и партнерами.