Gemini AI от Google: Конкурент GPT-4 с Перспективными Возможностями

Google представила Gemini, искусственный интеллект, созданный для конкуренции с ChatGPT. Позиционируемая для превосходства над GPT-4 в различных тестах, модель Gemini стала значительным прорывом в развитии искусственного интеллекта, по мнению главы Google Сундара Пичаи. Её предстоящий выход 13 декабря ожидается сильно повлиять на ассортимент продуктов Google.

Разнообразные Опции: Gemini Nano, Pro и Ultra

Под общим названием Gemini Google представила несколько моделей искусственного интеллекта. Перед запуском Gemini Pro, нацеленной на использование в различных сервисах Google, включая чат-бота Bard, появилась модель Gemini Nano, специально разработанная для устройств на базе Android. Gemini Ultra, объявленная самой крупной моделью LLM от Google, представляется подходящей для использования в центрах обработки данных и корпоративных приложений.

Информация о Выходе и Доступе

Выход Gemini, Pro и Nano запланирован на 13 декабря. Доступ к модели Pro будет осуществляться через чат-бота Bard, а разработчики и корпоративные пользователи смогут пользоваться Google Generative AI Studio или Vertex AI на платформе Google Cloud. Стоит отметить, что версия Bard на базе Pro не будет доступна в Великобритании и Швейцарии из-за проблем с координацией. Ultra находится на стадии тестирования и ожидается в 2024 году, возможно, интегрировавшись в улучшенную версию Bard под названием Bard Advanced.

Расширение и Интеграция

Изначально работающая только на английском языке, Google планирует расширить поддержку языков для Gemini в ближайшем будущем. Пичай видит её гармоничное внедрение в поисковую систему Google, рекламные продукты, браузер Chrome и другие приложения.

Мультимодальные Возможности и Производительность

Gemini обладает мультимодальными функциями и успешно обрабатывает текст, аудио, изображения, видео и код. Сравнительные тесты Google между Ultra и GPT-4 показали превосходство Ultra в 30 из 32 оценок производительности, включая рассуждения и распознавание изображений. Кроме того, модель Pro превзошла GPT-3.5 в шести из восьми тестов.

Вехи и Будущие Разработки

Ultra достигла значительного успеха, превзойдя человека в многофункциональном тесте MMLU, охватывающем предметы от математики до этики. Её интеграция в AlphaCode2, предположительно превосходящий в тестах 85% человеческих программистов, является значительным достижением.

Уникальные Преимущества и Перспективы Роста

Основное преимущество Gemini заключается в её мультимодальных функциях, отличающих её от моделей, специализирующихся на распознавании речи или изображений. Google обещает постоянное совершенствование в восприятии Gemini с целью глубокого понимания и улучшенной точности. Эти устремления совпадают с видением генерального директора DeepMind Демиса Хассабиса, который предвидит, что Gemini приобретет больше «сенсорных» способностей, станет более осознанным, точным и в конечном итоге получит более полное понимание окружающего мира.