Вслед за обновленной поисковой системой со встроенным нейросетевым помощником Bard компания начала разрабатывать полноценную языковую модель под названием Gemini. Она использует наработки Bard, большие базы данных, а ее функциональность не ограничится только текстом. В планах у разработчиков добавить генерацию изображений по текстовому описанию, голосовое управление и анализ блок-схем, чего пока нет у ChatGPT.
Непонятно, будет ли языковая модель взаимодействовать с другими продуктами Google, например, Google Docs, но известно, что доступ к Gemini будет платным через арендованные серверы Google Cloud. К концу года компания планирует открыть доступ для сторонних разработчиков приложений.
Сейчас нейросеть обучается на транскрибации видео из YouTube со строгим соблюдением авторских прав. Gemini умеет распознавать текст, видео, аудио и изображения. Разработчики будут маркировать контент, сгенерированной нейросетью, чтобы появилась возможность обнаруживать его в поиске. Поэтому, если вы будете применять нейросеть для генерации качественного контента в выдаче, алгоритм Google сможет его распознать.
Первая модель Gemini появится в открытом доступе уже в декабре. По словам разработчиков она будет «минимум в 5 раз мощнее GPT-4».