Мультимодальная версия чат-бота умеет одновременно работать с разными типами данных: текстами, изображениями, звуками. В альфа-версии GPT-4(All Tools) все эти функции доступны в одном окне управления.
All Tools может:
Распознавать текст;
Сканировать изображения;
Работать со вложенными файлами в распространенных форматах: Word, Excel, pdf и других;
Генерировать изображения с помощью нейросети DALL-E 3;
Выходить в интернет.
Вот пара примеров от пользователей Medium:
ChatGPT может дополнить рисунок от руки: