Технологические гиганты, такие как OpenAI и Google, запускают большие языковые модели, чтобы конкурировать в быстро развивающемся пространстве генеративного искусственного интеллекта.
При этом китайская компания Alibaba запустила две новые модели искусственного интеллекта (ИИ), которые могут вести сложные разговоры и понимать изображения.
Две модели китайского технологического гиганта — Qwen-VL и Qwen-VL-Chat — будут доступны исследователям, ученым и компаниям, чтобы они могли разрабатывать свои собственные приложения искусственного интеллекта без необходимости обучения собственных систем.
По данным Alibaba, в то время как Qwen-VL может отвечать на открытые запросы, связанные с различными изображениями, и генерировать подписи к изображениям, Qwen-VL-Chat может участвовать в «сложных взаимодействиях». Например, он может сравнивать несколько входных изображений и отвечать на несколько вопросов.
Другие задачи, которые может выполнять Qwen-VL-Chat, включают написание историй, создание изображений на основе фотографий, которые вводит пользователь, и решение математических уравнений, показанных на картинке.
Как отмечает GN, до сих пор компании концентрировались на создании контента на основе ввода текста людьми, но Qwen-VL-Chat, похожий на последнюю версию ChatGPT OpenAI, может анализировать изображения и отвечать текстом.
Обе модели разработаны на основе LLM компании под названием Tongyi Qianwen, выпущенного ранее в этом году.
Alibaba - китайская публичная компания, работающая в сфере интернет-коммерции, владелец веб-порталов Taobao.com, Tmall, Alibaba.com, AliExpress и ряда других.