علیبابا دو مدل هوش مصنوعی برای درک تصاویر و مکالمات پیچیده که Qwen-VL و Qwen-VL-Chat نام دارند را بهطور متن باز منتشر کرد.
براساس گزارش CNBC،کمپانی چینی علی بابا اخیراً دو هوش مصنوعی برای درک تصاویر و مکالمات با نامهای Qwen-VL و Qwen-VL-Chat را معرفی کرده است. براساس مدل زبان بزرگ این شرکت که Tongyi Qianwen نام دارد توسعه یافت و اوایل سال جاری میلادی عرضه شد.
موارد استفاده از هوش مصنوعی علیبابا
به گفته این شرکت، مدل زبانی Qwen-VL قادر است به سؤالات تشریحی و نامحدودی درباره تصاویر مختلف پاسخ دهد و همچنین قادر به ایجاد کپشن یا شرح تصویر برای آنها است.
مدل زبانی Qwen-VL-Chat نیز برای «تعاملات پیچیدهتر» مناسب است. این مدل از هوش مصنوعی میتواند براساس تصاویر کاربران داستان یا عکس ایجاد کند. همچنین معادلات ریاضی موجود در تصاویر را حل کند و به چندین سری سؤالات تخصصی پاسخ دهد و مقاله بنویسد.
علیبابا این ابزار هوش مصنوعی را بهصورت متنباز در اختیار محققان، پژوهشگران و مشتریان در سراسر دنیا قرار می دهد. با این کار صرفهجویی قابلتوجهی در وقت، هزینه و منابع صورت خواهد گرفت و همچنین کمک میکند تا کاربران بیشتری را برای مدل هوش مصنوعی خود جذب کند.
«دنیل ژنگ»، مدیرعامل علیبابا که دفتر مرکزی آن در شهر شرقی «هانگژو» چین قرار دارد در زمان معرفی LLM خود گفت که این فناوری تغییرات بزرگی را در نحوه تولید، انجام کارها و زندگی ما ایجاد خواهد کرد. LLM بر پایهی حجم بسیار زیادی از مجموعه دادههای بزرگی توسعه یافت و در چتباتها کاربرد دارد
از زمان افزایش محبوبیت هوش مصنوعی (AI) در اواخر سال ۲۰۲۲، فناوری هوش مصنوعی مولد بیشتر روی پاسخ به متن تمرکز داشته است. نسخهی جدید ChatGPT نیز میتواند همچون Qwen-VL-Chat تصاویر را بفهمد و در قالب متن پاسخ دهد. ChatGPT که اواخر سال گذشته در دسترس قرار گرفت، چتباتی است که اینترنت را متحول کرد.
منبع: دیجیاتو