تقنية

كوالكوم تضيف أدوات الذكاء الاصطناعي خارقة إلى هواتف أندرويد

القاهرة: «رأي الأمة»

تضيف شركة Qualcomm المزيد إلى مجموعتها من حيل الذكاء الاصطناعي على الهاتف والتي تسهلها سلسلة Snapdragon من هواتف Android. خلال معرض Mobile World Show، عرضت شركة تصنيع الرقائق بعضًا من قدرات الذكاء الاصطناعي الرائعة لـ Snapdragon 8 Gen 3، مثل التحرير… الوسائط مع الصوت، وإنشاء الصور على الجهاز باستخدام Stable Diffusion، ومساعد افتراضي أكثر ذكاءً مبني على نماذج لغوية كبيرة من أمثال ميتا.

تضيف الشركة المزيد من القوة إلى قواها الخارقة في مجال الذكاء الاصطناعي. الأول هو القدرة على تشغيل مساعد اللغة والرؤية الكبير (LLaVa) على الهاتف الذكي. فكر في الأمر باعتباره برنامج دردشة آلي مثل ChatGPT تم منحه إمكانات Google Lens. على هذا النحو، لا يمكن أن يقبل حل Qualcomm ليس فقط إدخال النص، بل يمكنه أيضًا معالجة الصور.

على سبيل المثال، يمكنك دفع صورة تصور لوحة تشاركوتيري وطرح الأسئلة بناءً عليها. سيخبرك مساعد الذكاء الاصطناعي، الذي يعتمد على نموذج كبير متعدد الوسائط (LMM) يمكنه معالجة أكثر من 7 مليارات معلمة، بجميع أنواع الفواكه والأجبان واللحوم والمكسرات.

ويمكنه أيضًا التعامل مع استفسارات المتابعة، حتى تتمكن من إجراء محادثة متدفقة ذهابًا وإيابًا. اكتسبت أمثال ChatGPT أيضًا إمكانات الوسائط المتعددة، مما يعني أن أداة OpenAI يمكنها أيضًا التعامل مع مدخلات الصور. ومع ذلك، هناك فرق حاسم.

لا تزال منتجات مثل ChatGPT وCopilot مرتبطة إلى حد كبير بالسحابة، مما يعني أنه يتم التعامل مع بياناتك على خوادم بعيدة، لكن Qualcomm تتجه نحو المعالجة على الجهاز، لذا فإن كل ما يحدث على الهاتف مرتبط، مما يعني أن العملية برمتها أسرع، و هناك خطر ضئيل لانتهاكات الخصوصية. .

“يعمل LMM بمعدل اسمي سريع الاستجابة على الجهاز، مما يؤدي إلى تحسين الخصوصية والموثوقية والتخصيص والتكاليف”، كما تقول Qualcomm، حيث لم يتم التأكيد رسميًا بعد ما إذا كان المساعد الافتراضي المستند إلى LLaVa الذي وعدت به Qualcomm سيصل كتطبيق مستقل أو ما إذا كان سيتم فرض رسوم.

الإعلان التالي من Qualcomm يغوص في المجال الإبداعي لتوليد الصور ومعالجتها. وكانت الشركة قد جربت سابقًا أسرع جيل في العالم لتحويل النص إلى صورة على الهاتف باستخدام تقنية Stable Diffusion، واليوم تقدم الشركة لمحة أولى عن توليد الصور المستندة إلى LoRA.

تتبع LoRA نهجًا مختلفًا في توليد الصور عن أدوات الذكاء الاصطناعي التوليدية العادية مثل Dall E. LoRA، وهي اختصار لـ Low-Rank Adaptation، هي تقنية طورتها Microsoft. يمكن أن يكون تدريب نموذج الذكاء الاصطناعي مكلفًا للغاية، ويتطلب زمن وصول عاليًا، ويتطلب جهدًا خاصًا من منظور الأجهزة.

ما يفعله LoRA هو أنه يقلل بشكل كبير من وزن النموذج، وهو هدف يتم تحقيقه من خلال التركيز فقط على أجزاء محددة من النموذج وتقليل عدد المعلمات لأغراض التدريب.

من خلال القيام بذلك، يتم تقليل متطلبات الذاكرة، وتصبح العملية أسرع، كما يتم أيضًا تقليل مقدار الوقت والجهد المطلوب لتكييف نموذج تحويل النص إلى صورة بشكل كبير.

بمرور الوقت، تم تطبيق تقنية التقطير LoRA على نموذج Stable Diffusion لإنشاء صور من المطالبات النصية، وبالنظر إلى المكاسب في الكفاءة وسهولة التكيف للنماذج المستندة إلى LoRA، يُنظر إليها على أنها طريق مصمم خصيصًا للهواتف الذكية.

من المؤكد أن شركة Qualcomm تعتقد ذلك، وحتى منافستها MediaTek تبنت نفس الحل لحيل الذكاء الاصطناعي التوليدية على شريحة Dimensity 9300 الرائدة.

تعرض شركة Qualcomm أيضًا بعض حيل الذكاء الاصطناعي الأخرى في MWC 2024، والتي ظهر بعضها بالفعل على Samsung Galaxy S24 Urtla.

من بينها القدرة على توسيع لوحة الصور باستخدام تعبئة الذكاء الاصطناعي وإنشاء الفيديو المدعوم بالذكاء الاصطناعي. هذا الأخير طموح للغاية، خاصة بعد رؤية ما أنجزته OpenAI مع Sora، حيث سيكون من المثير للاهتمام رؤية كيف تمكنت Qualcomm من نقله إلى الهواتف الذكية.

للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .

مصدر المعلومات والصور: youm7

 

زر الذهاب إلى الأعلى

اكتشاف المزيد من رأي الأمة

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading