جوجل تطلق نموذج Gemini 1.5 Pro AI وتضيف مميزات جديدة

منذ 3 أسابيع

2 دقائق

جوجل تطلق نموذج Gemini 1.5 Pro AI وتضيف مميزات جديدة

القاهرة: «رأي الأمة»

قدمت Google نموذج الذكاء الاصطناعي (AI) مع أكبر نافذة سياقية، Gemini 1.5 Pro، في المعاينة العامة. أعلن عملاق التكنولوجيا لأول مرة عن نموذج الذكاء الاصطناعي في فبراير، وعلى مدى الشهرين التاليين، كان متاحًا في Google AI Studio للمطورين لتجربته.

الآن بعد أن أصبح متاحًا للمستخدمين تجربته، يمكن للمتحمسين أيضًا إنشاء مفاتيح API أو الوصول إليها للبناء باستخدام نموذج اللغة الكبير (LLM). من خلال فتحه للجمهور، قام عملاق التكنولوجيا أيضًا بتضمين إمكانات جديدة متعددة في Gemini 1.5 Pro.

تم تقديم نموذج الذكاء الاصطناعي في المعاينة العامة خلال حدث Google Cloud Next السنوي للشركة. يأتي الإصدار القياسي من Gemini 1.5 Pro مع نافذة سياقية تضم 1,28,000 رمزًا. بالمقارنة، كان لدى Gemini 1.0 نافذة سياقية تضم 32000 رمزًا.
هناك أيضًا نسخة خاصة من النموذج تأتي مع نافذة سياقية ضخمة تضم مليون رمز مميز. الرموز هي الوحدات الأساسية للبيانات، والتي يمكن فهمها على أنها أجزاء أو كلمات أو أقسام فرعية من الكلمات. نافذة السياق هي مقدار المعلومات التي يمكن لنموذج الذكاء الاصطناعي الوصول إليها. استنادا إلى الكلمات الرئيسية في الموجه، للعثور على المعلومات ذات الصلة.

ولوضع الأمر في السياق، يمكن لنافذة السياق المكونة من مليون حرف أن تحتوي على حوالي 700000 كلمة، وهو ما يشبه عشرة كتب متوسطة الحجم تحتوي على 300 صفحة. يمكّن هذا النوع من نشر المعلومات الذكاء الاصطناعي من فهم السياق الأوسع والاستجابة بإجابة يمكن أن تكون أكثر صلة بالمستخدم. علاوة على ذلك، تعد هذه الإمكانية مفيدة بشكل خاص عندما يريد المستخدم من الذكاء الاصطناعي تحليل ملف كبير للعثور على جزء معين من المعلومات.

حصل مستخدم X (المعروف سابقًا باسم Twitter) Rowan Cheung على إمكانية الوصول المبكر إلى نموذج Gemini AI ونشر النتائج التي توصل إليها من استخدامه، قائلًا في إحدى المشاركات: “لقد قمت بتنزيل مسابقة NBA dunk بأكملها من الليلة الماضية وسألت عن أي لعبة dunk حصلت على أعلى الدرجات “. درجات. كان Gemini 1.5 قادرًا بشكل لا يصدق على العثور على 50 تفاصيل وتفاصيل مثالية من خلال فهم الفيديو السياقي الطويل فقط!

يأتي نموذج الذكاء الاصطناعي مزودًا بالعديد من الميزات الجديدة أيضًا. أضافت Google دعمًا أصليًا للصوت أو الكلام، ويمكن لـ Gemini 1.5 Pro فهم المطالبات اللفظية. علاوة على ذلك، تمت إضافة File API للتعامل مع الملفات وتعليمات النظام ووضع JSON للمطورين للحصول على تحكم أفضل في النموذج. كما أنه يأتي مزودًا بإمكانية الوسائط المتعددة الخاصة به ويمكنه تحليل الصور ومقاطع الفيديو. نموذج الذكاء الاصطناعي متاح حاليًا في أكثر من 180 دولة.

للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .

مصدر المعلومات والصور: youm7