تفاصيل مثيرة في إنشاء الصين نموذج الذكاء الاصطناعى Deep Seek
تسببت شركة Deepseek في مجال التكنولوجيا الصينية الناشئة في إحساس في عالم التكنولوجيا من خلال إطلاق نموذجين لغويين كبيرين يتنافسون على أداء الأدوات المهيمنة التي طورتها شركات التكنولوجيا الأمريكية العملاقة ، ولكن تم تصميمها مع جزء بسيط من قوة التكلفة والحوسبة.
وفقًا لموقع “Nature” ، في 20 يناير ، فإن الشركة ، التي يقع مقرها في Hangzhou ، تم إصدارها Deepseek-R1 ، وهو نموذج استدلال مفتوح جزئيًا “يمكنه حل بعض المشكلات العلمية مع معيار مماثل لـ O1 ، وهو تم الكشف عن نموذج اللغة الأكثر تقدمًا من Openai ، الشركة ، ومقرها في سان فرانسيسكو ، كاليفورنيا ، في أواخر العام الماضي.
في وقت سابق من هذا الأسبوع ، أطلقت Deepseek نموذجًا آخر يسمى Janus-Pro-7B ، والذي يمكنه إنشاء صور لمطالبات النص مثل Dall-E3 والانتشار المستقر من Openai ، الذي صنعته AI في لندن.
إذا كان أداء Deepseek-R1 يفاجئ العديد من الأشخاص خارج الصين ، يقول الباحثون داخل البلاد إن نجاح بدء التشغيل يتوقع وتوافقًا مع طموح الحكومة ليصبحوا رائدة عالميين في مجال الذكاء الاصطناعي.
يقول يونغ تشن ، عالم الكمبيوتر الذي يعمل على رقائق الذكاء الاصطناعي في معهد تكنولوجيا الحوسبة في الأكاديمية الصينية للعلوم في بكين ، إنه من الضروري أن ظهرت شركة مثل ديبسيك في الصين ، بالنظر إلى الاستثمار الضخم في رأس المال الاستثماري في الشركات التي تطوير البرامج والعديد من الأشخاص الذين يحملون شهادات الدكتوراه في مجالات العلوم أو التكنولوجيا أو الهندسة أو الرياضيات ، بما في ذلك الذكاء الاصطناعي.
أولوية الحكومة
في عام 2017 ، أعلنت الحكومة الصينية عن نيتها أن تصبح البلاد رائدة عالميًا في الذكاء الاصطناعي بحلول عام 2030.
تم اتهام الصناعة بإكمال الابتكارات الرئيسية في مجال الذكاء الاصطناعي ، بحيث تصل التقنيات والتطبيقات إلى رواد عالمي بحلول عام 2025.
أصبح تطوير خط “مواهب الذكاء الاصطناعي” أولوية ، وبحلول عام 2022 ، وافقت وزارة التعليم الصينية على 440 جامعة لتوفير شهادات جامعية متخصصة في الذكاء الاصطناعي ، وفقًا لتقرير صادر عن مركز CSEET للأمن والتكنولوجيا في جامعة جورج تاون في واشنطن العاصمة.
تقول مارينا تشانغ ، الباحثة في سياسة العلوم بجامعة سيدني للتكنولوجيا في أستراليا ، والتي تركز على الابتكار في الصين ، إن ديبسيك ربما استفاد من استثمارات الحكومة في تدريس الذكاء الاصطناعي وتنمية المواهب ، والتي تشمل العديد من المنح الدراسية والمنح الدراسية والشراكات بين الأوساط الأكاديمية والصناعية ، على سبيل المثال ، يضيف أن المبادرات التي تم وضعها في الولاية ، مثل المختبر الوطني لتكنولوجيا التعلم العميق والتطبيق ، بقيادة شركة Bido Technology ، تدربت الآلاف من المتخصصين في الذكاء الاصطناعي.
يقول جاكوب فيلدوجويس ، الذي يدرس مواهب الذكاء الاصطناعي في الصين في CSET ، إن السياسات الوطنية التي تعزز نظامًا بيئيًا لتطوير نماذج للذكاء الاصطناعي ستساعد الشركات مثل Deepseek ، من حيث جذب التمويل والمواهب.
الكفاءة تحت القيود
ربما يكون العنصر الأكثر إثارة للإعجاب في نجاح Deepseek ، كما يقول العلماء ، هو أنه طور Deepseek-R1 و Janus-Pro-7B وسط ضوابط تصدير تفرضها الحكومة الأمريكية ، مما منع الصين من الوصول إلى شرائح الحوسبة المتقدمة في الذكاء الاصطناعي منذ 2022.
يقول تشانغ إن قيادة ديبسيك تجسد مقاربة صينية مميزة للابتكار ، مع التركيز على الكفاءة في ظل القيود.
قالت Deepseek إنها استخدمت حوالي 2000 H800 Sims التي أنشأتها شركة Nvidia Dotics الأمريكية لـ Deepseek-V3 ، وهو نموذج أصدرته في 1 ديسمبر يتجاوز LLM GPT-4O من Openai ، الذي تم إطلاقه في مايو من العام الماضي ، في اختبارات المعايير.
على العكس من ذلك ، تم إصدار Llama 3.1 405b ، وهو LLM المتقدم ، في يوليو من Meta في Minlo Park ، كاليفورنيا ، على أكثر من 16000 من أكثر شرائح H100 Nvidia تقدمًا.
في نشر عام 2022 على منصة WeChat Social Media ، قال The High-Flyer إنه يحتوي على 10000 شريحة A100 من Nvidia ، والتي قد تمكن Deepseek من الوصول إليها.
قد يكون لاستخدام Deepseek شرائح أقل قوة لجعل نماذجها أرخص في البناء ، والمشكلة ليست أبدًا في المال ، بل الحظر على الرقائق عالية الجودة.
يعتمد Deepseek على مجموعة متنوعة من الطرق لتعزيز كفاءة نماذجها ، على سبيل المثال ، تنشر طريقة تعليمية تلقائية تدرب النماذج بشكل أسرع من التقنيات التقليدية ، ومع طائرة هليكوبتر أقل.
هذا يمكّن الشركة من تدريب النماذج باستخدام عدد أقل من الرقائق.
يتم أيضًا استخدام نسخة مبتكرة من تقنية أخرى ، تسمى الانتباه متعدد الثقوب ، والتي تسمح للنموذج بتخزين المزيد من البيانات بذاكرة أقل.
يقول Yanbu Wang ، الباحث في سياسة العلوم التي تركز على الابتكار في جامعة هونغ كونغ ، إن إنجازات Deepseek يمكن أن توفر خطة للبلدان التي لديها طموحات في مجال الذكاء الاصطناعي ولكنها تفتقر إلى الموارد المالية والأجهزة اللازمة لتدريب الذكاء الاصطناعي النماذج باستخدام نهج وادي السيليكون القياسي ، ويضيف. : “قد يؤدي هذا إلى إنشاء جيش كبير من النماذج الجديدة.”
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
مصدر المعلومات والصور: youm7
اكتشاف المزيد من رأي الأمة
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.