إطلاق OpenAI GPT-5: قدرات النموذج تتصدر جميع التصنيفات، الخطوة الأولى نحو بناء "ذكاء خارق"

المؤلف: تشانغ يونغ يي

بعد العديد من "التأجيلات"، أخيرًا جاء GPT-5.

في الساعة الواحدة صباحًا بتوقيت بكين في 8 أغسطس، بدأت مؤتمر OpenAI الصيفي الذي يحمل طابع "حفلة الربيع التكنولوجية" من الجيل الجديد.

على عكس مؤتمر الإطلاق السريع السابق من OpenAI، كانت هذه المرة قد أعدت OpenAI بثًا مباشرًا يمتد لأكثر من ساعة، حيث تبادل عدد من الفرق الظهور، وأظهروا أداء GPT-5 القوي من زوايا مختلفة.

لنبدأ بالنقطة الأساسية: لقد شهد GPT-5 تحسينًا شاملًا في العديد من المجالات، حيث يحتل المرتبة الأولى في مجالات النصوص وWebDev والقدرات البصرية؛ كما يحتل المرتبة الأولى في المطالبات الصعبة والترميز والرياضيات والإبداع والاستعلامات الطويلة. تحت الاختبار الذي يحمل الاسم الرمزي "القمة"، يحتفظ حاليًا بأعلى درجة Arena حتى الآن، ويمكن القول إنه "تجاوز الجميع" بمعنى الكلمة.

قال سام ألتمان إن GPT-4o يشبه طالب المدرسة الثانوية، بينما يشبه GPT-5 طالب الجامعة، بل وصف GPT-5 بأنه أول هاتف آيفون مزود بشاشة شبكية – "عندما تسأله سؤالًا، قد تحصل على إجابة صحيحة، وقد تحصل على شيء مجنون. بينما يشعر GPT-4 كأنك تتحدث مع طالب في الجامعة. أما GPT-5، فهو المرة الأولى التي تجعلني أشعر حقًا كأني أتحدث مع خبير بمستوى دكتوراه." هكذا قدم سام ألتمان تحسينات قدرة GPT-5.

على الرغم من أن عدد المستخدمين النشطين أسبوعياً لـ ChatGPT يقترب من 700 مليون، إلا أن OpenAI لم تمتلك فعلياً نماذج رائدة في الصناعة في الفترة الأخيرة. الآن، تعتقد OpenAI أن GPT-5 ستعيدها بشكل قوي إلى صدارة القائمة.

ألتمن حتى صرح مباشرة في المؤتمر: "هذا هو النموذج الأكثر قوة في العالم من حيث القدرة على البرمجة، وهو النموذج الأكثر قوة في العالم من حيث القدرة على الكتابة، وهو النموذج الأكثر قوة في العالم في مجال الرعاية الصحية"

في نفس الوقت، أعلنت OpenAI في المؤتمر الصحفي أن القدرة على كتابة الكود في GPT-5 ليست فقط مذهلة، بل إن مهارات الكتابة ودقة الإجابة عن الأسئلة المتعلقة بالصحة قد تحسنت أيضًا بشكل كبير. كما أن GPT-5 لم يحقق فقط "قفزة هائلة" في الذكاء، بل قلل بشكل كبير من مشكلة "التخريف الجاد". إنه يظهر أداءً أفضل في فهم واتباع التعليمات، وتم تقليل ميل التملق بشكل كبير.

01 وداعًا لـ "الوهم"، الذكاء الاصطناعي أصبح أكثر موثوقية

أولاً هو تشكيل نموذج هذا التحديث، سلسلة GPT-5 تتكون من أربعة إصدارات هي GPT-5 وmini وnano وchat، حيث يتوافق إصدار Chat مع تجربة استجابة أكثر طبيعية وذكاءً - يمكنك حتى استخدامه لتعلم لغة جديدة.

بالإضافة إلى ذلك، عند فتح صفحة ChatGPT الآن، ستلاحظ أولاً أن GPT-5 يتم تقديمه كنموذج واحد، وليس كنموذج تقليدي بالإضافة إلى نموذج استدلال مستقل.

هذا في الواقع نظام توجيه (router) تم تطويره بواسطة OpenAI، حيث يقوم تلقائيًا بالتبديل إلى إصدار أكثر قوة من حيث القدرة على الاستدلال للاستفسارات الأكثر تعقيدًا، أو عندما تخبره بضرورة التفكير بجدية. (قال ألتمان إن واجهة اختيار النموذج السابقة كانت "فوضى فوضوية جدًا").

"أوهام الذكاء الاصطناعي" كانت دائمًا منطقة تذمر كبيرة للجميع. الخبر الجيد هو أن GPT-5 بذل جهدًا كبيرًا في هذا الصدد، حيث أعلنت الشركة رسميًا أن احتمال إنتاجه للأوهام قد "انخفض بشكل كبير". بالتحديد:

عند البحث عبر الإنترنت، فإن احتمال أن تحتوي إجابات GPT-5 على أخطاء في الحقائق أقل بنسبة 45% مقارنةً بـ GPT-4o.

عند التفكير المستقل، فإن احتمال خطأ إجاباتها أقل بنسبة 80% من OpenAI o3

تم اختبار GPT-5 أيضًا على ARC-AGI-2 الجديد. باستثناء Grok 4 (التفكير) ، فإنه يتفوق على جميع النماذج الرئيسية.

علاوة على ذلك، أصبح GPT-5 "شخصًا صادقًا". لم يعد يكذب على المستخدمين أو يتفاخر بقدرته على إنجاز مهام لا يمكنه القيام بها. عندما يواجه مهام غير قابلة للتنفيذ، أو تعليمات غير واضحة، أو يفتقر إلى الأدوات الأساسية، فإنه يتواصل بصدق أكبر حول قيوده.

أكثر ما يثير الاهتمام في هذا التحديث هو إدخال أربعة أنماط جديدة تمامًا من "الشخصية"، حيث يمكن للمستخدمين اختيار ما يناسبهم بحرية. هذه الأنماط هي:

الكلب (السخرية)

روبوت (Robot)

المستمع (Listener)

متفوق (نيرد)

هذه الأنماط اختيارية، يمكنك تحديد الطريقة التي يتفاعل بها ChatGPT معك ويجيب على الأسئلة وفقًا لتفضيلاتك. هل تريد أن يجادلك أم أن يستمع إليك كصديق صبور؟ الآن يمكنك اتخاذ القرار.

"هذا النموذج يعطي شعورًا جيدًا حقًا،" قال نيك تورلي، المسؤول عن ChatGPT، "أعتقد أن الناس سيشعرون بذلك حقًا، خاصة أولئك الذين لا يدرسون النماذج بشكل متكرر."

بالإضافة إلى ذلك، يمكنك أيضًا تغيير موضوع اللون لنافذة الدردشة الفردية، وقد أسعد ذلك عشاق موضوع محرر الشفرات.

02 هل جاءت عصر "توليد البرمجيات حسب الطلب"؟ القدرة على البرمجة مذهلة

مع زيادة القدرة على البرمجة، توقع ألتمن أن قدرات التشفير القوية لـ GPT-5 ستفتح عصرًا يسميه "توليد البرمجيات عند الطلب".

في اختبارات OpenAI، تفوق GPT-5 في أداءه على أي نموذج آخر في عدة معايير ترميز مثل SWE-Bench وSWE-Lancer وAider Polyglot. حقق 42% في الاختبار النهائي البشري و75% في معيار SWE.

هناك ملاحظة صغيرة، وهي أن المحاور في هذه الصورة خلال المؤتمر الصحفي تحتوي بوضوح على العديد من النقاط المثيرة للسخرية، ليس فقط وجود أخطاء غبية مثل 52.8 > 69.1، بل إنها في الواقع تضخم من قدرة GPT-5، وقد تم السخرية من ذلك على وسائل التواصل الاجتماعي حيث قال المستخدمون "يبدو أن هذا العرض التقديمي تم إعداده بواسطة GPT-5، من الأفضل ألا يكون الأمر كذلك".

في المؤتمر الصحفي، استخدم يان دوبوا، المسؤول عن التدريب المتأخر في OpenAI، نموذج GPT-5 لعرض مباشر، طالبًا منه إنشاء موقع ويب لتعلم اللغة الفرنسية يتضمن ألعاب تفاعلية. في غضون ثوانٍ قليلة، كتب GPT-5 مئات الأسطر من التعليمات البرمجية وعرض مباشرة واجهة الموقع الأمامية. شارك شاشته عبر Zoom وقام ببعض النقرات البسيطة، وكل شيء بدا أنه يعمل بشكل مثالي.

في حدث الإطلاق، عرضت OpenAI مباشرة لعبة ثلاثية الأبعاد تم إنشاؤها بواسطة GPT-5 بناءً على عبارة واحدة فقط. المشهد الثلاثي الأبعاد الذي تم إنشاؤه ليس فقط بصريًا متقنًا، بل إن التأثيرات الفيزيائية فيه تعكس بدقة التأثيرات المقابلة.

03 أكثر أمانًا وأكثر "صدقًا"

وفقًا لرئيس أبحاث أمان النماذج أليكس بيوتل، قامت OpenAI بإجراء "أكثر من خمسة آلاف ساعة" من الاختبارات على GPT-5 لفهم مخاطر الأمان الخاصة به. وكان أحد التركيزات الرئيسية هو "ضمان عدم كذب النموذج على المستخدمين".

على الرغم من أن هلوسات GPT-5 أقل من نموذج الاستدلال o3 من OpenAI، إلا أن "الكذب بثقة" لا يزال مشكلة متأصلة في النماذج اللغوية الكبيرة. عندما يبدأ النموذج في إكمال المهام مثل الوكلاء، تصبح هذه المشكلة أكثر تعقيدًا. ومع ذلك، ذكرت OpenAI أن GPT-5 يظهر أداءً أفضل في معالجة المهام متعددة الخطوات بشكل موثوق. "في الماضي، شهدنا نماذج تدعي أنها أكملت مهمة معينة، ولكنها في الواقع لم تكملها،" قال بوتل، "هذه مشكلة."

بالنسبة للمطالبات التي كانت تُرفض الإجابة عليها مباشرة في السابق، ستقدم GPT-5 آلية "الإكمال الآمن" التي تسميها OpenAI. يشرح Beutel: "على سبيل المثال، إذا سأل شخص ما 'كم من الطاقة يحتاج إشعال مادة معينة؟'، فقد تكون هذه سؤالاً خبيثاً يحاول تجاوز الحماية الأمنية وإلحاق الضرر، أو قد يكون طالباً يريد معرفة الخصائص الفيزيائية للمادة. هذا يطرح تحدياً حقيقياً لكيفية استجابة النموذج."

من خلال "الإكمال الآمن"، تحاول GPT-5 "تقديم إجابات مفيدة قدر الإمكان مع الحفاظ على القيود الأمنية". عادةً ما يلتزم النموذج جزئيًا فقط، ويقدم معلومات على مستوى أكثر عمومية لا يمكن استخدامها فعليًا لإحداث ضرر.

04 كيفية استخدام GPT-5

إذن، السؤال الذي يهم الجميع هو: كيف يمكننا استخدام GPT-5؟

الخبر الجيد هو أن جميع مستخدمي ChatGPT يمكنهم الآن تجربة GPT-5 مجانًا. هذه هي المرة الأولى التي تفتح فيها OpenAI نموذجًا متقدمًا لجميع المستخدمين مجانًا. بالطبع، تختلف صلاحيات المستخدمين حسب المستويات:

يمكن لمستخدمي اشتراك Plus الحصول على المزيد من مرات الاستخدام قبل الوصول إلى الحد الأقصى للاستخدام.

يمكن لمستخدمي اشتراك Pro الوصول إلى إصدار GPT-5 Pro الذي يتمتع بقدرات استدلال أقوى.

عندما يصل المستخدم إلى حد الاستخدام، ستتحول ChatGPT تلقائيًا إلى نسخة «ميني» من GPT-5 للتعامل مع الطلبات اللاحقة. في الوقت نفسه، مع إطلاق GPT-5، ستحل رسميًا محل سلسلة من النماذج القديمة مثل GPT-4o وOpenAI o3 وOpenAI o4-mini وGPT-4.1 وGPT-4.5.

بالإضافة إلى ذلك، يبلغ سعر توكنات النسخة القياسية GPT-5 1.25 دولار لكل مليون توكن مدخل و10 دولارات لكل مليون توكن مخرج. أما النسخة المصغرة ونسخة نانو فأسعارهما أرخص بكثير.

يمكن الرجوع إلى التسعير التفصيلي في الصورة أدناه المأخوذة من معلومات الموقع الرسمي.

بالإضافة إلى ذلك، أصدرت OpenAI مع واجهة البرمجة الخاصة بها معلمة جديدة تُسمى "Minimal"، بحيث يمكنك استخدام GPT-5 في جميع الحالات، فقط عن طريق تغيير شدة الاستدلال.

بالإضافة إلى منصة OpenAI الخاصة، أعلن الرئيس التنفيذي لشركة Microsoft، ساتيا ناديلا، أن GPT-5 قد تم إطلاقه على جميع منصات Microsoft، بما في ذلك Microsoft 365 Copilot و Copilot و GitHub Copilot و Azure AI Foundry. في الوقت نفسه، تم تدريب جميع هذه التحسينات على Azure.

أخيرًا، قال ألتمن إن مهمة OpenAI هي تطوير الذكاء الاصطناعي العام (AGI). تجعلهم GPT-5 أقرب إلى هذا الهدف، على الرغم من أن الصناعة بأكملها قد بدأت بالفعل في التحول نحو بناء ما يسمى بـ "الذكاء الفائق".

قال ألتمن: "أنا أكره قليلاً كلمة AGI لأن تعريفها يختلف قليلاً بين كل شخص الآن، لكن هذه خطوة مهمة نحو نموذج قوي حقاً. من الواضح أن نموذجاً يتمتع بالذكاء العام مطلوب لتحقيق ذلك."

ومع ذلك، اعترف أيضًا أنه مقارنةً بـ AGI الحقيقي، لا يزال GPT-5 "يفتقر إلى بعض الأشياء المهمة جدًا".

"هذا ليس نموذجًا، بل هو شيء أصلي ينمو من الأشياء الجديدة التي اكتشفها، بالنسبة لي، هذا هو السبب في أنه يمكن أن يصبح "بذور" AGI." هكذا قدم سام ألتمان.

GPT4.8%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت