المتدربون في ظل جنون النماذج الكبيرة: 985 للفرد؟ ولكن "وضع العلامات" في مصنع كبير

المصدر: جيازي قوانغنيان

المؤلف: تشو يو

في اليوم الأول من التدريب الرسمي، شعرت تشين شي أنها ربما تعرضت "للغش".

كانت تشين شي، طالبة الدراسات العليا المرتقبة التي أنهت للتو أطروحتها للتخرج من المدرسة، مستعدة للعثور على شيء تفعله بنفسها. بعد تقديم العديد من السير الذاتية، تمت دعوتها قريبًا إلى منصب تحرير الذكاء الاصطناعي (اتجاه الترجمة) لشركة إنترنت محلية كبرى.

الوصف الوظيفي يقرأ:

  1. توفير مجموعة عالية الجودة للتعلم الآلي للذكاء الاصطناعي وتكرار تكرارات التدريب النموذجي؛

  2. التواصل مع الفريق الفني بشأن المتطلبات وتقديم بيانات عالية الجودة ومؤهلة في الوقت المحدد، ويكون مسؤولاً عن جودة نتائج التحرير.

بالنسبة لتشن شي، الذي لم يكن يعرف الكثير عن التدريب النموذجي، بدا هذا بمثابة تدريب جيد جدًا.

كانت مقابلة Chenxi في مجال الترجمة، وهو ما يتوافق تمامًا مع تخصصها في اللغة الإنجليزية، وفي بداية العام، أصبح ChatGPT مشهورًا في الصين، واعتادت Chenxi على استخدام منتجات الذكاء الاصطناعي كل يوم، وهو ما يتماشى مع اهتماماتها وبالإضافة إلى ذلك، ستتاح لها الفرصة للمشاركة في التكنولوجيات الناشئة. إن التنمية الصناعية نادرة بالنسبة لطلاب الفنون الحرة؛ وبطبيعة الحال، يأتي الجذب الأكبر من شركة الإنترنت الكبرى هذه. وفي السنوات القليلة الماضية، نجحت الشركة في جذب عدد لا يحصى من الطلاب الشباب. من وجهة نظر معينة، فإن اسم شركة كبرى في السيرة الذاتية يكفي ليصبح رمزًا لقدرات الفرد.

ومع ذلك، وبصرف النظر عن الوصف الوظيفي البسيط في صفحة التوظيف، لم يحصل تشن شي على أي معلومات إضافية حول هذا التدريب من القائم بإجراء المقابلة.

"سبب شعوري بالغش في ذلك الوقت هو أن قسم الموارد البشرية ركز بشكل أساسي على القضايا المتعلقة بالترجمة أثناء المقابلة." وبعد الإجابة على العديد من أسئلة الترجمة خلال المقابلة، حصل تشين شي على العرض بنجاح. حتى بدأت العمل، كانت تعتقد أنها وظيفة مترجمة.

تشين شي ليس الوحيد الذي يشعر "بالغش".

وباعتباره أحد أوائل المتدربين في محرري الذكاء الاصطناعي، جاء يانغ شياو يون أيضًا إلى هذا المصنع الكبير في نهاية فبراير. وقال القائم بإجراء المقابلة أن هذه الوظيفة تتطلب قدرات عالية مثل التقاط المعلومات وتلخيص اللغة وتحرير النص.

بعد أن بدأت بالفعل، أدركت أن "العمل الموصوف من قبل قسم الموارد البشرية والعمل الفعلي شيئان مختلفان تمامًا. وبغض النظر عن مدى بريقه، فهو في الواقع وظيفة "تمييز"."

في الوقت الحاضر، أدى جنون الذكاء الاصطناعي إلى ظهور روبوتات الدردشة التي تبدو وكأنها أشخاص حقيقيين، وبرامج الرسم التي يمكنها إنشاء صور بمطالبات بسيطة. لقد اجتذب ظهور النماذج الكبيرة على مستوى الظاهرة الكثير من الاهتمام كأساس لتدريب النماذج الكبيرة. وقد اجتذبت البيانات والخوارزميات والقدرة الحاسوبية الكثير من الاهتمام. ويُعد شرح البيانات جزءًا لا غنى عنه من رابط البيانات.

في عام 2007، بدأ لي فايفي، الذي كان حينها أستاذًا مساعدًا في قسم علوم الكمبيوتر بجامعة برينستون، مشروعًا يسمى ImageNet، على أمل توسيع البيانات التي يمكن استخدامها لتدريب خوارزميات الذكاء الاصطناعي.

من أجل توفير أكبر عدد ممكن من الأمثلة المرئية لكل كلمة، أمضى ما يقرب من 50 ألف عامل في منصة التعهيد الجماعي لشركة أمازون Mechanical Turk عامين ونصف في تصنيف الأشياء في الصور، مثل البالونات والفراولة وما إلى ذلك، بإجمالي 3.2 مليون صورة. . يأتي هؤلاء العمال من 167 دولة حول العالم ويوجد معظمهم في مناطق ذات تكاليف عمالة منخفضة.

توصل تحقيق أجرته مجلة تايم إلى أنه من أجل الحد من العنف والتمييز الجنسي والعنصرية في مجموعة بيانات ChatGPT، استخدمت OpenAI العمال الكينيين الذين يكسبون أقل من دولارين في الساعة. وذكرت "بلومبرج" أن روبوت الدردشة Bard الذي يعمل بالذكاء الاصطناعي من Google قد تم تدريبه على يد الآلاف من العمال المتعاقدين، الذين لم يكن لديهم سوى 3 دقائق لمراجعة إجابات Bard والتعليق عليها.

لفترة طويلة في الماضي، لم يكن شرح البيانات يتطلب متطلبات معرفية عالية للتعرف على اللغة والصور. في عصر النماذج الكبيرة، تحول شرح البيانات من الصور إلى اللغة، وهي أكثر تطلبًا وعمودية، وتتطلب معرفة مهنية في مجالات محددة ومهارات لغوية بطلاقة.

لكن بالنسبة لمعلقي البيانات العاديين، لا تزال هذه مهمة منخفضة التقنية وتتكرر باستمرار.

تمامًا مثل هؤلاء الطلاب "المغشوشين" من المدارس المرموقة الذين يدخلون المصانع الكبيرة للتدريب الداخلي، لا يمكنهم أن يشرحوا بوضوح الغرض من عملهم وما هي قيمته. غالبًا ما يكون لديهم فهم غامض لها من أجل "تدريب النماذج الكبيرة".

وُلِد المتدربون في تحرير الذكاء الاصطناعي، الذين يمثلهم تشن شي ويانغ شياو يون، بسبب الحاجة إلى تدريب نماذج كبيرة. تسمح هذه النماذج المشهورة واسعة النطاق للمتدربين بالدخول بفضول وشوق، وفي الوقت نفسه، يشعرون أيضًا بالفوضى الحقيقية ونقص القيمة وراءهم.

1. عندما ينهمك طلاب الجامعات في التعليقات التوضيحية لبيانات النماذج الكبيرة

**يعتقد الناس عادةً أن معلقي البيانات هم مجموعة من الأشخاص ذوي التعليم المنخفض وكبار السن الذين يعيشون في مدن من الدرجة الثالثة والرابعة. في الواقع، كان هذا بالفعل هو الوضع الحالي لمفسري البيانات المحلية من قبل. **

وفقًا لـ "معايير المهارات المهنية الوطنية لمدربي الذكاء الاصطناعي" الصادرة عن وزارة الموارد البشرية والضمان الاجتماعي في عام 2021، فإن مستوى التعليم العام لمدربي الذكاء الاصطناعي هو التخرج من المدارس الإعدادية (أو التعليم المعادل). وقد يكونون منتشرين في المناطق التي توجد فيها مؤسسات تقليدية كثيفة العمالة، مثل هيبي، وخنان، وشاندونغ، وشانشي، أو حتى في المناطق الجبلية النائية حيث يشكل شرح البيانات مشروعا تجريبيا للتخفيف من حدة الفقر.

**لكن التغيرات حدثت بالفعل مع ظهور النماذج الكبيرة. **

ما يجعل يانغ شياويون يشعر بالملل هو في الواقع العمل التوضيحي للبيانات الذي تم إجراؤه لتدريب النماذج الكبيرة.

بعد تدريب وتقييم بسيط، تم تعيين يانغ شياو يون في فريق تحرير النسخ. **وظيفتها اليومية هي الإجابة على الأسئلة في بنك الأسئلة، والغرض من ذلك هو تحسين عملية تدريب النماذج الكبيرة عن طريق كتابة الإجابات يدويًا بواسطة المفسرين. **

** يتم التحكم بدقة في خطوات الإجابة على السؤال. ** خذ لعبة "Genshin Impact" كمثال، إذا تلقيت السؤال "ما هو أثر ييلان المقدس؟"، يحتاج يانغ شياو يون إلى تقسيم الإجابة إلى عدة فقرات: أولاً، ما هو ييلان؟ ثانيا ما هي الآثار المقدسة؟ ما الذي يتطابق مع بقايا ييلان المقدسة في النهاية؟

اجمع المعلومات في محرك البحث المخصص، وأكمل تحرير الإجابة، وأرسلها أخيرًا في شكل Markdown.

بالإضافة إلى الأسئلة البسيطة وسهلة الإجابة، قضى يانغ شياو يون معظم وقته في المجالات المهنية التي لم يكن على دراية بها تمامًا، مثل المنطقة الاقتصادية والمنطقة القانونية وما إلى ذلك.

من الواضح أن هذا يختلف تمامًا عن أعمال التعليقات التوضيحية السابقة للبيانات. **

قبل ظهور النماذج الكبيرة، كانت سيناريوهات شرح البيانات عبارة عن مصانع تضم مئات الأشخاص، وكان كل شخص لديه جهاز كمبيوتر، ولم يكن هناك سوى صوت الفأرة ولوحة المفاتيح. وخلال يوم عملهم الذي يستغرق 8 ساعات، يقومون فقط بشيء واحد بسيط ومتكرر: تأطير المركبات الآلية، والمركبات غير الآلية، والمشاة، وإشارات المرور (كشف الأهداف) في صور مختلفة؛ أو وضع خط تحت موضوع الفقرة، المسند، كائن (تجزئة الدلالية).

تقوم مربعات الرسم هذه للصور ومقاطع الفيديو والتقسيم الدلالي للنص بمعالجة البيانات الموجودة، ولا يحتاج مشروحو البيانات أنفسهم إلى تقديم "استنتاجات إبداعية". ولكن هذا ليس هو الحال بالنسبة لشرح بيانات النماذج الكبيرة. بالإضافة إلى معالجة البيانات الموجودة، يحتاج مشروحو البيانات أيضًا إلى الإجابة على الأسئلة وتقديم الاستنتاجات الصحيحة. **

وفقًا لـ "التقرير البحثي المتعمق للتحليل واتجاه الاستثمار حول الوضع الحالي لصناعة تعليقات البيانات في الصين (2023-2030)" الصادر عن مركز بيانات Guanyan Tianxia في عام 2023، قبل إصدار ChatGPT، كان شرح بيانات تدريب الذكاء الاصطناعي يعتمد بشكل أساسي على على الصوت والرؤية الحاسوبية، واللغة الطبيعية، يقل الطلب على المعالجة (NLP) عن 15%.

نظرًا لأن Chatbot chatGPT أصبح تطبيقًا استثنائيًا لـ AIGC، هناك طلب متزايد على مهام التعليقات التوضيحية النصية عالية الجودة مثل الحكم العاطفي والقدرة على الفهم وحتى القدرة على التفكير.

"لقد أصبح تعقيد المشاريع (النموذجية الكبيرة) أعلى من ذي قبل، كما أن متطلبات الموظفين مختلفة نسبيًا." قال الشخص المسؤول عن قسم منتجات بيانات ستاردست لـ "جيازي لايت يير"، "التعرف على المعلومات المرئية الجزئية والتعليق عليها تتطلب القيادة الذاتية، التي تتطلب المزيد من العمل البدني، بعض التدريب للموظفين. وبعد أن يتعلموا كيفية سحب الصناديق، وإتقان مفاتيح الاختصار، وإتقان بعض المهارات، يمكنهم أن يصبحوا أكفاء بسرعة. ** ولكن ما تحتاجه النماذج الكبيرة هو تدريب كامل وشامل منظم، وهو نظام بيانات متنوع وشامل يتطلب أربع طبقات من البيانات لدعم بناء النموذج وتحسينه. تتضمن هذه البيانات التدريب المسبق، وSFT (الضبط الدقيق الخاضع للإشراف)، وRLHF (التعلم المعزز بناءً على التعليقات البشرية، تعزيز التعلم من ردود الفعل البشرية)، والنشر الخاص، وما إلى ذلك. واستجابة لاحتياجات الصناعات المختلفة، قمنا بإصدار حل هرم البيانات النموذجي الكبير لـ COSMO؛ بالنسبة لمعلقي بيانات النماذج الكبيرة، فإن تصنيف بيانات COSMO ليس سؤالًا متعدد الاختيارات، ولا هل الأمر بسيط؟ بدلاً من فهم القراءة وتحرير النص، فإنه يسمح لك بإنشاء أسئلة وإجابات وإنشاء محتوى.**"

يقسم جيا يوهانغ، المدير العام لبيانات القياس السحابي، بيانات التدريب للنموذج الأكبر إلى ثلاث مراحل: البيانات الأساسية وبيانات المشهد وتحسين بيانات المشهد. ** وشبه هذه المراحل الثلاث بعملية التعلم.

"إن التعليقات التوضيحية للبيانات الأساسية مثل رسم المربعات بسيطة نسبيًا، ويمكنك إتقان تشغيل الكمبيوتر بمجرد أن تتعلمها؛ وبيانات المشهد هي بيانات في مجال معين مطلوب للبحث والتطوير المستهدف في روابط محددة، وتحتاج إلى تعلم ما هو ذي صلة "معرفة المجال لتحقيق متطلبات التعليقات التوضيحية؛ بحلول المرحلة الثالثة، استنادًا إلى التكرار المستمر والتحسين أثناء الاستخدام، سيتم تحسين متطلبات المهارات ومعرفة المجال بشكل أكبر." قال جيا يوهانغ.

في ظل هذا النوع من الطلب على العمل، فإن المزيد والمزيد من الشركات النموذجية الكبيرة لديها طلب على شروح البيانات، والتي تغيرت أيضًا من التعليم المنخفض إلى التعليم العالي في الماضي، وهذا الطلب آخذ في الازدياد.

على منصات البحث عن الوظائف المحلية السائدة، يتم حاليًا تعيين العديد من وظائف التعليقات التوضيحية للبيانات للنماذج الكبيرة. تتطلب هذه المواقف أن يكون المدونون حاصلين على درجة البكالوريوس أو أعلى. ذكرت بايدو سابقًا أن قاعدة البيانات النموذجية الكبيرة الخاصة بها في هايكو تضم مئات من المفسرين للبيانات، وقد وصل معدل الدراسة الجامعية إلى 100%.

مصدر الصورة: BOSS Zhipin & Maimai

2. تعليقات توضيحية قاسية لبيانات النماذج الكبيرة

بشكل عام، يتطلب تدريب نموذج كبير الخطوات الثلاث التالية:

المصدر: OpenAI "تقديم ChatGPT"

وراء هذه المهام المتكررة هو في الواقع تحقيق تقنية "التعلم المعزز من ردود الفعل البشرية". أكبر تحسين لـ GPT-3.5 يأتي من هذا. المفتاح هو مشاركة الإنسان (الملصق)، أي هؤلاء المفسرين للبيانات.

من الخطوات الثلاث المذكورة أعلاه لـ RLHF، تعد الخطوة الأولى والخطوة الثانية أكثر أهمية نسبيًا، لأنها تحدد مستوى جودة البيانات اللازمة لتدريب نموذج المكافأة. ينقسم المتدربون في مجال شرح البيانات في هاتين الخطوتين أيضًا إلى مجموعتين أساسيتين: "مجموعة التحرير" و"مجموعة الفرز". **

تتمثل مهمة فريق التحرير في الإجابة على الأسئلة الموجودة في بنك الأسئلة، بينما تتمثل مهمة فريق الفرز في ترتيب الإجابات التي تم إنشاؤها (بما في ذلك الإجابات النموذجية والإجابات المصطنعة).

انضم Ding Xiaoyu إلى محرر النسخ في يوليو. تتطلع دينغ شياو يو، وهي أيضًا متخصصة في اللغة الإنجليزية، وتشين شي، إلى وظيفة ترجمة يمكنها تحسين مستواهما المهني، لكن وظيفتها في الواقع لا علاقة لها باللغة الإنجليزية.

مقارنة بما كان عليه عندما كان يانغ شياويون يتدرب في فبراير، أصبح فريق تحرير النسخ الذي يواجهه دينغ شياو يو أكثر انقسامًا، حيث يتعين على كل متدرب اختيار اتجاه عمودي، مثل الترفيه والفيزياء والسياسة وما إلى ذلك، وأصبحت متطلبات الإجابة أكثر مفصلة.

بالنسبة لسؤال متعدد الاختيارات حول الشعر القديم، لا ينبغي عليك فقط شرح الإجابة، بل يجب عليك أولا تقديم نوع السؤال، ثم ترجمة الشعر وخلفيته، وأخيرا تحليل ما إذا كان كل خيار صحيحا أم لا، والأهم الشيء هو المقارنة مع GPT-4 لشهر مارس الذي أصدرته OpenAI في الرابع عشر.

"عليك أن تشير إلى إجابتها، لكنها لا يمكن أن تكون نفس إجابتها، ويجب أن تكون أفضل من إجابتها." كان دينغ شياو يو عاجزًا.

تم تعيين Chenxi في مجموعة الفرز، حيث تم فرز إجابات متعددة للأسئلة كل يوم لتحديد إيجابيات وسلبيات الإجابات المختلفة.

يجب تحديد نتائج التصنيف بشكل واضح. إنها بحاجة إلى تقييم الإجابات من وجهات نظر مختلفة مثل الفائدة والأصالة والملاءمة والسلامة وما إلى ذلك وكتابة الأسباب. وذلك للسماح للآلات بالاقتراب بشكل لا نهائي من الإجابات التي يتوقعها البشر.

** وجدت تشين شي نفسها تضطر في بعض الأحيان إلى الاختيار بين عدة إجابات سيئة. وعندما كانت جميع الإجابات سيئة، طُلب منها أن تكتب إجابة أفضل بنفسها. **

يواجه دينغ شياو يو من فريق التحرير متطلبات أكثر تطلبًا. ستواجه كل إجابة جولتين من المراجعة قبل أن تصبح مؤهلة للتسليم. الأولى جاءت من قائد الفريق: "بعد الانتهاء من بعض الأسئلة، سنعقد اجتماع مراجعة للعثور على الأخطاء معنا حتى يقتنع قائد الفريق بالتغييرات". حتى ينتهي المقر من المراجعة.

ذات مرة، بسبب أخطاء في التنسيق، تم الحكم على معظم إجابات Ding Xiaoyu بأنها خاطئة تمامًا. "قد يكون كافيًا تعديل الترتيب، لكنهم لا يهتمون بما إذا كان محتوى إجابتك خاطئًا أو أن هناك مشكلة في التنسيق. كل ما في الأمر هو أن كل شيء خاطئ."

ما جعل دينغ شياويو أكثر تدميراً هو أن قائد الفريق صرح بشكل مباشر بأنها إذا ارتكبت الكثير من الأخطاء مرة أخرى، فقد يتم فصلها.

** يعد التعليق التوضيحي للبيانات للنماذج الكبيرة مهمة موجهة نحو تحقيق النتائج تمامًا. بغض النظر عن مقدار الجهد الذي بذلته في هذه العملية، طالما أن النتائج ليست جيدة، فسيتم إلغاء جميع الجهود السابقة تمامًا. **

لكن المشكلة هي أنه سواء كان الأمر يتعلق بإخراج الإجابة من مجموعة التحرير أو فرز الإجابات بواسطة مجموعة الفرز، فهي مهمة ذاتية للغاية. من الصعب على المتدربين في مجال شرح البيانات التحكم فيما إذا كانت الإجابة جيدة أم سيئة؛ غالبًا ما يقدم المتدربون المختلفون إجابات مختلفة لنفس السؤال.

**لحل هذه المشكلة، إحدى المهام التي يجب أن يؤديها فريق التعليقات التوضيحية لبيانات النماذج الكبيرة كل يوم هي عقد "اجتماع مراجعة" - يُعرف باسم "اجتماع السباق" داخل الشركة. والغرض من ذلك هو مواءمة معايير الإجابة ومواءمة الإجابات. الجميع يفهم وجميع الاقتراحات تتماشى. **

ومع ذلك، من الصعب جدًا تحقيق التوافق الحقيقي. هذا تمامًا مثل درجات امتحان القبول بالكلية، حيث سيتم تخصيص نفس الأسئلة لأشخاص مختلفين، وإذا كانت الدرجات غير متسقة، فيجب تعديلها باستمرار حتى يتم الحصول على درجة موحدة.

في انطباع تشن شي، يتم قضاء ساعتين أو ثلاث ساعات في الاجتماعات كل يوم. وبحلول نهاية الاجتماع، غالبًا ما يتم الانتهاء من الحل الأبسط والأكثر فظاظة، مع طاعة الأقلية للأغلبية، ووصفت ذلك بأنه "خلق قيمة بلا قيمة".

ومع ذلك، بالمقارنة مع الجميع الذين يجلسون معًا لمحاذاة معايير الإجابة "بشكل مصطنع"، فإن المشكلة الأكثر إزعاجًا هي: أن المعايير ** لا تتم مواءمتها بشكل مصطنع مرة واحدة وإلى الأبد، ولكن يجب تعديلها باستمرار بناءً على التعليقات الواردة من مخرجات النموذج. **

أول شيء عندما يذهب إلى العمل كل يوم، يحتاج يانغ شياو يون إلى التأكد مما إذا كان قد تم إصدار معيار جديد للتعليقات التوضيحية في ذلك اليوم، بدءًا من إطار الإجابة، وتقسيم الفقرات، إلى اختيار محركات البحث، وتنسيقات مثل المسافات وعلامات الترقيم. لكن ** المعايير تتغير باستمرار. **بمجرد اكتشاف أن البيانات المغذية لا تعمل على الجهاز، يجب إعادة صياغة المعايير، وسيتم إلغاء جميع المشكلات وإعادة كتابتها.

"إنه مثل النسيج. هل يجب أن ننسج حبيبات أفقية أم عمودية؟ هل يجب أن ننسج أزرار السمسم أو أزرار القمح؟ ولكن بغض النظر عن الزر، لا يمكن إلا وضعه في البرنامج وتشغيله. إذا وجدت أنه لا يمكن تشغيله "يجب عليك تغيير الطريقة." وأوضح يانغ شياويون لـ "جيازي جوانغنيان". وراء هذا التشبيه هو أنه إذا كانت الإجابة المقدمة من خلال شرح البيانات قد لا تحقق التأثير المتوقع أثناء عملية التدريب على نموذج المكافأة، فيجب تعديل المعيار.

تغيير المعايير يعني أن نتيجة اجتماع التوافق الأخير غير صالحة ويجب مطابقة المعايير مرة أخرى.

"كثيرة وفعالة، تتحدث عن الهراء بكفاءة عالية كل يوم." اشتكى يانغ شياويون.

3. الطلاب المتفوقون الذين يتم استغلالهم من قبل المصانع الكبرى

من ناحية، هناك اجتماعات جماعية لا نهاية لها تعقد كل يوم، ومن ناحية أخرى، هناك معايير بيانات قد تتغير في أي وقت. العديد من الطلاب المتفوقين، مثل تشين شي، الذين انجذبوا إلى العلامات الساطعة والمشرقة للمصانع الكبيرة، فقدوا حماستهم الأصلية بسبب الصراع الداخلي واختاروا أخيرًا المغادرة.

** السمة المشتركة بين هؤلاء المتدربين هي الدرجة العالية من التعليم. شرط التوظيف هو درجة البكالوريوس أو أعلى، ولكن العديد من المتدربين لديهم درجة الماجستير. **

ويتلقى العديد منهم تعليمهم في أفضل الجامعات في الصين وحتى في العالم. كان يانغ شياو يون محاطًا بطلاب من جامعة بكين وكلية إمبريال كوليدج في لندن، وكان المتدربون بجوار محطة عمل تشينشي من جامعة نانكاى وجامعة العلوم الإلكترونية والتكنولوجيا في الصين؛ تم إبلاغ دينغ شياو يو بوضوح أثناء التدريب بأن المؤهلات الأكاديمية للمتدربين تم فحصها. "وقال (الذي أجرى المقابلة) إن طلاب الجامعات المتعلمين تعليما عاليا مثلنا يمكنهم تعلم الأشياء بسرعة والبدء بسهولة."

**إن إدارة مجموعة من الأشخاص الأذكياء ليس بالأمر السهل على الإطلاق. لأن هؤلاء الأشخاص يمكنهم بسهولة اكتشاف جوهر عملهم من خلال الإجراءات المتكررة، ثم يتساءلون عما إذا كانت هذه الوظيفة ذات قيمة حقًا لمستقبلهم. **

وصف دينغ شياو يو عمله بأنه "قليل القيمة ويستنزف داخليًا للغاية".

عندما تأتي إلى محطة عملها كل صباح، تفتح شاشة العرض والدفتر، وتستخدم الدفتر للتحقق من القواعد أثناء كتابة الإجابات على شاشة العرض، يمكن أن تشعر دينغ شياو يو بوضوح أن القواعد والإجراءات التفصيلية تجعلها تفقد المساحة تدريجيًا للتفكير، ويصبح الانضباط آلة. "إذا لم تتعلم شيئًا ما، ولم تكن لديك الطاقة لتعلم أشياء أخرى، فسوف تفقد ببطء حافزك للتعلم وحماسك للقيام بأشياء أخرى."

عمل دينغ شياو يو أيضًا في فريق إزالة التحسس، لكن العمل الفعلي ليس له صلة أساسية بكلمة "إزالة التحسس"، فهو يستخدم فقط برامج الدردشة المختلفة والمنتجات التجريبية الداخلية للشركة للإجابة على نفس الأسئلة، ويقارن الإجابات ويسجلها. وبعد العمل لبضعة أيام فقط، تم نقلها إلى فريق التدقيق اللغوي، وما كان عليها فعله هو تصحيح الأخطاء التي حدثت عند تحويل تنسيق PDF إلى تنسيق Word، وخاصة الأخطاء المطبعية وعلامات الترقيم. وفي عملية وصفتها بأنها "على وشك الانهيار"، أكملت 25 صفحة من مهام تصحيح الأخطاء الطبية يوميًا.

أثناء عملية المقابلة، سأل القائم بالمقابلة دينغ شياو يو عما إذا كان يمكنه قبول وظيفة مملة ومتكررة. "كانت إجابتي في ذلك الوقت مقبولة. وأعتقد أن إجابات جميع المرشحين يجب أن تكون مقبولة." لأنه لم يكن لديه سوى تجربة تدريب واحدة عندما كان طالبًا جامعيًا، ومع توقع تراكم المزيد من التدريب الداخلي وتجربة الشركات الكبرى، حتى مع مع الشكوك، لا يزال Ding Xiaoyu يختار الانضمام إلى الشركة.

في شهرين فقط، تم اعتبار دينغ شياو يو هو الشخص الذي استمر حتى النهاية بين المتدربين في نفس الفترة. لقد شهدت أن العديد من المتدربين يأتون بطموحات عالية ثم يغادرون ورؤوسهم منخفضة.

يعرّف عالم الأنثروبولوجيا ديفيد جريبر الوظائف التافهة بأنها وظائف ليس لها أي معنى أو غرض. والوظائف التي ينبغي القضاء عليها عن طريق التشغيل الآلي للآلات لا تزال موجودة بسبب تزيين النوافذ، لإرضاء الرؤساء، وملء ثغرات النظام. يشبه التعليق التوضيحي للبيانات تنوعًا في الوظائف الهراء التي يُعتقد غالبًا أنه تم استبدالها بالآلات، ولكنها لا تزال تتطلب البشر للقيام بها.

عندما يصل جنون الذكاء الاصطناعي، كثيرا ما يسمع الناس توقعا بأن الذكاء الاصطناعي يمكن أن يحل محل البشر في إكمال المهام المتكررة والمملة، وبالتالي السماح للبشر بالحصول على المزيد من الوقت والطاقة لمتابعة أعمال أكثر إبداعا وإشباعا.

ولكن من الممكن أيضًا أن يتغلب الذكاء الاصطناعي، مثل التقنيات الموفرة للعمالة في الماضي، مثل الهواتف والآلات الكاتبة، على آلام نقل المعلومات والكتابة اليدوية، ولكنه يخلق أيضًا قدرًا كبيرًا من الاتصالات والأعمال الورقية التي تتطلب ذكاءً اصطناعيًا جديدًا لأداءها. الإدارة، مثل مكتب الاستقبال، كاتب. قد لا يحل الذكاء الاصطناعي محل البشر، لكنه سيخلق وظائف أكثر مملة وعزلة.

**بالإضافة إلى عدم قدرتهم على الحصول على الاعتراف بقيمة عملهم، فإن الراتب الذي يتلقونه قد لا يسمح لهؤلاء الطلاب المتفوقين بتحقيق "الاعتراف بالسعر". **

وبحسب "جيازي جوانغنيان"، تظهر هذه البيانات أن رواتب المتدربين ليست مرتفعة. إذا كانوا موجودين في مدينة من الدرجة الأولى، فإن راتب معظم المتدربين في مجال الذكاء الاصطناعي هو 150 يوانًا في اليوم، مع بدل الغرفة والمقصف المجاني؛ وإذا كانوا موجودين في مدينة من الدرجة الثانية، فلن يتبقى سوى 100 يوان في اليوم. ويتم أيضًا تخفيض بدل الغرفة بمقدار الثلث 2. تحل وجبة الوجبة الإضافية البالغة 20 يوان محل الوجبة المجانية.

مثل تدريب Ding Xiaoyu في مدينة من الدرجة الثانية، نظرًا لأن المكتب يقع في وسط المدينة والمنطقة مزدهرة، يمكن أن تتجاوز الوجبة الجاهزة بسهولة معيار دعم الوجبة البالغ 20 يوانًا، وتتطلب بشكل أساسي سداد راتب التدريب.

ولأن أغلبهم مجرد معلقين أساسيين لتدريب النماذج الكبيرة، فقد يتم تعيينهم بشكل موحد في مناصب لا علاقة لها بمهنتهم. وقد يتم أيضًا نقلهم إلى أقسام مختلفة في أي وقت ويطلب منهم البدء بسرعة بعد فترة قصيرة. تمرين.

** وصفهم دينغ شياو يو بأنهم دفعات من المتدربين الذين استغلتهم المصانع الكبيرة. **

من الواضح أن تشن شي شعرت أنها لم تكن الوحيدة التي شعرت بالفجوة بين التوقعات والعمل الفعلي. "بصراحة، أشعر أن هذه الوظيفة ليست مناسبة لي. في بعض الأحيان، عند الدردشة، أجد أن المتدربين الآخرين قد يكون لديهم 985 درجة بكالوريوس، وبعضهم عاد من الخارج بدرجة الماجستير. والفجوة بينهم أيضًا كبيرة جدًا ، كبيرة جدًا."

عبر يانغ شياو يون عن الأمر بشكل أكثر مباشرة: "قد تكون استعارة غير مناسبة. ذهبت والدتي إلى المدرسة الثانوية، حتى تتمكن من القيام بهذه الوظيفة."

**4. "نحن في الواقع عمال خط تجميع" **

في الواقع، تقوم الحكومة بتوظيف الطلاب المتفوقين للقيام ببعض الوظائف ذات التقنية المنخفضة وتدفع تكاليف رواتب منخفضة للغاية. وهذا أيضًا انعكاس موضوعي لفوضى السوق في المراحل الأولى من تطوير نماذج البيانات الضخمة. **بالنسبة لشركات التعليقات التوضيحية للبيانات، في مرحلة التطوير الحالية للنماذج الكبيرة، لم يشكل التعليق التوضيحي للبيانات معيارًا موحدًا بعد، ولا توجد متطلبات محددة للمعلقين التوضيحيين.

وقال الشخص المسؤول عن قسم منتجات بيانات Stardust: "مع اكتمال القدرات الأساسية للنموذج الكبير وبدء عملية التطوير لتصبح أكثر عمودية وتعقيدًا، ستتغير المهام تدريجيًا، مما يتطلب تحديث الأدوات والموظفين وتكرارها". وفقًا لذلك، لا تزال النماذج الكبيرة في المراحل الأولى من التطوير، ويختلف طلب السوق على المفسرين اعتمادًا على المهمة. بالمقارنة مع مشاريع السيرة الذاتية (رؤية الكمبيوتر)، فإن المفسرين في البرمجة اللغوية العصبية (NLP) لديهم متطلبات أعلى لقدرة الفهم، متطلبات المصطلحات المهنية ومعرفة المجال أعلى، ويجب توفير مجموعة بيانات دقيقة وموثوقة.

قال الشخص المسؤول إن المشكلات التي تطرحها النماذج الكبيرة لشرح البيانات تنعكس بشكل أكبر في التصميم عالي المستوى. لكل مهمة شرح للبيانات، كيفية فهم متطلبات سيناريو التطبيق الخاص بالعميل، وتصميم مجموعة من الحلول مثل اختيار البيانات، وتصميم توزيع البيانات، وتصميم خطوط الأنابيب التي يمكن تنفيذها بكفاءة وبتكلفة منخفضة، وكيفية تحسين الكفاءة والقدرات تعد أدوات النظام الأساسي بمثابة تحدٍ أكبر.

ويعتمد هذا على مشاركة خبراء المجال الرأسي كمعلقين كبار، وحقن الخبرة والخبرة في المجال في تصميم الحل، وحتى المشاركة في عملية التكرار لفحص جودة البيانات.

قال Zhang Ziqian، رئيس العمليات في شركة Besai Technology، مزود حلول البيانات، بصراحة أنه في الوقت الحالي، فيما يتعلق بتدريب النماذج واسعة النطاق، لا يوجد فرق واضح في صعوبة العمل والأجور بالساعة بين المفسرين الأساسيين والمعلقين الذين كانوا يشاركون سابقًا في اختيار الإطار . **عند ضبط النماذج الكبيرة وإنشاء حلول في المجالات الرأسية للعملاء، فإن المشكلة الأكبر تكمن في كيفية بناء مجموعات بيانات عالية الجودة، الأمر الذي يتطلب تصنيف الخبراء في المجالات المهنية مثل تكنولوجيا المعلومات، والطب، والتمويل. ولا تزال مثل هذه المواهب متاحة نقص.

استثمرت OpenAI العشرات من طلاب الدكتوراه في توجيه ومراجعة شرح البيانات، والاستعانة بمصادر خارجية لشرح البيانات الأساسية لشركات شرح البيانات، المنتشرة في المناطق ذات الدخل المنخفض مثل أفريقيا والهند. **الأشخاص الذين يحدثون فرقًا حقًا هم كبار المفسرين، الذين يمثلون نسبة صغيرة فقط. **

ومن خلال مقارنة التوصيف الوظيفي للمعلقين الذين عينتهم شركة بايدو في مقرها الرئيسي في بكين وقاعدة بيانات التعليقات التوضيحية في هايكو، يمكننا أن نرى أنهم متخصصون أيضًا في تدريب النماذج الكبيرة. فالأول هو أحد كبار المعلقين المسؤولين عن التوجيه والتدريب والمراجعة، في حين أن الأخير هو أحد كبار المعلقين المسؤولين عن التوجيه والتدريب والمراجعة. معلقًا للبيانات الأساسية. يتمتع الاثنان بمستويات رواتب مختلفة إلى حد كبير.

مصدر الصورة: التوظيف المباشر لـ BOSS

**بعبارة أخرى، هؤلاء المعلقون رفيعو المستوى هم في الواقع المواهب الرئيسية للتدريب على النماذج الكبيرة، وعملهم أكثر تقنية وقيمة، كما أن تكلفة العمالة أعلى أيضًا. **

** في المقابل، حتى لو جاء هؤلاء المتدربون من المدارس المرموقة لتدريب نماذج كبيرة، ففي هذه المرحلة، فإنهم في الأساس نفس المفسرين للبيانات في الماضي. **

**غالبًا ما يمزح المتدربون فيما بينهم قائلين إنهم لا يعملون في مصنع كبير، بل في Internet Foxconn، وأنهم عمال على خط التجميع. لا يمكنهم رؤية إلى أين ستؤدي نتائج عملهم في النهاية، ولا يمكنهم إنشاء سلسلة أفقية من المعنى مع الأشخاص من حولهم. **

لا تشير نكتة "Internet Foxconn" هذه إلى عمل هؤلاء المتدربين فحسب، بل تشير أيضًا إلى عبء العمل ونموذج الإدارة، والذي يتساوى تقريبًا مع خط تجميع المصنع.

إن حجم العمل الذي يتعين على المتدربين إكماله كل يوم له خط أحمر محدد للكفاءة البشرية. بالنسبة ليانغ شياو يون، تحتاج إلى تحديد 32 سؤالًا يوميًا، وإذا لم يتم استيفاء الخط الأحمر، فعليها الإبلاغ عن الأسباب أو العمل الإضافي لإنهائه. الشرط الأساسي لإكمال العمل هو المعايير المتغيرة باستمرار لجمعية لازي والجمع المستمر للمعلومات.

من أجل إكمال التدريب النموذجي في أسرع وقت ممكن، يواجه فريق التعليقات التوضيحية إدارة عالية الضغط. "لا يُسمح لمجموعة Yang Xiaoyun بالتحدث أثناء ساعات العمل. يمكن إضافة سعر بعض الأحاديث الصغيرة إلى عبء العمل. إذا فشلت في إكمال العمل، فسيتم تذكيرك بشكل محموم في المجموعة. حتى لو كنت مريضًا واسأل أثناء الإجازة، قد تتم مقاطعتك بسبب مكالمة عاجلة من موظفك العادي.

بالإضافة إلى ذلك، ولضمان عدم تسرب البيانات، يُحظر صراحةً تبادل التعليقات التوضيحية للبيانات عبر المجموعات. وحتى لو تم وضع المتدربين من مجموعات مختلفة على مقربة من بعضهم البعض، فلن يتمكنوا من مناقشة محتوى العمل. لا يعرف أي من هؤلاء المتدربين عدد المجموعات المقسمة الموجودة في تصنيف بيانات الشركة وعدد المتدربين الموجودين. قد تضم المجموعة 10 أو 40 أو 50 أو 60 أو مئات الأشخاص في كل طابق.

تحت الخط الأحمر للكفاءة البشرية عالي الضغط، لا يمكن أن يكون يانغ شياويون "سعيدًا" إلا مؤقتًا عند مواجهة أسئلة محظورة. نظرًا لأنه يجب إزالة المحتوى الذي يشتمل على العنف والمواد الإباحية والمحتوى الدموي مباشرةً، إلا أنه لا يزال من الممكن احتسابه ضمن عناصر العمل الشخصية. "إنه يعادل تشديد المسمار السيئ. وستكون سعيدًا فقط لأنه لا يتعين عليك تشديد المسمار." وأثناء تقسيم العمل في الصباح، كان المتدربون يتنافسون مع بعضهم البعض للحصول على المواد المحظورة.

بعد أن تركت يانغ شياو يون وظيفتها مبكرًا، غالبًا ما كانت تزور لحظات المتدربين الذين ما زالوا يجتمعون في الشركة في الساعة 10 صباحًا، أو حتى الساعة 12 ظهرًا. هناك أيضًا متدربون يرسلون لها رسائل صوتية يبكون، لكن لأنهم استأجروا منزلًا وليس لديهم طريقة للمغادرة، إذا لم يتمكنوا من المثابرة، فهذا يعني أن كل الإيجار سيضيع.

5. لن يكون هناك نقص في عدد الأشخاص هنا أبدًا

لكن ليس الأشخاص الذين لم يثابروا.

Li Zhuxi هو أحد المتدربين النادرين الذين يتمتعون بخبرة في شرح البيانات. درست اللغويات المعرفية، وأوضحت أن اتجاه الجمع بين علم اللغة وعلم الأعصاب، ومراقبة تصوير الدماغ، بما في ذلك إنشاء واجهات بين الدماغ والحاسوب، له علاقة معينة بالذكاء الاصطناعي.

قبل مجيئها إلى هذا المصنع الكبير، قامت بتعليق البيانات لنماذج اللغة الكبيرة في مصنع كبير آخر، وكان ذلك قبل إصدار ChatGPT. في انطباع Li Zhuxi، بعد خروج ChatGPT من الدائرة، ظهرت برامج تدريب مماثلة على التعليقات التوضيحية للبيانات مثل الفطر بعد المطر.

أكملت بنجاح فترة التدريب التي استمرت ثلاثة أشهر، على الرغم من أنها وصفتها بأنها مهمة "ميكانيكية نسبيًا وليست صعبة للغاية". وصف Li Zhuxi أنه يولي المزيد من الاهتمام للخبرة، "لا أتوقع أن تكون هذه الوظيفة مثيرة للاهتمام. لا يزال من الجيد تجربتها. لا أكتسب خبرة التدريب في مصنع كبير فحسب، بل أختبر أيضًا ثقافة الشركة الفريدة هنا. "

بالنسبة إلى تشاو شو، وهو طالب فنون ليبرالية من مدرسة في شوانغفي، كان منصب التدريب على تحرير الذكاء الاصطناعي في مصنع كبير هو اختياره للمستوى الأعلى.

عندما كان يبحث عن تدريب صيفي، كان يفضل في الواقع منصبًا تنفيذيًا في معهد أبحاث. معهد الأبحاث هو مؤسسة عامة ولديه موظفين، وهو ما كان جذابًا للغاية بالنسبة إلى Zhao Shuo. "في ذلك الوقت، كنت أتطلع بشكل خاص إلى ردود الفعل التي يمكن أن تعطيني." . لكن في النهاية، لم يختر المعهد تشاو شو، الذي كان طالب دراسات عليا في السنة الأولى، وقام بتوظيف طالب في الصف الأعلى.

هناك أشخاص أكثر "مجعدين".

في نظر Zhao Shuo، سيعمل بعض المتدربين بجد بشكل خاص ويتحملون المزيد من المهام من أجل البحث عن فرص ليصبحوا موظفين منتظمين. "إن الموقف الجاد والموقف الدؤوب سوف يكسب استحسان الموظفين بدوام كامل. "غالبًا ما يجري القادة تبادلات معينة معهم وسيمنحونهم أيضًا بعض التفويض الإداري لإدارة المتدربين."

حتى أن الشركة تختار المتدربين ذوي الأداء المتميز كل أسبوع وتنشر صورهم على الحائط تقديرًا لهم، ولكن لا يوجد بالضرورة حافز إضافي، ولا يوجد أي حافز في خط أعمال Zhao Shuo.

صرح جيا يوهانغ، المدير العام لشركة Yunmei Data، لـ Jiaziguangnian أن هناك طريقتين رئيسيتين للترقية لمعلقي البيانات: أحدهما هو طريق الخبراء. وبعد إتقان المهارات ذات الصلة في مجالات رأسية محددة، يمكن للمعلقين المبتدئين أن يصبحوا تدريجيًا خبراء كبار في التعليقات التوضيحية. طريق الإدارة، ليصبح مدير المشروع.

لكن Zhao Shuo لن يختار البقاء. بعد عام واحد من الدراسات العليا، أدرك تشاو شو بوضوح أن توقعاته للعمل المستقبلي قد انخفضت. ومع الشعور بالتغيرات المتزايدة في البيئة العامة وملاحظة استياء الطلاب الذين اختاروا العمل بعد التخرج، تم استبدال وظائف Zhao Shuo "الراقية والمتطورة" و"التي لا يمكن الاستغناء عنها" والتي كانت متوقعة سابقًا بوظيفة مستقرة تدريجيًا. بصفته طالب فنون ليبرالية، يشعر بالقلق من أنه لم يتقن بعد مهارات لا يمكن تعويضها، ويأمل في العثور على وظيفة تتم إدارتها داخل المؤسسة.

أثناء الدردشة، كان المتدربون يندبون بعضهم البعض لأن العمل الذي يقومون به قد يتم استبداله بالآلات قريبًا، ولن تكون هناك حاجة لتغذية البيانات يدويًا.

بالنسبة لجيا يوهانج، المدير العام لبيانات قياس السحابة، لا توجد مخاوف مماثلة. مع الإنتاج الضخم الفعلي للخوارزميات وتعزيز قدرات الحلقة المغلقة للبيانات، فإن الكمية الإجمالية للبيانات المصنفة وكمية تصنيف البيانات اليدوية لا تزال تتزايد عامًا بعد عام. في الماضي، كان التعليق التوضيحي يدويًا بنسبة 100٪، ولكن الآن هناك نسبة معينة من التعليقات التوضيحية اليدوية والتعليقات التوضيحية التلقائية والتحقق اليدوي. في المستقبل، قد تصبح نسبة وضع العلامات التلقائي أكبر وأكبر. ومع ذلك، على الرغم من انخفاض نسبة التعليقات التوضيحية اليدوية، مع التطور التدريجي لصناعة الذكاء الاصطناعي وزيادة كمية البيانات، فإن كمية التعليقات التوضيحية اليدوية ستستمر في الزيادة.

بعد أن تركت وظيفتها مبكرًا، وجدت يانغ شياو يون تدريبًا داخليًا في تخطيط الألعاب أعجبها، وكان جو العمل هناك مريحًا وشعرت بمزيد من المكافأة، وكان التحرير باستخدام الذكاء الاصطناعي تجربة تدريب "سيئة الحظ" بالنسبة لها. بالنسبة لدينغ شياو يو، كانت هذه عملية خيبة أمل. حتى لو ذهبت إلى تدريب داخلي في مصنع كبير كانت تتطلع إليه، فإنها ستظل تواجه وظائف مملة لا تعد ولا تحصى. لقد شعرت أن هذا قد يكون بسبب أن قدراتها لم تكن قوية كافية أو كانت هناك فرص قليلة جدًا للخبرة.

ولكن لن يكون هناك نقص في عدد الأشخاص هناك أبدًا.

سمعت يانغ شياو يون أنه بعد مغادرتها، توسع الفريق من العشرات إلى المئات في غضون شهر. اكتشف دينغ شياو يو أنه كل 10 أيام، ستأتي دفعة جديدة من المتدربين، كل دفعة تتكون من عشرين أو ثلاثين شخصًا.

"قد تغادر وأنت تلعن وتخبر العالم بمدى سوء وظيفتك، ولكن سيكون هناك تدفق مستمر من الأشخاص الجدد الذين سيأتون لملء مكانك."

*بناءً على طلب الأشخاص الذين تمت مقابلتهم، فإن الشخصيات Chen Xi وYang Xiaoyun وDing Xiaoyu وLi Zhuxi وZhao Shuo الواردة في المقال هي أسماء مستعارة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت