Працівники Foxconn йдуть на фабрику маркування ШІ

Джерело: "Times Finance APP" (ID: tf-app), автор: Xu Xiaoqian

Джерело зображення: створено інструментом Unbounded AI

** У першому півріччі цього року технологічні гуртки міст першого рівня були активізовані штучним інтелектом. **

Масштабні моделі, такі як Wenxin Yiyan, Tongyi Qianwen і Light Years Away, викликають хвилі ентузіазму. Великі особи з ресурсами найвищого рівня стоять у центрі цієї грандіозної події. Вони один за одним розсилають героїчні дописи. битва за талант великої моделі також на столі.

Будучи тісно пов’язаною частиною промислового ланцюга штучного інтелекту, база даних Тайюань у Шаньсі, за 500 кілометрів від Пекіна, спокійна. Тут зібралися тисячі людей, які займаються маркуванням штучного інтелекту. Теми, про які говорили, стосувалися прогресу проекту, темпів наведення коробки на стандарт і триразового харчування.

«Хвилювання належить їм, а у нас є лише незліченна кількість коробок», — сказав Times Finance представник етикеток.

У пам'яті Хе Ціна, власника компанії з маркування даних, ажіотаж стався чотири чи п'ять років тому. Вперше в це місто на середньому заході подув весняний вітерець штучного інтелекту, делікатні бізнесмени почали оформляти території та вербувати людей, забезпечуючи постійний потік «харчування» для штучного інтелекту. Більшість із них є фанатами штучного інтелекту, оскільки через раптовий величезний попит на робочу силу вони мають чудовий зв’язок із передовими технологіями.

«У той час багато босів приводили сюди всіх членів своєї родини, і вони могли заробляти гроші, просто поворухнувши пальцями». Хе Цін почув багато цікавих новин у галузі маркування даних — деякі люди заробляють мільйони протягом трьох місяців, а інші. Зібрані замовлення можна поставити в чергу на другий рік.

**Але такий гарний день поступово йде. **

01 Пристойний "конвеєр"

О 8:45 ранку щільний натовп людей заблокував вхід до ліфта, до першого ліфта протиснулася лише третина людей, а кінцевий пункт усіх був на шостому поверсі.

Двері ліфта повільно відчинилися, і натовп розбігся в усіх напрямках і зайшов до офісів, де не було різниці.Простір площею близько 100 квадратних метрів був заповнений сотнями комп'ютерів.футів.

«Поки ви йдете за номером будинку і запитуєте по одному, все буде позначено даними», — так описав це продавець на першому поверсі парку.

Ця база маркування даних, яка приваблює майже тисячу людей, схожа на приховане Інтернет-кафе, сховане в парку.Люди, які сидять перед комп’ютерами, майстерно клацають клавіатурою та мишкою, а робочі столи площею приблизно один квадратний метр займають величезні комп'ютери.

Джерело даних для етикетки в роботі: фото Times Finance

Єдине, що може продемонструвати їхню індивідуальність, — це кольорові навушники на головах.У них спільна ідентичність: етикетки даних.

Клацаючи лівою і правою кнопками миші вперед і назад, картинка на екрані збільшується і зменшується, а курсор швидко малює рамки різного розміру... Після повторних дій, які тривали протягом півгодини, Мейлінг скрутила шию. злегка, і кістки її хребта здригнулися.

«Новачкам достатньо, щоб пройти перший тиждень, і вони швидко до цього звикають», — сказав Мейлінг Times Finance, не дивлячись на екран. Кількість людей, які здаються в перший тиждень, досягає 30% .

Кожні два тижні пані Чжоу, бригадир, буде вести більше десятка новачків, щоб розпочати навчання. Така повторювана та нудна робота відмовила багатьох молодих людей.

Два роки тому Мейлінг перетворилася з вихователя в дитячому садку на етикетувальника даних. У її рідному місті Лулян мало роботи, а телемаркетинг є одним із найреспектабельніших напрямків.Тепер під впливом хвилі штучного інтелекту маркувальники даних пропонують жінкам у окрузі ще один вибір.

Півроку тому через зміну бази маркування Мейлін переїхала зі свого рідного міста до столиці провінції Тайюань. «Автоматичне керування автомобілем або розпізнавання обличчя не потребує участі великомасштабних виробників етикеток», — вона показала гордий вигляд. В очах своєї сім’ї, сидячи в офісі та керуючи комп’ютером, з місячним доходом понад 3000 юанів , лікування перевищив більшу частину округу.Вже працює.

У 2005 році Чжу Сончунь, експерт з комп’ютерного зору, повернувся до свого рідного міста Ечжоу, Хубей зі Сполучених Штатів, заснував Науково-дослідний інститут Ляньхуашань і сформував першу команду маркування великих даних у Китаї. Згодом фабрики маркування даних поступово прижилися в містах другого та третього рівня, а промислові кластери з’явилися в Хебеї, Хенані, Шаньдуні, Шаньсі та інших регіонах.

Шляхом повторного навчання міток штучний інтелект може досягти моменту «пробудження», на думку Мейлінг, це те саме, що й попередня робота вихователів дитячих садків.

Позначення даних є першою ланкою в народженні продуктів штучного інтелекту, за якими йдуть навчання та оптимізація моделей, керування моделями, додатки для міркування тощо. Для живлення продуктів штучного інтелекту потрібні сотні мільйонів даних, які спочатку надійдуть на комп’ютери «красунь».

Проте фантазія Мейлінга про «високі технології» потроху була розбита повторюваним звуком механічної миші. Вона підрахувала, що 1500 кадрів — це межа щоденного навантаження, коли ця попереджувальна межа буде перетинана, очні яблука болітимуть.

Після роботи, навіть коли вона стоїть перед телевізором, вона бачить мозаїчну мозаїку, яка виглядає як розмиті картинки, які потрібно позначити після збільшення.

«На сусідньому місці завжди незнайомі обличчя, а між колегами мало спілкування». Пропрацювавши півтора року, Ву Ся, який працює в тій же базі, ще не звик до тиші в офісі .

Після закінчення молодшого коледжу вона спочатку пішла на фабрику разом зі своїми однокласниками, але через зміни в проекті та від’їзд однокласників стала «самотнім рейнджером». Як тільки робота почалася, офіс став «майстернею», де стартувала автоматизована конвеєрна лінія, з холодною індустріальною атмосферою та мало людського дотику.

Однією з особливостей індустрії маркування даних є індивідуальний підрахунок штук і відсутність командної роботи, що формує метод управління, відмінний від методу звичайних білих комірців.

Тут етикетки не мають фіксованої позиції, а випадковим чином призначають сотні людей до напрямку потоку відповідно до змін проекту. Найдовший проект — 2-3 місяці, а короткостроковий — всього 2-3 дні, команда проекту з понад десятка людей має адміністратора, який стежить за ходом роботи кожного.

Анотатори не будуть витрачати свою енергію на управління стосунками між колегами.Відрядний тип приділяє увагу ефективності та концентрації, а час і гроші пов'язані.Щоб створити в середньому 1000 кадрів, це означає, що в середньому потрібно зробити 2 кадри за хвилину.

«Коли ви розмовляєте з іншими, ви втратите кілька ящиків грошей», — сказав Мейлінг.

02 працівники Foxconn йдуть на фабрику етикеток

У парку маркування даних також є розкидані технологічні дослідницькі інститути та підприємницькі бази для іноземних студентів. На думку Мен Рана, ці «висококласні» позиції далекі від нього.

До вступу в університет він ніколи не покидав рідне місто Ліньфен, а після закінчення університету його родина сподівалася, що він не покине провінцію. За два кілометри від бази розташований науково-технологічний індустріальний парк Foxconn Taiyuan. Ця територія фабрики поглинула найактивніших місцевих робітників.На піку свого розвитку на конвеєрі фабрики працювало близько 60 000 людей.

Як би він не намагався, радіус пошуку роботи студентом коледжу Мен Раном ніколи не перевищував 5 кілометрів. Одного разу він перейшов із другої фази бази маркування даних до третьої фази; перш ніж офіційно стати маркуванням даних, Foxconn по сусідству був місцем, де він спалив свою молодість.

Джерело парку Foxconn менш ніж за 2 кілометри від бази маркування даних: фото Times Finance

Одного разу Мен Ран прийшов на фабрику на дві відпустки поспіль, щоб заробити гроші, і щоразу поспішно залишав її, отримавши зарплату в кілька тисяч юанів.

Кожні зимові та літні канікули вхід до кампусу Foxconn заповнений студентами з великими та маленькими сумками, і мета кожного — отримати найвищу знижку та погодинну оплату за цілий рік. «Усі приїжджають сюди, щоб швидко заробити гроші, і вони збирають речі та їдуть, щойно закінчується пік сезону. Фабрика занадто зайнята, щоб працювати, і важко втримуватися на ній тривалий час».

Менг Ран не сподобалася робоча атмосфера у Foxconn. Перш ніж увійти в майстерню, електронне обладнання потрібно здати, і єдине, з чим щодня залишається стикатися, — це натовп поспішаючих робітників у схожому одязі та похмура й холодна будівля заводу. Коли ви зустрічаєте сварливого керівника команди, вас щодня часто ображають.

З гуркотом запуску лінії робітникам необхідно безперервно встановлювати певну деталь, і часто такі дії тривають більше 10 годин. У повністю замкнутому просторі навіть транс – це розкіш. Мен Ран не наважувався перекинутися кількома словами з робітниками навколо нього, доки бригадир трохи не розслабив керівництво.

У 2018 році, після завершення будівництва сусідньої бази маркування даних, Мен Ран мав інший вибір для своєї роботи. Усього за один квартал від вас є більш зручна робота під рукою.

Фей Вонг колись була рекрутером для Foxconn. Міжсезоння на фабриці та кадрові зміни в поєднанні з неоднозначними скидками та частими змінами доходів змушують її часто впадати в нескінченні конфлікти з трудовими мігрантами.Анотатори для неї кращий вибір.

«Останні кілька років поріг для маркування даних був низьким, а ціна за одиницю продукції — високою. Я міг підтримувати місячний дохід у 4000 юанів, і всі проекти, які я робив, стосувалися великих фабрик, що було відносно безпечно». Фей Вонг бачила, як багато кваліфікованих робітників покидали базу, щоб піти на іншу, шукаючи вихід, але повернулася, покрутившись.

Багато анотаторів мають подібні траєкторії роботи, як Мен Ран. Досвід роботи на фабриках електроніки є спільним пунктом їхніх резюме, а фабрика анотації даних стала їхньою наступною зупинкою після виходу з ливарного виробництва електроніки.

Загальні риси великої кількості робітників, значного доходу та простоти експлуатації дозволили побудувати фактично двокілометровий міст, який з’єднує два суперфабрики разом.

03 Зникаючі проекти та компанії

Для етикетників інтуїтивно зрозуміле відчуття: Хороші дні добігають кінця.

Проект із ціною за одиницю в кілька центів зник, а ціна коробки для етикеток була знижена до кількох центів; проста коробка для малювання точки малювання площини зникла, замінена проектом хмари точок, який вимагав багатовимірного маркування; звичайний співробітники поступово залишали проектну команду, більш рентабельні стажери підтримували більше половини робочої сили.

Хе Цін, власниця компанії з маркування даних, не була на базі півроку, і вона поступово скорочувала свої інвестиції в компанію.

Починаючи з другої половини минулого року, її команда жодного разу не могла отримати проекти з великими замовленнями клієнтів, а період виставлення рахунків клієнтам затягнувся з трьох місяців до півроку. «Багато невеликих заводів із недостатнім грошовим потоком і нездатністю авансувати капітал закрилися, а члени нашої команди втратили одну третину».

Три роки тому ентузіазм Лі Вей спалахнув від рамки з виносками.Вона була повільна та погано спілкувалася, і вона відчувала, що знайшла «обрану» роботу.

Лі Вей взяла на себе проект із ціною одиниці 0,25 юаня. Коли ефективність була високою, вона могла малювати 1200 кадрів на день і заробляти майже 8000 юанів на місяць. «Щоб заробити більше грошей, хтось купив хост і почав працюйте вдома. Чим кваліфікованіший ви, тим більший дохід ви заробите».

Як і всі інші, Лі Вей смутно відчував, що ера золотої лихоманки закінчилася.

Компанія запустила абсолютно новий проект. Перед нами вже не реальна дорожня карта, а модель карти, що складається з тисяч зелених, фіолетових і синіх точок. Завершене зображення містить майже сотня позначених полів, а набір запитань складається з десятків малюнків лише з незначними відмінностями.

Джерело діаграми складного операційного інтерфейсу: надано респондентом

«Потрібно неодноразово перемикатися між виглядом у плані та 3D. Деякі заблоковані зображення потрібно доповнювати мозком, а також потрібно контролювати точність кадру на 0,01 метра. Ефективність роботи стає нижчою та Поки відхилення від необхідного діапазону більше на 1 мм, вони будуть безжально відбиті оглядом.

Дані, обчислювальна потужність і алгоритми є трьома наріжними каменями штучного інтелекту. Чим більша кількість і вища якість даних, тим більш зрілі великі моделі можна навчити, що проявляється в роботі анотаторів, які постійно вдосконалюють свою точність. .

«Правила було скориговано за останні кілька днів, і вимоги до точності збільшено до понад 80%.» Точність стала «мертвою плямою» етикетників, і це також високочастотний словник, який з’являється, коли вони скаржитися.

Позначене зображення має пройти 2-3 етапи, такі як перевірка та перевірка якості, інакше воно не може увійти в цикл розрахунку.

Іноді Ву Ся відчувала, що потрапила в складний лабіринт і не могла звідти вибратися, незважаючи ні на що. Майже тиждень її мучив новий проект — під час надсилання питань їй постійно передзвонювали, через що вона впадала в тривогу. «Якщо питання повертатися занадто часто, воно буде призначено іншим людям, і попередня енергія буде марною».

Тривога Мен Ран була іншого роду. З серпня минулого року його робота стала спокійнішою, за останні 5 хвилин накопичилося десятки тисяч даних, і тепер червоної лінії навантаження не буде півгодини.

«Можливо, кількість даних на платформі зменшилася, а може бути, що ефективність машинного перегляду зросла». Почуття незахищеності Мен Рана швидко підтвердилося. Через вимушене скорочення його робочого навантаження його щоденний дохід впав з однієї-двох сотень юанів до кількох сотень юанів Десятки доларів.

Серед великих агентств поширилася гонка нокаутів. Менг Ран бачила, як одна ніч розпустила команду, і більше десятка співробітників, яким заборгували зарплату, подали позов на компанію до бюро праці; якби ситуація була трохи кращою, їх би передали наступному агенту разом із комп’ютером і працівниками.

«Щоб бути в безпеці, перейдіть до команди, яка складається з понад 30 людей», — така порада Мен Ран новачкам.

04 Анотатори залишають сцену історії

У травні цього року після тижня навчання та півмісячного періоду новачка Сяотін, який перебував у Хунані, нарешті адаптувався до роботи етикетувальника даних, але став свідком швидкого занепаду компанії аж до її закриття.

«Після одного місяця роботи компанія не зможе вижити. Бос пригощає всіх розривною їжею, але зарплати доведеться чекати кілька місяців». «міни», а ризик набагато більший за дохід.

Незалежно від того, чи йдеться про підприємця, який займається маркуванням даних, чи про десятки тисяч етикетників, неможливо уникнути того факту, що ручне маркування даних поступово стає незначним на сцені великомасштабних моделей.

Що відрізняється від роботи вихователя дошкільної освіти Мейлінг, так це те, що учні не так швидко займатимуть роботу вчителя. Сьогодні технологія великих моделей, яку розвивають етикетувальники, швидко повертає назад процес маркування даних.

Як приклад Tesla, вона постійно розвиває технологію автоматичного маркування з 2018 року, від 2D ручного маркування до 4D космічного автоматичного маркування. Розвиток технологій знищив робочий простір для ручного маркування. У 2021 році команда Tesla з ручного маркування перевищить 1000 осіб, а в 2022 році більше 200 співробітників будуть звільнені.

Інші автомобільні компанії, в тому числі Xiaopeng Motors і Momo Zhixing, також запустили інструменти автоматичного маркування. Гу Вейхао, генеральний директор Momo Zhixing, публічно заявив, що зараз для отримання інформації про смуги руху, учасників руху та світлофори вартість ручного маркування становить близько 5 юанів за зображення, тоді як вартість Momo DriveGPT становить лише 0,5 юаня.

У 2019 році Ву Ді, тренер даних зі штучного інтелекту в місті першого рівня, передчував стелю своєї кар’єри. Його компанія відповідає за розробку проекту розумного обслуговування клієнтів платформи електронної комерції. Прогрес був швидшим, ніж він собі уявляв. Менш ніж за рік команду з 10 осіб із маркування даних, якою він керував, було ліквідовано, і залишилися лише спорадичні оператори.

«Того дня, коли проект продовжує розвиватися, ми більше не потрібні».

Еволюція великої моделі схожа на бурхливу річку, яка завжди раптово атакує в певний момент, залишаючи штучну команду позаду.

У звіті про опитування Цюрихського університету в березні цього року дослідники за допомогою фактичних вимірювань виявили, що здатність ChatGPT до обробки 15 завдань маркування була вищою, ніж у краудсорсерів.

На початку квітня цього року Лі Цзе, студент-медик у школі, завершив текстове маркування великої медичної фабрики протягом одного місяця. Цей проект використовуватиметься для надання послуг інтелектуальної діагностики та діалогу. Це також зробило Лі Jie вперше відчув еволюцію великих моделей.

«Спочатку ми продовжували заповнювати платформу секретними медичними термінами, а на другому тижні система змогла автоматично реалізувати основну класифікацію іменників, і рівень точності перевищив 90%».

У Тайюані, Шаньсі, пані Чжоу, бригадир бази, почала переконувати новачків взятися за складніші проекти, тому що компанії було важко витримувати тиск проектів, які знову і знову відкладалися. «Зараз чим простіше бізнес з маркування, тим менший прибуток, і деякі проекти будуть жовтими, якщо вони будуть завершені наполовину, а витрати на оплату праці взагалі не зможуть покрити доходи від проекту».

Рекрутер в індустрії маркування даних розповів Times Finance, що з цього року поріг набору поступово змістився від студентів молодших коледжів до студентів бакалаврату. «У минулому практично не було жодних вимог щодо досвіду для етикетувальників. Зараз багато компаній сподіваються, що нові співробітники зможуть безпосередньо почати працювати над проектами, що може зменшити початкові витрати на навчання».

На даний момент інтелектуальне маркування може приблизно фіксувати основну форму та положення об’єктів, але з точки зору точності воно все ще відстає від професійних етикетників.

Ніхто не знає, коли розумне маркування призведе до великого вибуху, але Лі Вей завжди супроводжується почуттям незахищеності. Щоразу, коли вона відкриває нову сторінку проекту, червоне поле, що представляє розумні мітки, завжди спливає першим, ніби нагадуючи людям, які весь час перебувають перед екраном:

Одного разу воно займе її місце.

(Всі респонденти в цій статті є псевдонімами.)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити