Nar n-oidhirpean gus fuasglaidhean AI làidir agus neo-phàirteach a thogail, tha e iomchaidh gum bi sinn a’ cuimseachadh air na modalan a thrèanadh air raon dàta neo-phàirteach, fiùghantach agus riochdachail. Tha ar pròiseas cruinneachadh dàta air leth cudromach ann a bhith a’ leasachadh fhuasglaidhean AI creidsinneach. A thaobh seo, cruinneachadh Dàta trèanaidh AI tro luchd-obrach sluagh gu bhith na phàirt riatanach den ro-innleachd cruinneachadh dàta.
San artaigil seo, leig dhuinn sgrùdadh a dhèanamh air àite luchd-obrach sluagh, a bhuaidh air leasachadh AI algorithms ionnsachaidh agus modalan ML, agus am feum agus na buannachdan a tha e a’ toirt iasad don phròiseas air fad.
Carson a tha feum air luchd-obrach sluagh modalan AI a thogail?
Mar dhaoine, bidh sinn a’ gineadh tonna de dhàta, ach a dh’ aindeoin sin, chan eil ach bloigh den dàta a chaidh a chruthachadh agus a chruinneachadh luachmhor. Air sgàth dìth inbhean tomhais dàta, tha a’ mhòr-chuid den dàta a chaidh a chruinneachadh an dàrna cuid claon, làn de chùisean càileachd, no gun a bhith a’ riochdachadh na h-àrainneachd. Air sgàth barrachd is barrachd ionnsachadh innealan agus tha modalan ionnsachaidh domhainn gan leasachadh a bhios a’ soirbheachadh air meudan mòra de dhàta, thathas a’ faireachdainn gu bheil feum air stòran-dàta nas fheàrr, nas ùire agus nas eadar-mheasgte.
Seo far am bi luchd-obrach sluaigh a’ tighinn a-steach.
Tha dàta lorg sluagh a’ togail stòr-dàta le com-pàirt bhuidhnean mòra de dhaoine. Bidh luchd-obrach sluaigh a’ toirt a-steach fiosrachadh daonna gu inntleachd fuadain.
Àrd-ùrlaran lorg sluagh thoir cruinneachadh dàta agus notaichean microtasks do bhuidheann mòr agus eugsamhail de dhaoine. Tha Stòras Sluaigh a’ leigeil le companaidhean cothrom fhaighinn air luchd-obrach mòr, fiùghantach, cosg-èifeachdach agus so-ruigsinneach.
B’ urrainn don àrd-ùrlar lorg sluaigh as mòr-chòrdte - Amazon Mechanical Turk, 11 mìle de chòmhraidhean daonna gu duine a lorg taobh a-staigh 15 uairean, agus phàigh e an luchd-obrach $0.35 airson gach còmhradh soirbheachail. Thathas an sàs ann an àireamh cho beag de luchd-obrach sluaigh, a’ tilgeil solas air cho cudromach sa tha e inbhean lorg dàta beusach a thogail.
Gu teòiridheach, tha e coltach ri plana ciallach, ach, chan e ro-innleachd furasta a th’ ann airson a chuir an gnìomh. Tha an luchd-obrach gun urra air cùisean adhbhrachadh le tuarastal ìosal, dìmeas air còraichean luchd-obrach, agus obair de dhroch chàileachd a bheir buaidh air coileanadh modail AI.
Buannachdan a bhith aig luchd-obrach sluagh gus dàta a lorg
Le bhith a’ dol an sàs le buidheann eadar-mheasgte de luchd-obrach sluaigh, faodaidh luchd-leasachaidh fuasglaidh stèidhichte air AI meanbh-ghnìomhan a sgaoileadh agus beachdan eadar-dhealaichte is farsaing a chruinneachadh gu sgiobalta agus aig cosgais gu math ìosal.
Is e cuid de na buannachdan follaiseach bho bhith a’ fastadh luchd-obrach sluagh airson pròiseactan AI
Ùine nas luaithe don mhargaidh: A rèir rannsachadh bho Cognilytica, cha mhòr 80% of Artificial Intelligence Bithear a’ caitheamh ùine pròiseict air gnìomhan cruinneachadh dàta leithid glanadh dàta, bileagan, agus cruinneachadh dàta. Chan eil ach 20% den ùine ga chosg air leasachadh agus trèanadh. Thathas a’ cur às do na cnapan-starra traidiseanta a thaobh a bhith a’ gineadh dàta oir faodar àireamh mhòr de luchd-tabhartais fhastadh taobh a-staigh ùine ghoirid.
Fuasgladh cosg-èifeachdach: Cruinneachadh dàta bho shluagh a’ lughdachadh na h-ùine agus an lùth a thathar a’ cosg air trèanadh, trusadh, agus an toirt air bòrd. Bidh seo a’ cur às don chosgais, den ùine agus de na goireasan a tha a dhìth leis gu bheil an luchd-obrach air am fastadh air dòigh pàighidh-gach-gnìomh.
A’ cur ri iomadachd san t-seata dàta: Tha iomadachd dàta deatamach don trèanadh fuasglaidh AI gu lèir. Airson modail gus toraidhean neo-chlaonach a thoirt gu buil, feumaidh e a bhith air a thrèanadh air seata dàta eadar-mheasgte. Le bhith a’ faighinn dàta le sluagh, tha e comasach stòran-dàta eadar-mheasgte (cruinn-eòlasach, cànanan, dualchainntean) a ghineadh gun mòran oidhirp is cosgais.
A’ neartachadh scalability: Nuair a bhios tu a’ fastadh luchd-obrach sluaigh earbsach, faodaidh tu dèanamh cinnteach Àrd inbhe cruinneachadh dàta a ghabhas sgèile a rèir feumalachdan do phròiseact.
Taobh a-staigh vs sluagh-ghairm - Cò a thig a-mach mar bhuannaiche?
Dàta a-staigh | Dàta làn sluaigh |
---|---|
Faodar a bhith cinnteach à cruinneas agus cunbhalachd dàta. | Faodar càileachd dàta, mionaideachd agus cunbhalachd a chumail suas ma thèid àrd-ùrlaran solair sluaigh earbsach le ceumannan QA àbhaisteach an sàs |
Chan e co-dhùnadh pragtaigeach a th’ ann an lorg dàta a-staigh an-còmhnaidh oir is dòcha nach coinnich an sgioba a-staigh agad ri iarrtasan a’ phròiseict. | Faodar iomadachd dàta a bhith cinnteach leis gu bheil e comasach buidheann heterogenous de luchd-obrach sluaigh fhastadh a rèir feumalachdan a’ phròiseict. |
Tha e daor luchd-obrach fhastadh agus a thrèanadh airson feumalachdan a’ phròiseict. | Fuasgladh cosg-èifeachdach air cruinneachadh dàta oir tha e comasach luchd-obrach fhastadh, trèanadh agus air bòrd le nas lugha de thasgadh. |
Tha an ùine airson margaidheachd àrd oir bheir cruinneachadh dàta a-staigh mòran ùine. | Tha an ùine airson margaidheachd gu math nas lugha leis gu bheil mòran thabhartasan a’ tighinn gu sgiobalta. |
Buidheann bheag de luchd-tabhartais agus labelers a-staigh | Buidheann mòr agus eadar-mheasgte de luchd-tabhartais agus labelers dàta |
Tha dìomhaireachd dàta glè àrd le sgioba a-staigh. | Tha dìomhaireachd dàta duilich a chumail suas nuair a bhios tu ag obair le luchd-obrach mòr air feadh an t-saoghail. |
Nas fhasa lorg, trèanadh agus luachadh luchd-cruinneachaidh dàta | Dùbhlanach a bhith a’ lorg agus a’ trèanadh luchd-cruinneachaidh dàta. |
A’ dùnadh a’ bheàirn eadar luchd-obrach crowdsource agus an neach-iarrtais.
Tha cruaidh fheum air a’ bheàrn eadar luchd-obrach agus luchd-iarrtais a dhùnadh, chan ann a-mhàin ann an raon pàighidh.
Tha gainnead fiosrachaidh follaiseach bho cheann an neach-iarrtais oir chan eil an luchd-obrach a’ faighinn ach fiosrachadh mun obair shònraichte. Mar eisimpleir, ged a gheibh luchd-obrach meanbh-ghnìomhan leithid a bhith a’ clàradh chòmhraidhean san dualchainnt dhùthchasach aca, is ann ainneamh a gheibh iad co-theacs. Chan eil am fiosrachadh riatanach aca a thaobh carson a tha iad a’ dèanamh na tha iad a’ dèanamh agus an dòigh as fheàrr air a dhèanamh. Tha an dìth fiosrachaidh seo a’ toirt buaidh air càileachd na h-obrach a gheibhear bho shluagh.
Dha mac an duine, tha an co-theacsa gu lèir a’ toirt soilleireachd agus adhbhar don obair aca.
Cuir ris a’ mheasgachadh seo taobh eile den NDA - na h-aontaidhean neo-fhoillseachaidh a tha a’ cuingealachadh na tha de dh'fhiosrachadh air a thoirt do neach-obrach sluaigh. Bho shealladh luchd-obrach sluaigh, tha an toirt air falbh fiosrachaidh seo a’ nochdadh dìth earbsa agus cuideam nas lugha don obair aca.
Nuair a thathar a ‘coimhead air an aon suidheachadh bho cheann eile an speactram, tha dìth follaiseachd bho cheann an neach-obrach. Chan eil an neach-iarrtais gu tur a’ tuigsinn an neach-obrach a chaidh a choimiseanadh airson an obair a dhèanamh. Dh’ fhaodadh gum bi feum aig cuid de phròiseactan air seòrsa sònraichte de neach-obrach; ge-tà, anns a 'mhòr-chuid de phròiseactan, tha mì-chinnt ann. Tha an fìrinn na talmhainn an urrainn seo measadh, fios air ais agus trèanadh a dhèanamh nas duilghe.
To counter these difficulties, working with data collection experts with a track record of providing diverse, curated, and well-represented data from a wide selection of contributors is important.
Faodaidh grunn bhuannachdan a bhith ann a bhith a’ taghadh Shaip mar do chom-pàirtiche dàta. Bidh sinn a’ cuimseachadh air iomadachd agus sgaoileadh riochdachail de dhàta. Bidh an luchd-obrach eòlach agus dealasach againn a’ tuigsinn èigneachadh gach pròiseact agus a’ leasachadh stòran-dàta as urrainn fuasglaidhean làidir stèidhichte air AI a thrèanadh ann an ùine sam bith.
[Leugh cuideachd: Iùl tòiseachaidh dàta trèanaidh AI: Mìneachadh, eisimpleir, seataichean dàta]