Sealladh Coimpiutaireachd

22+ seataichean dàta stòr fosgailte as motha a thathas a’ sireadh airson sealladh coimpiutair

Chan eil algorithm AI ach cho math ris an dàta a bhios tu ga bhiadhadh.

Chan e aithris dàna no neo-ghnàthach a th’ ann. Dh’ fhaodadh AI a bhith air a bhith a’ coimhead caran fada bho chionn deicheadan no dhà, ach tha Artificial Intelligence agus Machine Learning air a thighinn air slighe fhada bhon uairsin.

Lèirsinn coimpiutair a’ cuideachadh choimpiutairean gus bileagan is ìomhaighean a thuigsinn agus a mhìneachadh. Nuair a bhios tu a’ trèanadh do choimpiutair le bhith a’ cleachdadh an seòrsa dhealbhan ceart, gheibh e comas diofar fheartan aghaidh a lorg, a thuigsinn agus aithneachadh, galairean a lorg, carbadan fèin-riaghailteach a dhràibheadh, agus cuideachd beatha a shàbhaladh le bhith a’ cleachdadh sganadh organ ioma-thaobhach.

Thathas an dùil gun ruig am Margaidh Lèirsinn Coimpiutaireachd $ 144.46 ro 2028 bho ìre bheag de $7.04 Billion ann an 2020, a’ fàs aig CAGR de 45.64% eadar 2021 agus 2028.

Is e cuid de na cùisean cleachdaidh de lèirsinn coimpiutair:

  • Ìomhaigh mheidigeach
  • Carbad fèin-riaghailteach
  • Aithneachadh aghaidh agus stuth
  • Aithneachadh lochdan
  • Dearbhadh seallaidh

Tha stòr-dàta ìomhaigh tha thu a’ biathadh agus a’ trèanadh do Ionnsachadh Inneal agus tha gnìomhan lèirsinn coimpiutair deatamach airson soirbheachas do phròiseact AI. Tha stòr-dàta càileachd gu math duilich fhaighinn. A rèir cho iom-fhillte 'sa tha do phròiseact, dh' fhaodadh e eadar beagan làithean agus beagan sheachdainean a ghabhail gus stòran-dàta earbsach is buntainneach fhaighinn airson adhbharan lèirsinn coimpiutair.

An seo, bidh sinn a’ toirt dhut raon (air an seòrsachadh airson do shunnd) de stòran-dàta fosgailte as urrainn dhut a chleachdadh anns a’ bhad.

Liosta farsaing de sheata dàta lèirsinn coimpiutair

Seanalair:

  1. IMAGEnet (Ceangal)

    Is e stòr-dàta a th’ ann an ImageNet a thathas a’ cleachdadh gu farsaing, agus tha e a’ tighinn le 1.2 millean ìomhaigh iongantach air an seòrsachadh ann an 1000 roinn. Tha an dàta seo air a chuir air dòigh a rèir rangachd WorldNet agus air a sheòrsachadh ann an trì pàirtean - an dàta trèanaidh, bileagan ìomhaigh, agus dàta dearbhaidh.

  2. Kinetics 700 (Ceangal)

    Tha Kinetics 700 na chlàr mòr de chàileachd àrd le còrr air 650,000 criomag de 700 diofar chlasaichean gnìomh daonna. Tha timcheall air 700 criomag bhidio aig gach gnìomh clas. Tha eadar-obrachaidhean daonna-rud agus daonna-daonna anns na criomagan anns an t-seata dàta, a tha gu math cuideachail ann a bhith ag aithneachadh gnìomhan daonna ann am bhideothan.

  3. CIFAR-10 (Ceangal)

    Is e CIFAR 10 aon de na seataichean dàta lèirsinn coimpiutair as motha anns a bheil 60000 ìomhaighean dath 32 x 32 a’ riochdachadh deich diofar chlasaichean. Tha timcheall air 6000 ìomhaigh aig gach clas air an cleachdadh gus algoirmean lèirsinn coimpiutair agus ionnsachadh innealan a thrèanadh.

Aithneachadh Aghaidh:

Facial Aithneachadh

  1. Aghaidhean air an ainmeachadh san Fhiadhaich (Ceangal)

    Tha Labeled Faced in the Wild na stòr-dàta mòr anns a bheil còrr air 13,230 ìomhaigh de faisg air 5,750 neach a chaidh a lorg bhon eadar-lìn. Tha an dàta aghaidh seo air a dhealbhadh gus a dhèanamh nas fhasa sgrùdadh a dhèanamh air lorg aghaidh gun bhacadh.

  2. Aghaidh-lìn CASIA (Ceangal)

    Tha CASIA Web Face na stòr-dàta air a dheagh dhealbhadh a chuidicheas ionnsachadh innealan agus rannsachadh saidheansail air aithne aghaidh gun bhacadh. Le còrr air 494,000 ìomhaigh de cha mhòr 10,000 dearbh-aithne, tha e air leth freagarrach airson gnìomhan aithneachaidh agus dearbhaidh aghaidh.

  3. Seata-dàta UMD Faces (Ceangal)

    Tha UMD mu choinneimh stòr-dàta le deagh notaichean anns a bheil dà phàirt - ìomhaighean fhathast agus frèamaichean bhidio. Anns an t-seata dàta tha còrr air 367,800 notaichean aghaidh agus 3.7 millean frèamaichean bhidio le notaichean de chuspairean.

Aithneachadh làmh-sgrìobhaidh:

  1. Stòr-dàta MNIST (Ceangal)

    Is e stòr-dàta a th’ ann am MNIST anns a bheil sampallan de dh’ àireamhan làmh-sgrìobhte bho 0 gu 9, agus tha 60,000 agus 10,000 trèanadh agus ìomhaighean deuchainn ann. Air fhoillseachadh ann an 1999, tha MNIST ga dhèanamh nas fhasa siostaman giullachd ìomhaighean a dhearbhadh ann an Deep Learning.

  2. Seata-dàta Caractaran Artificial (Ceangal)

    Is e seata dàta Caractaran Artificial, mar a tha an t-ainm a’ moladh, dàta air a chruthachadh gu saor-thoileach a tha a’ toirt cunntas air structar na Beurla ann an deich prìomh litrichean. Tha e a’ tighinn le còrr air 6000 dealbh.

Bruidhnidh sinn mun riatanas Dàta Trèanaidh AI agad an-diugh.

Dearbhadh Rud:

  1. MS COCO (Ceangal)

    Tha MS COCO no Rudan Cumanta ann an Co-theacsa na sheata dàta lorg agus captioning nithean.

    Tha còrr air 328,000 ìomhaigh ann le lorg prìomh phuing, lorg ioma-rudeigin, ceann-sgrìobhadh, agus notaichean masg sgaraidh. Tha e a’ tighinn le 80 roinnean de stuthan agus còig fo-thiotalan airson gach ìomhaigh.

  2. LSUN(Ceangal)

    Tha còrr air millean ìomhaigh le ainm aig LSUN, goirid airson Tuigse Seallaidh Mòr-sgèile, ann an 20 roinnean nì agus 10 seallaidhean. Tha faisg air 300,000 ìomhaigh ann an cuid de roinnean, le 300 ìomhaigh gu sònraichte airson dearbhadh agus 1000 ìomhaigh airson dàta deuchainn.

  3. Rudan Dachaigh(Ceangal)

    Ann an stòr-dàta Home Objects tha ìomhaighean le notaichean de stuthan air thuaiream bho air feadh an taighe - cidsin, seòmar-suidhe agus seòmar-ionnlaid. Anns an t-seata dàta seo cuideachd tha beagan bhideothan le notaichean agus 398 dealbh gun chomharradh air an dealbhadh airson deuchainn.

Einnsean:

  1. Stòr-dàta Cityscape (Ceangal)

    Is e Cityscape an stòr-dàta airson a dhol nuair a thathar a’ coimhead airson diofar shreathan bhidio a chaidh a chlàradh bho ghrunn luaidh air seallaidhean sràide. Chaidh na h-ìomhaighean seo a ghlacadh thar ùine mhòr agus ann an diofar shìde agus suidheachaidhean aotrom. Tha na notaichean airson 30 clas de dhealbhan air an roinn ann an ochd roinnean eadar-dhealaichte.

  2. Slighe domhainn Barkley (Ceangal)

    Tha Barkley DeepDrive air a dhealbhadh gu sònraichte airson trèanadh carbaid fèin-riaghailteach, agus tha còrr air 100 mìle sreath bhidio le notaichean aige. Is e seo aon den dàta trèanaidh as fheumaile airson carbadan fèin-riaghailteach leis na h-atharrachaidhean rathaid agus suidheachaidhean dràibhidh.

  3. mapillary (Ceangal)

    Tha còrr air 750 millean sealladh sràide agus soidhnichean trafaic aig Mapillary air feadh an t-saoghail, a tha glè fheumail ann a bhith a’ trèanadh mhodalan sealladh lèirsinneach ann an ionnsachadh innealan agus algorithms AI. Leigidh e leat carbadan fèin-riaghailteach a leasachadh a bhios a’ freagairt air diofar sholais agus aimsir agus seallaidhean.

Ìomhaigh Leigheil:

  1. Seata dàta rannsachaidh fosgailte Covid-19 (Ceangal)

    Tha timcheall air 6500 roinn sgamhain piogsail-polygonal seo mu ghathan-x ciste AP/PA. A bharrachd air an sin, tha 517 ìomhaigh de x-ghathan euslainteach Covid-19 le tagaichean anns a bheil ainm, àite, mion-fhiosrachadh inntrigidh, toradh, agus barrachd rim faighinn.

  2. Stòr-dàta NIH de 100,000 X-ghathan ciste (Ceangal)

    Is e stòr-dàta NIH aon de na stòran-dàta as fharsainge a tha ri fhaighinn gu poblach anns a bheil 100,000 ìomhaigh x-ghathan broilleach agus dàta co-cheangailte a tha feumail don choimhearsnachd shaidheansail agus rannsachaidh. Tha eadhon ìomhaighean ann de dh’ euslaintich le tinneasan sgamhain adhartach.

  3. Atlas de pathology didseatach (Ceangal)

    Tha Atlas of Digital Pathology a’ tabhann grunn ìomhaighean paiste histopathological, còrr air 17,000 gu h-iomlan, bho faisg air 100 sleamhnag le notaichean de dhiofar bhuill. Tha an dàta seo feumail ann a bhith a’ leasachadh bathar-bog lèirsinn coimpiutair agus aithneachadh pàtrain.

Aithneachadh Seallaidh:

Aithneachadh Seallaidh

  1. Aithneachadh Seallaidhean a-staigh (Ceangal)

    Tha Aithneachadh Seallaidh a-staigh na sheata dàta làn seòrsaichte le faisg air 15620 ìomhaigh de nithean agus seallaidhean a-staigh airson an cleachdadh ann an ionnsachadh innealan agus trèanadh dàta. Tha e a’ tighinn le còrr air 65 roinnean, agus tha co-dhiù 100 dealbh aig gach roinn.

  2. x Sealladh (Ceangal)

    Mar aon de na stòran-dàta as ainmeil a tha rim faighinn gu poblach, tha xView a’ toirt a-steach tonna de dhealbhan os cionn le notaichean bho dhiofar sheallaidhean iom-fhillte agus mòr. Le timcheall air 60 clas agus còrr air millean cùis nì, is e adhbhar an t-seata dàta seo faochadh mòr-thubaist nas fheàrr a thoirt seachad a’ cleachdadh ìomhaighean saideal.

  3. Àiteachan (Ceangal)

    Tha còrr air 1.8 millean ìomhaigh aig Places, stòr-dàta a chuir MIT ris, bho 365 diofar roinnean seallaidh. Tha timcheall air 50 ìomhaigh anns gach aon de na roinnean sin airson dearbhadh agus 900 ìomhaigh airson deuchainn. Tha e comasach feartan sealladh domhainn ionnsachadh gus gnìomhan aithneachadh sealladh no aithneachadh lèirsinneach a stèidheachadh.

Cur-seachad:

  1. Seata-dàta IMDB WIKI (Ceangal)

    IMDB - Is e Wiki aon de na stòran-dàta poblach as mòr-chòrdte de dh’ aghaidhean le bileagan iomchaidh le aois, gnè, agus ainmean. Tha cuideachd timcheall air 20 mìle aghaidh dhaoine ainmeil agus 62 mìle bho Wikipedia.

  2. Aghaidhean Celeb (Ceangal)

    Tha Celeb Faces na stòr-dàta mòr le 200,000 ìomhaigh le notaichean de dhaoine ainmeil. Bidh na h-ìomhaighean a’ tighinn le fuaim cùil agus a’ suidheachadh atharrachaidhean, gan dèanamh luachmhor airson seataichean deuchainn trèanaidh ann an gnìomhan lèirsinn coimpiutair. Tha e air leth buannachdail airson cruinneas nas àirde a choileanadh ann an aithneachadh aghaidh, deasachadh, sgìreachadh pàirt aghaidh, agus barrachd.

A-nis gu bheil liosta mòr agad de stòran-dàta ìomhaigh stòr fosgailte gus connadh a thoirt don inneal fiosrachaidh fuadain agad. Tha toradh do mhodalan AI agus ionnsachadh inneal gu mòr an urra ri càileachd an dàta air am bi thu ag ithe agus gan trèanadh. Ma tha thu airson gum bi am modal AI agad a’ tilgeil suas ro-innse ceart, feumaidh e stòran-dàta càileachd a tha air an cruinneachadh, air an tagadh agus air an ainmeachadh gu foirfeachd. Gus soirbheachadh an t-siostam lèirsinn coimpiutair agad a mheudachadh, feumaidh tu stòran-dàta ìomhaigh càileachd a chleachdadh a tha iomchaidh do lèirsinn do phròiseact. Ma tha thu a’ coimhead airson barrachd stòran-dàta mar sin Cliog an seo

sòisealta Sgaoil

Faodaidh tu cuideachd Like