Datasets fosgailte
Faigh a-mach stòran-dàta stòr fosgailte a bheir ort a dhol a thrèanadh modalan ML
Datasets Open Source gus do thòiseachadh le modalan AI / ML
Chan eil toradh nam modalan AI & ML agad ach cho math ris an dàta a bhios tu a ’cleachdadh airson a thrèanadh - mar sin tha an cruinneas a chuireas tu a-steach air cruinneachadh dàta agus tagadh agus comharrachadh an dàta sin cudromach!
Mar sin ma tha thu airson iomairt ùr AI / ML a thòiseachadh agus a-nis tha thu a ’tuigsinn gu sgiobalta gum bi lorg dàta trèanaidh àrd-inbhe mar aon de na taobhan as dùbhlanaiche den phròiseact agad oir is e stòran-dàta àrd-inbhe an connadh a chumas an AI / Einnsean ML a ’ruith. Tha sinn air liosta de stòran-dàta fosgailte a chruinneachadh a tha an-asgaidh airson na modalan AI / ML agad san àm ri teachd a chleachdadh agus a thrèanadh.
Speisealachadh | Seòrsa dàta | Ainm Dataset | Gnìomhachas / Roinn. | Cùis mothachadh / cleachdadh | Tuairisgeul | Ceangal |
---|---|---|---|---|---|---|
NLP | teacsa | Lèirmheasan Amazon | E-malairt | Mion-sgrùdadh sentiment | Seata de lèirmheasan & rangachadh 35 Mn bho còrr air 18 bliadhna ann an teacsa shoilleir le mion-fhiosrachadh luchd-cleachdaidh agus toradh. | Ceangal |
NLP | teacsa | Dàta Ceanglaichean Wikipedia | Coitcheann | Barrachd air 4 Mn. artaigilean anns a bheil 1.9 Bn. facal a tha a ’toirt a-steach faclan agus abairtean a bharrachd air paragrafan. | Ceangal | |
NLP | teacsa | Banca craobh Sentford Standford | Cur-seachad | Mion-sgrùdadh sentiment | Seata dàta de notaichean sentiment airson còrr air 10,000 pìos lèirmheasan bho Rotten Tomatoes ann an cruth faidhle HTML | Ceangal |
NLP | teacsa | Sentiment Twitter na SA | Airline | Mion-sgrùdadh sentiment | Tweets 2015 air US Airlines air an sgaoileadh gu tònaichean adhartach, àicheil agus neodrach | Ceangal |
CV | Ìomhaigh | Aodainnean le bileagan fiadhaich | Coitcheann | Facial Aithneachadh | Dataset anns a bheil còrr air 13,000 aghaidhean cropped le dà dhealbh eadar-dhealaichte airson trèanadh aithne aghaidh. | Ceangal |
CV | Bhidio, Ìomhaigh | Dataset UMDFaces | Coitcheann | Facial Aithneachadh | Seata dàta le notaichean anns a bheil còrr air 367,000 aghaidhean bho barrachd air 8,000 cuspair a tha a ’toirt a-steach ìomhaighean fhathast agus bhidio. | Ceangal |
CV | Ìomhaigh | Dealbh-lìn | Coitcheann | Dataset le còrr air 14 Mn. ìomhaighean ann an grunn chruthan faidhle, air an eagrachadh a rèir rangachd WordNet. | Ceangal | |
CV | Ìomhaigh | Dealbhan fosgailte Google | Coitcheann | 9 Mn. URLan gus ìomhaighean poblach a sheòrsachadh bho barrachd air 6,000 roinnean. | Ceangal | |
NLP | teacsa | Stòr-dàta Cùram Critigeach MIMIC | Cùram slàinte | Seataichean-dàta Eòlas-eòlas Coimpiutaireachd le dàta neo-chomharraichte bho 40,000 euslainteach cùram èiginneach. Anns an t-seata dàta tha fiosrachadh leithid deamografaigs, soidhnichean deatamach, cungaidhean, msaa. | Ceangal | |
CV | Ìomhaigh | Oifis Siubhail is Turasachd Nàiseanta na SA | turasachd | A ’toirt seachad dealbhan farsaing bho ghnìomhachas na turasachd le stòran-dàta earbsach, a’ coimhead air cuspairean leithid siubhal a-steach is a-muigh agus fiosrachadh turasachd eadar-nàiseanta. | Ceangal | |
NLP | teacsa | Roinn na Còmhdhail | turasachd | Seataichean dàta turasachd a tha a ’toirt a-steach Pàircean Nàiseanta, clàran dhràibhearan, drochaidean & fiosrachadh rèile msaa. | Ceangal | |
NLP | Fhuaime | Corpas Caption Fuaim Flickr | Coitcheann | Còrr is 40k sgrìobhadh bho 8,000 dealbh air an dealbhadh airson pàtrain cainnt gun stiùireadh | Ceangal | |
NLP | Fhuaime | Dataset Òrdughan Òraid | Coitcheann | Aithneachadh òraid, mothachadh claisneachd | 1 dàrna facal fada bho mhìltean de dhaoine fa leth, gus eadar-aghaidh guth bunaiteach a thogail. | Ceangal |
NLP | Fhuaime | Datasets claisneachd àrainneachd | Coitcheann | Seataichean dàta claisneachd àrainneachd anns a bheil fuaim chlàran thachartasan agus bùird seallaidhean fuaimneach. | Ceangal | |
NLP | teacsa | Dataset Rannsachaidh Fosgailte COVID-19 | Cùram slàinte | AI meidigeach | Stòr-dàta rannsachaidh anns a bheil 45,000 artaigil sgoilearach air COVID-19 & teaghlach bhìorasan coronavirus. | Ceangal |
CV | Ìomhaigh | Seata-dàta Fosgailte Waymo | carbadan | Na stòran-dàta dràibhidh fèin-riaghailteach as eadar-mheasgte a chaidh an leigeil ma sgaoil le Waymo | Ceangal | |
CV | Ìomhaigh | Genome lèirsinneach | Coitcheann | Captioning ìomhaigh | Bunait eòlas lèirsinneach le fo-thiotal mionaideach de chòrr air ìomhaighean 100K | Ceangal |
CV | Ìomhaigh | Labelme | Govt Poblach. | Seata mòr de dhealbhan le notaichean rim faighinn tron Labelme Matlab | Ceangal | |
CV | Ìomhaigh | COIL100 | Coitcheann | Còrr is 100 de nithean eadar-dhealaichte air an togail bho iomadh ceàrnan (ie 360 ceum) | Ceangal | |
CV | Ìomhaigh | Dataset coin Stanford | Coitcheann | Còrr is 20,500+ ìomhaigh air an seòrsachadh a-steach do sheata ìomhaighean de 120 gnè cù eadar-dhealaichte | Ceangal | |
CV | Ìomhaigh | Aithneachadh Seallaidhean a-staigh | Coitcheann | Aithneachadh Seallaidh | Seata-dàta sònraichte air a dhèanamh suas de 15620 ìomhaigh bho 67 roinnean a-staigh gus modalan aithneachaidh seallaidhean a thogail | Ceangal |
CV | Ìomhaigh | Lèirsinne QA | Coitcheann | Seata-dàta a tha a ’toirt a-steach ceistean fosgailte a’ buntainn ri 265,016 dealbh a dh ’fheumas tuigse air lèirsinn agus tuigse cànain gus freagairt. | Ceangal | |
NLP | teacsa | Seata dàta mion-sgrùdadh sentiment Multidomain | E-malairt | Mion-sgrùdadh sentiment | Dataset anns a bheil lèirmheasan toraidh bho Amazon | Ceangal |
NLP | teacsa | Lèirmheasan IMDB | Cur-seachad | Mion-sgrùdadh sentiment | Dataset anns a bheil 25000 lèirmheas film airson mion-sgrùdadh faireachdainnean | Ceangal |
NLP | teacsa | Mothachadh140 | Coitcheann | Mion-sgrùdadh sentiment | Dataset anns a bheil 160,000 tweets le emoticons air an toirt air falbh airson cruinneas nas àirde | Ceangal |
NLP | teacsa | Corpas Blogger | Coitcheann | Ananlysis Keyprase | Dataset anns a bheil 681,288 puist blog bho blogger.com a ’toirt a-steach 200 tachartas aig a’ char as lugha de fhaclan Beurla a tha air an cleachdadh gu farsaing. | Ceangal |
NLP | teacsa | Gearan | Coitcheann | Trèanadh Chatbot | Dataset le barrachd air 200,000 ceist a dh'fhaodar a chleachdadh gus modalan ionnsachaidh innealan a thrèanadh gus freagairt gu fèin-ghluasadach | Ceangal |
NLP | teacsa | Cruinneachadh Spama SMS sa Bheurla | Telecom | Aithneachadh spama | Stòr-dàta teachdaireachd spama air a dhèanamh suas de 5,574 SMS Beurla | Ceangal |
NLP | teacsa | Lèirmheasan Yelp | Coitcheann | Mion-sgrùdadh sentiment | Seata dàta le lèirmheas còrr air 5 mn air fhoillseachadh le Yelp | Ceangal |
NLP | teacsa | Spambase UCI | Iomairt | Aithneachadh spama | Stòr-dàta mòr de phuist-d spama, feumail airson sìoladh spama. | Ceangal |
CV | Bhidio, Ìomhaigh | Dràibhear domhainn Berkeley BDD100k | carbadan | Carbadan Fèin-riaghlaidh | Is e aon de na stòran-dàta as motha airson AI fèin-dràibhidh anns a bheil 1,100-uair de eòlasan dràibhidh ann an còrr air 100,000 bhidio bho dhiofar amannan den latha bho sgìre New York agus San Francisco. | Ceangal |
CV | Video | Coma.ai | carbadan | Carbadan Fèin-riaghlaidh | Stòr-dàta dràibhidh àrd-rathaid 7 uairean a thìde a ’toirt a-steach fiosrachadh mu astar, luathachadh, ceàrn stiùiridh, agus co-chomharran GPS | Ceangal |
CV | Bhidio, Ìomhaigh | Dataset Cityscape | carbadan | Label Semantic airson Carbad Fèin-riaghlaidh | Stòr-dàta de 5,000 notaichean aig ìre piogsail a bharrachd air seata nas motha de 20,000 frèam le notaichean lag ann an sreathan bhidio stereo, air an clàradh bho 50 cathair eadar-dhealaichte. | Ceangal |
CV | Ìomhaigh | Seata-dàta soidhne trafaic KUL Bheilg | carbadan | Carbadan Fèin-riaghlaidh | Còrr is 10000+ soidhne trafaic bho sgìre Flanders stèidhichte air soidhnichean trafaic eadar-dhealaichte bho air feadh na Beilge. | Ceangal |
CV | Ìomhaigh | LISA: Obair-lann airson Automobiles Intelligent & Safe, Datasets UC San Diego | carbadan | Carbadan Fèin-riaghlaidh | Stòr-dàta beairteach anns a bheil soidhnichean trafaic, lorg charbadan, solais trafaic agus pàtrain slighe. | Ceangal |
CV | Ìomhaigh | CIFAR-10 | Coitcheann | Aithneachadh Rud | Stòr-dàta a ’toirt a-steach 50,000 ìomhaigh agus 10,000 ìomhaigh deuchainn (ie 60,000 32 × 32 ìomhaigh dath ann an 10 clasaichean) airson aithne a thoirt do nithean. | Ceangal |
CV | Ìomhaigh | MNIST fasan | Fashion | Seata dàta ìomhaigh anns a bheil 60,000 eisimpleir agus seata deuchainn de 10,000 eisimpleir ann an ìomhaighean liath 28 × 28, co-cheangailte ri bileag bho 10 clasaichean. | Ceangal | |
CV | Ìomhaigh | Dataset IMDB-Wiki | Cur-seachad | Facial Aithneachadh | Stòr-dàta mòr de dhealbhan aghaidh le bileagan mar gnè agus aois. A-mach às na 523,051 ìomhaighean aghaidh iomlan, gheibhear 460,723 ìomhaigh bho 20,284 daoine ainmeil bho IMDB & 62,328 bho Wikipedia. | Ceangal |
CV | Video | Kinetics-700 | Coitcheann | Airson gach clas gnìomh, tha an stòr-dàta àrd-inbhe a ’toirt a-steach 650,000 criomag bhidio agus a’ toirt a-steach 700 clas gnìomh daonna le co-dhiù 600 criomag bhidio. An seo, mairidh gach criomag 10 diogan no mar sin. | Ceangal | |
CV | Ìomhaigh | MS Coco | Coitcheann | Dearbhadh oibseact, Segmentation | Anns an t-seata dàta tha ìomhaighean 328k agus tha eisimpleirean de 2.5 Mn gu h-iomlan ann agus 91 ìomhaigh de nithean gus lorg a dhèanamh air lorg nithean mòra, cuairteachadh agus modaladh dàta co-cheangailte ri fo-thiotal ML. | Ceangal |
CV | Ìomhaigh | Dataset Pose Daonna MPII | Coitcheann | Tha timcheall air dealbhan 25K anns a bheil còrr air 40K neach le joints bodhaig le notaichean air an toirt a-steach don dàta, a tha air a chleachdadh airson tuairmse a dhèanamh air suidheachadh daonna. Gu h-iomlan, tha an stòr-dàta a ’còmhdach 410 gnìomhachd daonna agus tha bileag gnìomh air a thoirt do gach ìomhaigh. | Ceangal | |
CV | Ìomhaigh | Dealbhan fosgailte | Coitcheann | Notaichean àite àite | Stòr-dàta ìomhaighean le timcheall air ìomhaighean 9 Mn le bileagan ìre ìomhaigh, bogsaichean crìochnachaidh nithean, cuairteachadh nithean msaa. Tha an stòr-dàta cuideachd air a dhèanamh suas de 16 Mn. a ’ceangal bhogsaichean airson 600 clas de nithean air ìomhaighean 1.9 Mn. | Ceangal |
CV | Video | Àrd-ùrlar Fosgailte Apollo, le Baidu Inc, Sìona | carbadan | Bogsa Crìochan, LiDAR | Seata dàta dràibhidh fèin-riaghailteach beairteach, a bheir do luchd-leasachaidh an dàta a tha a dhìth ann an draibheadh fèin-riaghailteach gus èifeachdas an iteachaidh ùr-ghnàthach a luathachadh. | Ceangal |
CV | Bhidio, Ìomhaigh | Argo, le Argo, USA | carbadan | Bogsa Crìochan, Sruth Optigeach, Label Giùlan, Label Semantic, Comharradh Lane | Stòr-dàta fèin-dràibhidh a tha air a dhèanamh suas de mhapaichean HD le meata-dàta geoimeatrach & semantach ie meadhan loidhnichean, stiùireadh slighe, agus àite dràibhidh. Tha an stòr-dàta air a chleachdadh gus modalan ML a thrèanadh, gus algorithms beachd nas cruinne a dhèanamh, a chuidicheas carbadan fèin-dràibhidh gus seòladh gu sàbhailte. | Ceangal |
CV | Video | Solais Trafaic Beaga Bosch, le Bosch North America Research | carbadan | Bogsa Crìochan | Seata dàta a ’toirt a-steach ìomhaighean camara 13427 le rùn 1280 * 720 gus siostam lorg solais trafaic stèidhichte air lèirsinn a thogail. Tha barrachd air 24000 solais trafaic le notaichean air an dàta. | Ceangal |
CV | Video | Brain4Cars, le Cornell Univ., Na Stàitean Aonaichte | carbadan | Label giùlain | Stòr-dàta anns a bheil sreath de luchd-mothachaidh caibineat (camarathan, mothachairean fiosrachail, innealan snasail, msaa) gus staitistig feumail a tharraing a-mach mu mhothachadh an draibhear. Dh ’fhaodadh na h-algorithms againn draibhearan a lorg a tha cadalach no a’ tarraing aire agus a ’togail rabhaidh riatanach gus dìon a leasachadh. | Ceangal |
CV | Ìomhaigh | CULane, le Sìneach Univ. de Hong Kong, Beijing, Sìona | carbadan | Comharradh Caol-shràid | Chaidh seata dàta Computer Computer mu lorg sreathan trafaic, a ’toirt a-steach 55 uair de bhideothan agus chaidh 133,235 (seata trèanaidh 88880, seata dearbhaidh 9675, agus seata deuchainn 34680) a thoirt a-mach. Tha e air a chruinneachadh le camarathan air an cur suas air sia carbadan eadar-dhealaichte air an gluasad le diofar dhraibhearan ann am Beijing. | Ceangal |
CV | Video | DAVIS, le Univ. de Zurich, ETH ¨ Zurich, A ’Ghearmailt, an Eilbheis | carbadan | Seata dàta trèanaidh dràibhidh carbad deireadh gu deireadh a bhios a ’cleachdadh tachartas DAVIS + camara frèam. Bithear a ’cleachdadh dàta càr leithid stiùir, smeòrach, GPS, msaa gus measadh a dhèanamh air measgachadh dàta frèam is tachartais airson aplacaidean fèin-ghluasadach. | Ceangal | |
CV | Video | DBNet, le Shanghai Jiao Tong Univ., Xiamen Univ., Sìona | carbadan | Cloud Cloud, LiDAR | Dàta dràibhidh 1000 KM san t-saoghal, a tha a ’toirt a-steach bhidio co-thaobhach, sgòthan puing, GPS agus giùlan dhràibhearan airson sgrùdadh domhainn air giùlan draibhidh. | Ceangal |
CV | Video | Dr (sùil) ve, le Univ. de Modena agus Reggio Emilia, Modena, an Eadailt | carbadan | Label giùlain | Dataset anns a bheil 74 sreathan bhidio de 5 mion gach fear, a chaidh an comharrachadh ann an còrr air 500,000 frèam. Tha an stòr-dàta a ’gabhail a-steach àiteachan le iomradh Geo, astar dràibhidh, cùrsa, agus cuideachd bileagan draibhearan ag amharc air rèiteachadh agus an amalachadh ùineail a’ toirt seachad mapaichean a tha sònraichte don ghnìomh. | Ceangal |
CV | Video | ETH Pedestrian (2009), le ETH Zurich, Zurich, an Eilbheis | Coitcheann | Bogsa Crìochan | Stòr-dàta de 74 sreathan bhidio de 5 mionaidean gach fear, le notaichean ann an còrr air 500,000 frèam. Tha an stòr-dàta a ’toirt seachad suidheachaidhean geo-iomraidh, astar dràibhidh, stiùireadh, agus cuideachd bileagan ag amharc air rèiteachadh airson draibhearan agus an amalachadh ùineail, a’ toirt a-steach mapaichean gnìomh-sònraichte. | Ceangal |
CV | Video | Ford (2009), le Univ. de Michigan, Michigan, SA | carbadan | Bogsa Ceangail ,, LiDAR | Stòr-dàta air a chur ri chèile le carbad talmhainn fèin-ghluasadach le armachd le sganair Velodyne 3D-lidar, dà mhullach Rieg a tha a ’coimhead air adhart, Aonad Tomhais Inertial teignigeach agus neach-cleachdaidh (IMU), agus siostam camara omnidirectional Point Grey Ladybug3. | Ceangal |
CV | Video | Stereo dùbhlanach HCI, Rannsachadh Bosch Corporation, Hildesheim, A ’Ghearmailt | Coitcheann | Seata dàta de ghrunn mhillean frèamaichean bho sheallaidhean bhidio a chaidh an glacadh a tha a ’toirt a-steach raon farsaing de dhiofar shuidheachaidhean sìde, ioma sreathan de ghluasad agus doimhneachd; suidheachaidhean anns a ’bhaile agus air an dùthaich, msaa. | Ceangal | |
CV | Video | JAAD, le Oilthigh York, an Úcráin, Canada | carbadan | Bogsa Ceangail, leubail giùlain | "Tha JAAD na sheata-dàta airson a bhith a’ sgrùdadh co-aire ann an co-theacsa dràibhidh fèin-riaghailteach. Tha am fòcas air giùlan luchd-coiseachd agus draibhearan aig a ’phuing tarsainn agus factaran a tha a’ toirt buaidh orra. Chun na crìche seo, tha seata-dàta JAAD a ’toirt seachad cruinneachadh làn notaichean de 346 bhidio ghoirid criomagan (5-10 diogan a dh ’fhaid) air an toirt a-mach bho còrr air 240 uair a thìde de dhealbhan dràibhidh bho ghrunn àiteachan ann an Ameireagadh a Tuath agus taobh an ear na Roinn Eòrpa. Tha bogsaichean ceangail le tagaichean occlusion air an cleachdadh airson a h-uile neach-coiseachd a tha a’ dèanamh an dàta seo freagarrach airson lorg luchd-coiseachd. Tha notaichean giùlain a ’sònrachadh giùlan airson luchd-coiseachd. a bhios ag eadar-obrachadh leis an dràibhear no a dh ’fheumas aire a thoirt dha. Airson gach bhidio tha grunn tagaichean (aimsir, àiteachan, msaa) agus bileagan giùlan stampa-tìm (me stad, coiseachd, coimhead, msaa.) A bharrachd air an sin, tha liosta de bhuadhan deamografach air a thoirt seachad airson gach neach-coiseachd (me aois, gnè, stiùireadh a ’ghluasaid, msaa) a bharrachd air liosta de eileamaidean sealladh trafaic faicsinneach (me soidhne stad, comharra trafaic, msaa) anns gach frèam." | Ceangal |
CV | Video | KAIST Urban, le KAIST, Korea a-Deas | Coitcheann | LiDAR | Tha an cruinneachadh dàta a ’toirt a-steach grunn luchd-mothachaidh àite airson dàta LiDAR agus ìomhaighean stereo a’ cuimseachadh air sgìre bhailteil gu math toinnte (me sgìrean metropolis, togalaichean iom-fhillte agus sgìrean còmhnaidh). | Ceangal |
CV | Ìomhaigh | Soidhne Trafaic LISA, le Univ. de California, San Diego, Na Stàitean Aonaichte | carbadan | Bogsa Crìochan | An seata de sheata-dàta anns a bheil bhideothan agus frèaman le notaichean anns a bheil soidhnichean trafaic na SA. Tha e air a leigeil ma sgaoil ann an dà ìre, aon le dìreach na dealbhan agus aon le dealbhan agus bhideothan. | Ceangal |
CV | Ìomhaigh | Mapillary Vistas, le Mapillary AB, Global | carbadan | Label Semantic | Stòr-dàta togail dhealbhan aig ìre sràide airson a bhith a ’mìneachadh seallaidhean sràide air feadh an t-saoghail le notaichean daonna a tha ceart le piogsail agus eisimpleir. | Ceangal |
CV | Bhidio, Ìomhaigh | Semantic KITTI, le Oilthigh Bonn, Karlsruhe, A ’Ghearmailt | carbadan | Bogsa Crìochan, Label Semantic, Comharradh Lane | Seata dàta a tha a ’toirt a-steach mothachadh semantach airson gach sreath Comharradh Odometry. Tha an stòr-dàta a ’comharrachadh diofar sheòrsaichean de thrafaig gluasadach agus neo-ghluasadach: a’ toirt a-steach càraichean, baidhsagalan, baidhsagalan, luchd-coiseachd agus baidhsagalan, a ’leigeil le nithean san t-sealladh a bhith air an sgrùdadh. | Ceangal |
CV | Video | Stanford Track, le Stanford Univ., Na Stàitean Aonaichte | carbadan | Dearbhadh / Seòrsachadh Rud LiDAR, GPS, Còdan | Stòr-dàta a tha a ’toirt a-steach slighean 14,000 le bileagan mar a chithear le LelodAR Velodyne HDL-64E S2 ann an seallaidhean sràide nàdarra, a ghabhas cleachdadh gus modalan ionnsachaidh innealan a thrèanadh airson Aithneachadh Rud 3D. | Ceangal |
CV | Bhidio, Ìomhaigh | Seata-dàta Boxy, le Bosch, Na Stàitean Aonaichte | carbadan | Bogsa Ceangail / Dearbhadh Carbaid | Seata dàta lorg charbadan anns a bheil 2 mhillean carbad le notaichean airson trèanadh agus sgrùdadh ro-innleachdan aithneachadh nithean airson càraichean fèin-dràibhidh air mòr-rathaidean. | Ceangal |
CV | Video | TME Motorway, le Seiceach Technical Univ., Ceann a Tuath na h-Eadailt | carbadan | Bogsa Crìochan | Stòr-dàta de 28 criomagan airson 27 mionaid gu h-iomlan air a thoirt a-steach do 30,000+ frèamaichean carbaid. Chaidh mothachadh a thoirt a-mach gu fèin-ghluasadach a ’cleachdadh an dàta bhon sganair laser. Tha an cruinneachadh dàta seo a ’toirt a-steach suidheachaidhean trafaic caochlaideach, àireamh de shlighean, curvature rathaid agus soillseachadh, a’ còmhdach mòran de chumhachan an làn cheannach. | Ceangal |
CV | Video | Llamas gun stiùireadh, le Bosch, na Stàitean Aonaichte | carbadan | Comharradh Lane, LiDAR | Chaidh an seata dàta Llamas gun stiùireadh a chomharrachadh le bhith a ’gineadh mapaichean dràibhidh fèin-ghluasadach àrd-mhìneachaidh, a’ toirt a-steach comharran liana stèidhichte air Lidar. Faodar an carbad fèin-riaghailteach a cho-thaobhadh ris na mapaichean sin agus tha comharran nan sreathan air an ro-innse do fhrèam a ’chamara. Tha an ro-mheasadh 3D air a mheudachadh le bhith a ’lughdachadh an eadar-dhealachadh eadar comharran ìomhaigh a chaidh fhaicinn cheana agus a bha dùil. | Ceangal |
NLP | Fhuaime | LibriSpeech Ioma-chànanach Facebook AI (MLS) | Coitcheann | Aithneachadh Fuaim / Aithneachadh Cainnt | Tha Facebook AI Multilingual LibriSpeech (MLS), na sheata dàta stòr mòr fosgailte a chaidh a dhealbhadh gus cuideachadh le rannsachadh adhartachadh ann an aithneachadh cainnt fèin-ghluasadach (ASR). Bidh MLS a ’toirt seachad còrr air 50,000 uair a thìde de chlaistinn thar 8 cànanan: Beurla, Gearmailtis, Duitsis, Fraingis, Spàinntis, Eadailtis, Portuguese agus Pòlainn. | Ceangal |