Datasets fosgailte

Faigh a-mach stòran-dàta stòr fosgailte a bheir ort a dhol a thrèanadh modalan ML

Datasets fosgailte

Datasets Open Source gus do thòiseachadh le modalan AI / ML

Chan eil toradh nam modalan AI & ML agad ach cho math ris an dàta a bhios tu a ’cleachdadh airson a thrèanadh - mar sin tha an cruinneas a chuireas tu a-steach air cruinneachadh dàta agus tagadh agus comharrachadh an dàta sin cudromach!

Mar sin ma tha thu airson iomairt ùr AI / ML a thòiseachadh agus a-nis tha thu a ’tuigsinn gu sgiobalta gum bi lorg dàta trèanaidh àrd-inbhe mar aon de na taobhan as dùbhlanaiche den phròiseact agad oir is e stòran-dàta àrd-inbhe an connadh a chumas an AI / Einnsean ML a ’ruith. Tha sinn air liosta de stòran-dàta fosgailte a chruinneachadh a tha an-asgaidh airson na modalan AI / ML agad san àm ri teachd a chleachdadh agus a thrèanadh.

SpeisealachadhSeòrsa dàtaAinm DatasetGnìomhachas / Roinn.Cùis mothachadh / cleachdadhTuairisgeulCeangal
NLPteacsaLèirmheasan AmazonE-malairtMion-sgrùdadh sentimentSeata de lèirmheasan & rangachadh 35 Mn bho còrr air 18 bliadhna ann an teacsa shoilleir le mion-fhiosrachadh luchd-cleachdaidh agus toradh.Ceangal
NLPteacsaDàta Ceanglaichean WikipediaCoitcheannBarrachd air 4 Mn. artaigilean anns a bheil 1.9 Bn. facal a tha a ’toirt a-steach faclan agus abairtean a bharrachd air paragrafan.Ceangal
NLPteacsaBanca craobh Sentford StandfordCur-seachadMion-sgrùdadh sentimentSeata dàta de notaichean sentiment airson còrr air 10,000 pìos lèirmheasan bho Rotten Tomatoes ann an cruth faidhle HTMLCeangal
NLPteacsaSentiment Twitter na SAAirlineMion-sgrùdadh sentimentTweets 2015 air US Airlines air an sgaoileadh gu tònaichean adhartach, àicheil agus neodrachCeangal
CVÌomhaigh Aodainnean le bileagan fiadhaichCoitcheannFacial AithneachadhDataset anns a bheil còrr air 13,000 aghaidhean cropped le dà dhealbh eadar-dhealaichte airson trèanadh aithne aghaidh.Ceangal
CVBhidio, ÌomhaighDataset UMDFacesCoitcheannFacial AithneachadhSeata dàta le notaichean anns a bheil còrr air 367,000 aghaidhean bho barrachd air 8,000 cuspair a tha a ’toirt a-steach ìomhaighean fhathast agus bhidio.Ceangal
CVÌomhaigh Dealbh-lìnCoitcheannDataset le còrr air 14 Mn. ìomhaighean ann an grunn chruthan faidhle, air an eagrachadh a rèir rangachd WordNet.Ceangal
CVÌomhaigh Dealbhan fosgailte GoogleCoitcheann9 Mn. URLan gus ìomhaighean poblach a sheòrsachadh bho barrachd air 6,000 roinnean.Ceangal
NLPteacsaStòr-dàta Cùram Critigeach MIMICCùram slàinteSeataichean-dàta Eòlas-eòlas Coimpiutaireachd le dàta neo-chomharraichte bho 40,000 euslainteach cùram èiginneach. Anns an t-seata dàta tha fiosrachadh leithid deamografaigs, soidhnichean deatamach, cungaidhean, msaa.Ceangal
CVÌomhaighOifis Siubhail is Turasachd Nàiseanta na SAturasachdA ’toirt seachad dealbhan farsaing bho ghnìomhachas na turasachd le stòran-dàta earbsach, a’ coimhead air cuspairean leithid siubhal a-steach is a-muigh agus fiosrachadh turasachd eadar-nàiseanta.Ceangal
NLPteacsaRoinn na CòmhdhailturasachdSeataichean dàta turasachd a tha a ’toirt a-steach Pàircean Nàiseanta, clàran dhràibhearan, drochaidean & fiosrachadh rèile msaa.Ceangal
NLPFhuaimeCorpas Caption Fuaim FlickrCoitcheannCòrr is 40k sgrìobhadh bho 8,000 dealbh air an dealbhadh airson pàtrain cainnt gun stiùireadhCeangal
NLPFhuaimeDataset Òrdughan ÒraidCoitcheannAithneachadh òraid, mothachadh claisneachd1 dàrna facal fada bho mhìltean de dhaoine fa leth, gus eadar-aghaidh guth bunaiteach a thogail.Ceangal
NLPFhuaimeFSD (Fuaim an-asgaidh)CoitcheannCruinneachadh de fhuaimean gach latha air an cruinneachadh fo chead stòr fosgailte.Ceangal
NLPFhuaimeDatasets claisneachd àrainneachdCoitcheannSeataichean dàta claisneachd àrainneachd anns a bheil fuaim chlàran thachartasan agus bùird seallaidhean fuaimneach.Ceangal
NLPteacsaDataset Rannsachaidh Fosgailte COVID-19 Cùram slàinteAI meidigeachStòr-dàta rannsachaidh anns a bheil 45,000 artaigil sgoilearach air COVID-19 & teaghlach bhìorasan coronavirus.Ceangal
CVÌomhaighSeata-dàta Fosgailte Waymo carbadanNa stòran-dàta dràibhidh fèin-riaghailteach as eadar-mheasgte a chaidh an leigeil ma sgaoil le WaymoCeangal
CVÌomhaighGenome lèirsinneach CoitcheannCaptioning ìomhaighBunait eòlas lèirsinneach le fo-thiotal mionaideach de chòrr air ìomhaighean 100KCeangal
CVÌomhaighLabelme Govt Poblach.Seata mòr de dhealbhan le notaichean rim faighinn tron ​​Labelme MatlabCeangal
CVÌomhaighCOIL100CoitcheannCòrr is 100 de nithean eadar-dhealaichte air an togail bho iomadh ceàrnan (ie 360 ​​ceum)Ceangal
CVÌomhaighDataset coin StanfordCoitcheannCòrr is 20,500+ ìomhaigh air an seòrsachadh a-steach do sheata ìomhaighean de 120 gnè cù eadar-dhealaichteCeangal
CVÌomhaighAithneachadh Seallaidhean a-staighCoitcheannAithneachadh SeallaidhSeata-dàta sònraichte air a dhèanamh suas de 15620 ìomhaigh bho 67 roinnean a-staigh gus modalan aithneachaidh seallaidhean a thogailCeangal
CVÌomhaighLèirsinne QACoitcheannSeata-dàta a tha a ’toirt a-steach ceistean fosgailte a’ buntainn ri 265,016 dealbh a dh ’fheumas tuigse air lèirsinn agus tuigse cànain gus freagairt.Ceangal
NLPteacsaSeata dàta mion-sgrùdadh sentiment MultidomainE-malairtMion-sgrùdadh sentimentDataset anns a bheil lèirmheasan toraidh bho AmazonCeangal
NLPteacsaLèirmheasan IMDBCur-seachadMion-sgrùdadh sentimentDataset anns a bheil 25000 lèirmheas film airson mion-sgrùdadh faireachdainneanCeangal
NLPteacsaMothachadh140CoitcheannMion-sgrùdadh sentimentDataset anns a bheil 160,000 tweets le emoticons air an toirt air falbh airson cruinneas nas àirdeCeangal
NLPteacsaCorpas BloggerCoitcheannAnanlysis KeypraseDataset anns a bheil 681,288 puist blog bho blogger.com a ’toirt a-steach 200 tachartas aig a’ char as lugha de fhaclan Beurla a tha air an cleachdadh gu farsaing.Ceangal
NLPteacsaGearanCoitcheannTrèanadh ChatbotDataset le barrachd air 200,000 ceist a dh'fhaodar a chleachdadh gus modalan ionnsachaidh innealan a thrèanadh gus freagairt gu fèin-ghluasadachCeangal
NLPteacsaCruinneachadh Spama SMS sa BheurlaTelecomAithneachadh spamaStòr-dàta teachdaireachd spama air a dhèanamh suas de 5,574 SMS BeurlaCeangal
NLPteacsaLèirmheasan YelpCoitcheannMion-sgrùdadh sentimentSeata dàta le lèirmheas còrr air 5 mn air fhoillseachadh le YelpCeangal
NLPteacsaSpambase UCIIomairtAithneachadh spamaStòr-dàta mòr de phuist-d spama, feumail airson sìoladh spama.Ceangal
CVBhidio, ÌomhaighDràibhear domhainn Berkeley BDD100kcarbadanCarbadan Fèin-riaghlaidhIs e aon de na stòran-dàta as motha airson AI fèin-dràibhidh anns a bheil 1,100-uair de eòlasan dràibhidh ann an còrr air 100,000 bhidio bho dhiofar amannan den latha bho sgìre New York agus San Francisco.Ceangal
CVVideoApolloscapes BaiducarbadanCarbadan Fèin-riaghlaidh ,, Label Semantic, Comharradh LaneSeata dàta farsaing a tha a ’toirt cunntas air 26 nithean semantach fa leth, leithid carbadan, rothaichean, daoine, taighean, solais sràide, msaa.Ceangal
CVVideoComa.aicarbadanCarbadan Fèin-riaghlaidh Stòr-dàta dràibhidh àrd-rathaid 7 uairean a thìde a ’toirt a-steach fiosrachadh mu astar, luathachadh, ceàrn stiùiridh, agus co-chomharran GPSCeangal
CVBhidio, ÌomhaighDataset CityscapecarbadanLabel Semantic airson Carbad Fèin-riaghlaidhStòr-dàta de 5,000 notaichean aig ìre piogsail a bharrachd air seata nas motha de 20,000 frèam le notaichean lag ann an sreathan bhidio stereo, air an clàradh bho 50 cathair eadar-dhealaichte.Ceangal
CVÌomhaighSeata-dàta soidhne trafaic KUL BheilgcarbadanCarbadan Fèin-riaghlaidhCòrr is 10000+ soidhne trafaic bho sgìre Flanders stèidhichte air soidhnichean trafaic eadar-dhealaichte bho air feadh na Beilge.Ceangal
CVÌomhaighLISA: Obair-lann airson Automobiles Intelligent & Safe, Datasets UC San DiegocarbadanCarbadan Fèin-riaghlaidhStòr-dàta beairteach anns a bheil soidhnichean trafaic, lorg charbadan, solais trafaic agus pàtrain slighe.Ceangal
CVÌomhaighCIFAR-10CoitcheannAithneachadh RudStòr-dàta a ’toirt a-steach 50,000 ìomhaigh agus 10,000 ìomhaigh deuchainn (ie 60,000 32 × 32 ìomhaigh dath ann an 10 clasaichean) airson aithne a thoirt do nithean.Ceangal
CVÌomhaighMNIST fasanFashionSeata dàta ìomhaigh anns a bheil 60,000 eisimpleir agus seata deuchainn de 10,000 eisimpleir ann an ìomhaighean liath 28 × 28, co-cheangailte ri bileag bho 10 clasaichean.Ceangal
CVÌomhaighDataset IMDB-WikiCur-seachadFacial AithneachadhStòr-dàta mòr de dhealbhan aghaidh le bileagan mar gnè agus aois. A-mach às na 523,051 ìomhaighean aghaidh iomlan, gheibhear 460,723 ìomhaigh bho 20,284 daoine ainmeil bho IMDB & 62,328 bho Wikipedia.Ceangal
CVVideoKinetics-700CoitcheannAirson gach clas gnìomh, tha an stòr-dàta àrd-inbhe a ’toirt a-steach 650,000 criomag bhidio agus a’ toirt a-steach 700 clas gnìomh daonna le co-dhiù 600 criomag bhidio. An seo, mairidh gach criomag 10 diogan no mar sin.Ceangal
CVÌomhaighMS CocoCoitcheannDearbhadh oibseact, SegmentationAnns an t-seata dàta tha ìomhaighean 328k agus tha eisimpleirean de 2.5 Mn gu h-iomlan ann agus 91 ìomhaigh de nithean gus lorg a dhèanamh air lorg nithean mòra, cuairteachadh agus modaladh dàta co-cheangailte ri fo-thiotal ML.Ceangal
CVÌomhaighDataset Pose Daonna MPIICoitcheannTha timcheall air dealbhan 25K anns a bheil còrr air 40K neach le joints bodhaig le notaichean air an toirt a-steach don dàta, a tha air a chleachdadh airson tuairmse a dhèanamh air suidheachadh daonna. Gu h-iomlan, tha an stòr-dàta a ’còmhdach 410 gnìomhachd daonna agus tha bileag gnìomh air a thoirt do gach ìomhaigh.Ceangal
CVÌomhaighDealbhan fosgailteCoitcheannNotaichean àite àiteStòr-dàta ìomhaighean le timcheall air ìomhaighean 9 Mn le bileagan ìre ìomhaigh, bogsaichean crìochnachaidh nithean, cuairteachadh nithean msaa. Tha an stòr-dàta cuideachd air a dhèanamh suas de 16 Mn. a ’ceangal bhogsaichean airson 600 clas de nithean air ìomhaighean 1.9 Mn.Ceangal
CVVideoÀrd-ùrlar Fosgailte Apollo, le Baidu Inc, SìonacarbadanBogsa Crìochan, LiDARSeata dàta dràibhidh fèin-riaghailteach beairteach, a bheir do luchd-leasachaidh an dàta a tha a dhìth ann an draibheadh ​​fèin-riaghailteach gus èifeachdas an iteachaidh ùr-ghnàthach a luathachadh.Ceangal
CVBhidio, ÌomhaighArgo, le Argo, USAcarbadanBogsa Crìochan, Sruth Optigeach, Label Giùlan, Label Semantic, Comharradh LaneStòr-dàta fèin-dràibhidh a tha air a dhèanamh suas de mhapaichean HD le meata-dàta geoimeatrach & semantach ie meadhan loidhnichean, stiùireadh slighe, agus àite dràibhidh. Tha an stòr-dàta air a chleachdadh gus modalan ML a thrèanadh, gus algorithms beachd nas cruinne a dhèanamh, a chuidicheas carbadan fèin-dràibhidh gus seòladh gu sàbhailte.Ceangal
CVVideoSolais Trafaic Beaga Bosch, le Bosch North America ResearchcarbadanBogsa CrìochanSeata dàta a ’toirt a-steach ìomhaighean camara 13427 le rùn 1280 * 720 gus siostam lorg solais trafaic stèidhichte air lèirsinn a thogail. Tha barrachd air 24000 solais trafaic le notaichean air an dàta.Ceangal
CVVideoBrain4Cars, le Cornell Univ., Na Stàitean AonaichtecarbadanLabel giùlainStòr-dàta anns a bheil sreath de luchd-mothachaidh caibineat (camarathan, mothachairean fiosrachail, innealan snasail, msaa) gus staitistig feumail a tharraing a-mach mu mhothachadh an draibhear. Dh ’fhaodadh na h-algorithms againn draibhearan a lorg a tha cadalach no a’ tarraing aire agus a ’togail rabhaidh riatanach gus dìon a leasachadh.Ceangal
CVÌomhaighCULane, le Sìneach Univ. de Hong Kong, Beijing, SìonacarbadanComharradh Caol-shràidChaidh seata dàta Computer Computer mu lorg sreathan trafaic, a ’toirt a-steach 55 uair de bhideothan agus chaidh 133,235 (seata trèanaidh 88880, seata dearbhaidh 9675, agus seata deuchainn 34680) a thoirt a-mach. Tha e air a chruinneachadh le camarathan air an cur suas air sia carbadan eadar-dhealaichte air an gluasad le diofar dhraibhearan ann am Beijing.Ceangal
CVVideoDAVIS, le Univ. de Zurich, ETH ¨ Zurich, A ’Ghearmailt, an EilbheiscarbadanSeata dàta trèanaidh dràibhidh carbad deireadh gu deireadh a bhios a ’cleachdadh tachartas DAVIS + camara frèam. Bithear a ’cleachdadh dàta càr leithid stiùir, smeòrach, GPS, msaa gus measadh a dhèanamh air measgachadh dàta frèam is tachartais airson aplacaidean fèin-ghluasadach.Ceangal
CVVideoDBNet, le Shanghai Jiao Tong Univ., Xiamen Univ., SìonacarbadanCloud Cloud, LiDARDàta dràibhidh 1000 KM san t-saoghal, a tha a ’toirt a-steach bhidio co-thaobhach, sgòthan puing, GPS agus giùlan dhràibhearan airson sgrùdadh domhainn air giùlan draibhidh.Ceangal
CVVideoDr (sùil) ve, le Univ. de Modena agus Reggio Emilia, Modena, an EadailtcarbadanLabel giùlainDataset anns a bheil 74 sreathan bhidio de 5 mion gach fear, a chaidh an comharrachadh ann an còrr air 500,000 frèam. Tha an stòr-dàta a ’gabhail a-steach àiteachan le iomradh Geo, astar dràibhidh, cùrsa, agus cuideachd bileagan draibhearan ag amharc air rèiteachadh agus an amalachadh ùineail a’ toirt seachad mapaichean a tha sònraichte don ghnìomh.Ceangal
CVVideoETH Pedestrian (2009), le ETH Zurich, Zurich, an EilbheisCoitcheannBogsa CrìochanStòr-dàta de 74 sreathan bhidio de 5 mionaidean gach fear, le notaichean ann an còrr air 500,000 frèam. Tha an stòr-dàta a ’toirt seachad suidheachaidhean geo-iomraidh, astar dràibhidh, stiùireadh, agus cuideachd bileagan ag amharc air rèiteachadh airson draibhearan agus an amalachadh ùineail, a’ toirt a-steach mapaichean gnìomh-sònraichte.Ceangal
CVVideoFord (2009), le Univ. de Michigan, Michigan, SAcarbadanBogsa Ceangail ,, LiDARStòr-dàta air a chur ri chèile le carbad talmhainn fèin-ghluasadach le armachd le sganair Velodyne 3D-lidar, dà mhullach Rieg a tha a ’coimhead air adhart, Aonad Tomhais Inertial teignigeach agus neach-cleachdaidh (IMU), agus siostam camara omnidirectional Point Grey Ladybug3.Ceangal
CVVideoStereo dùbhlanach HCI, Rannsachadh Bosch Corporation, Hildesheim, A ’GhearmailtCoitcheannSeata dàta de ghrunn mhillean frèamaichean bho sheallaidhean bhidio a chaidh an glacadh a tha a ’toirt a-steach raon farsaing de dhiofar shuidheachaidhean sìde, ioma sreathan de ghluasad agus doimhneachd; suidheachaidhean anns a ’bhaile agus air an dùthaich, msaa.Ceangal
CVVideoJAAD, le Oilthigh York, an Úcráin, CanadacarbadanBogsa Ceangail, leubail giùlain"Tha JAAD na sheata-dàta airson a bhith a’ sgrùdadh co-aire ann an co-theacsa dràibhidh fèin-riaghailteach. Tha am fòcas air giùlan luchd-coiseachd agus draibhearan aig a ’phuing tarsainn agus factaran a tha a’ toirt buaidh orra. Chun na crìche seo, tha seata-dàta JAAD a ’toirt seachad cruinneachadh làn notaichean de 346 bhidio ghoirid criomagan (5-10 diogan a dh ’fhaid) air an toirt a-mach bho còrr air 240 uair a thìde de dhealbhan dràibhidh bho ghrunn àiteachan ann an Ameireagadh a Tuath agus taobh an ear na Roinn Eòrpa. Tha bogsaichean ceangail le tagaichean occlusion air an cleachdadh airson a h-uile neach-coiseachd a tha a’ dèanamh an dàta seo freagarrach airson lorg luchd-coiseachd. Tha notaichean giùlain a ’sònrachadh giùlan airson luchd-coiseachd. a bhios ag eadar-obrachadh leis an dràibhear no a dh ’fheumas aire a thoirt dha. Airson gach bhidio tha grunn tagaichean (aimsir, àiteachan, msaa) agus bileagan giùlan stampa-tìm (me stad, coiseachd, coimhead, msaa.) A bharrachd air an sin, tha liosta de bhuadhan deamografach air a thoirt seachad airson gach neach-coiseachd (me aois, gnè, stiùireadh a ’ghluasaid, msaa) a bharrachd air liosta de eileamaidean sealladh trafaic faicsinneach (me soidhne stad, comharra trafaic, msaa) anns gach frèam."Ceangal
CVVideoKAIST Urban, le KAIST, Korea a-DeasCoitcheannLiDARTha an cruinneachadh dàta a ’toirt a-steach grunn luchd-mothachaidh àite airson dàta LiDAR agus ìomhaighean stereo a’ cuimseachadh air sgìre bhailteil gu math toinnte (me sgìrean metropolis, togalaichean iom-fhillte agus sgìrean còmhnaidh).Ceangal
CVÌomhaighSoidhne Trafaic LISA, le Univ. de California, San Diego, Na Stàitean AonaichtecarbadanBogsa CrìochanAn seata de sheata-dàta anns a bheil bhideothan agus frèaman le notaichean anns a bheil soidhnichean trafaic na SA. Tha e air a leigeil ma sgaoil ann an dà ìre, aon le dìreach na dealbhan agus aon le dealbhan agus bhideothan.Ceangal
CVÌomhaighMapillary Vistas, le Mapillary AB, GlobalcarbadanLabel SemanticStòr-dàta togail dhealbhan aig ìre sràide airson a bhith a ’mìneachadh seallaidhean sràide air feadh an t-saoghail le notaichean daonna a tha ceart le piogsail agus eisimpleir.Ceangal
CVBhidio, ÌomhaighSemantic KITTI, le Oilthigh Bonn, Karlsruhe, A ’GhearmailtcarbadanBogsa Crìochan, Label Semantic, Comharradh LaneSeata dàta a tha a ’toirt a-steach mothachadh semantach airson gach sreath Comharradh Odometry. Tha an stòr-dàta a ’comharrachadh diofar sheòrsaichean de thrafaig gluasadach agus neo-ghluasadach: a’ toirt a-steach càraichean, baidhsagalan, baidhsagalan, luchd-coiseachd agus baidhsagalan, a ’leigeil le nithean san t-sealladh a bhith air an sgrùdadh.Ceangal
CVVideoStanford Track, le Stanford Univ., Na Stàitean AonaichtecarbadanDearbhadh / Seòrsachadh Rud LiDAR, GPS, CòdanStòr-dàta a tha a ’toirt a-steach slighean 14,000 le bileagan mar a chithear le LelodAR Velodyne HDL-64E S2 ann an seallaidhean sràide nàdarra, a ghabhas cleachdadh gus modalan ionnsachaidh innealan a thrèanadh airson Aithneachadh Rud 3D.Ceangal
CVVideoStixel, le Daimler AG, A ’GhearmailtcarbadanStixelStòr-dàta air a dhèanamh suas de 12 sreathan rathaid stereo air an comharrachadh le dàta fìrinn talmhainn air àite an-asgaidh (stixels) agus dàta carbaid (astar, ceàrn yaw, agus stampa ùine) agus geoimeatraidh a ’chamara.Ceangal
CVBhidio, ÌomhaighSeata-dàta Boxy, le Bosch, Na Stàitean AonaichtecarbadanBogsa Ceangail / Dearbhadh CarbaidSeata dàta lorg charbadan anns a bheil 2 mhillean carbad le notaichean airson trèanadh agus sgrùdadh ro-innleachdan aithneachadh nithean airson càraichean fèin-dràibhidh air mòr-rathaidean.Ceangal
CVVideoTME Motorway, le Seiceach Technical Univ., Ceann a Tuath na h-EadailtcarbadanBogsa CrìochanStòr-dàta de 28 criomagan airson 27 mionaid gu h-iomlan air a thoirt a-steach do 30,000+ frèamaichean carbaid. Chaidh mothachadh a thoirt a-mach gu fèin-ghluasadach a ’cleachdadh an dàta bhon sganair laser. Tha an cruinneachadh dàta seo a ’toirt a-steach suidheachaidhean trafaic caochlaideach, àireamh de shlighean, curvature rathaid agus soillseachadh, a’ còmhdach mòran de chumhachan an làn cheannach.Ceangal
CVVideoLlamas gun stiùireadh, le Bosch, na Stàitean AonaichtecarbadanComharradh Lane, LiDARChaidh an seata dàta Llamas gun stiùireadh a chomharrachadh le bhith a ’gineadh mapaichean dràibhidh fèin-ghluasadach àrd-mhìneachaidh, a’ toirt a-steach comharran liana stèidhichte air Lidar. Faodar an carbad fèin-riaghailteach a cho-thaobhadh ris na mapaichean sin agus tha comharran nan sreathan air an ro-innse do fhrèam a ’chamara. Tha an ro-mheasadh 3D air a mheudachadh le bhith a ’lughdachadh an eadar-dhealachadh eadar comharran ìomhaigh a chaidh fhaicinn cheana agus a bha dùil.Ceangal
NLPFhuaimeLibriSpeech Ioma-chànanach Facebook AI (MLS)CoitcheannAithneachadh Fuaim / Aithneachadh CainntTha Facebook AI Multilingual LibriSpeech (MLS), na sheata dàta stòr mòr fosgailte a chaidh a dhealbhadh gus cuideachadh le rannsachadh adhartachadh ann an aithneachadh cainnt fèin-ghluasadach (ASR). Bidh MLS a ’toirt seachad còrr air 50,000 uair a thìde de chlaistinn thar 8 cànanan: Beurla, Gearmailtis, Duitsis, Fraingis, Spàinntis, Eadailtis, Portuguese agus Pòlainn. Ceangal