Sgrùdadh Cùise: Cruinneachadh Aithris
Lìbhrigeadh 7M + Utterances gus luchd-cuideachaidh didseatach ioma-chànanach a thogail ann an 13 cànan
Fuasgladh Fìor Shaoghal
Dàta a bheir cumhachd do chòmhraidhean cruinneil
Tha feum air trèanadh Utterance ag èirigh leis nach eil a h-uile neach-ceannach a’ cleachdadh na dearbh fhaclan no abairtean fhad ‘s a bhios iad ag eadar-obrachadh no a’ faighneachd cheistean don luchd-cuideachaidh guth aca ann an cruth scripte. Sin as coireach gum feum tagraidhean guth sònraichte a bhith air an trèanadh air dàta cainnt gun spionnadh. Mar eisimpleir, “Càit a bheil an ospadal as fhaisge?” “Lorg ospadal faisg orm” no “A bheil ospadal faisg orm?” tha iad uile a’ nochdadh an aon rùn sgrùdaidh ach air an cur an cèill ann an dòigh eadar-dhealaichte.
Problem
Gus mapa-rathaid cainnt Neach-taic Didseatach teachdaichean a chuir an gnìomh airson cànanan air feadh an t-saoghail, dh’ fheumadh an sgioba tòrr dàta trèanaidh fhaighinn airson a’ mhodail AI aithneachadh cainnt. B’ iad riatanasan deatamach an neach-dèiligidh:
- Faigh meudan mòra de dhàta trèanaidh (brosnachaidhean cainnt aon neach-labhairt nach eil nas fhaide na 3-30 diogan a dh’ fhaid) airson seirbheisean aithne cainnt ann an 13 cànanan cruinne
- Airson gach cànan, cruthaichidh an solaraiche molaidhean teacsa airson luchd-labhairt a chlàradh (mura h-eil an
solar teachdaiche) agus ath-sgrìobhadh a dhèanamh air an fhuaim a thig às. - Thoir seachad dàta claisneachd agus tar-sgrìobhadh de bhriathran clàraichte le faidhlichean JSON co-fhreagarrach
anns a bheil am meata-dàta airson a h-uile clàr. - Dèan cinnteach gum bi measgachadh eadar-mheasgte de luchd-labhairt ann a rèir aois, gnè, foghlam & dualchainnt
- Dèan cinnteach gu bheil measgachadh eadar-mheasgte de àrainneachdan clàraidh a rèir nan Sònrachaidhean.
- Bidh gach clàradh claisneachd co-dhiù 16kHz ach mas fheàrr leat 44kHz
“An dèidh measadh a dhèanamh air mòran de luchd-reic, thagh an neach-dèiligidh Shaip air sgàth an eòlais ann am pròiseactan còmhraidh AI. Bha sinn air leth toilichte le comas coileanadh pròiseict Shaip, an cuid eòlais ann a bhith a’ lorg, ag ath-sgrìobhadh agus a’ lìbhrigeadh na h-aithrisean riatanach bho luchd-cànanais eòlach ann an 13 cànanan taobh a-staigh loidhnichean-ama teann agus leis a’ chàileachd a tha a dhìth.”
Solution
Leis an tuigse dhomhainn a th’ againn air AI còmhraidh, chuidich sinn an neach-dèiligidh a’ cruinneachadh, ag ath-sgrìobhadh agus a’ comharrachadh an dàta le sgioba de luchd-cànanais agus luchd-nota eòlach gus an t-sreath guth ioma-chànanach aca le cumhachd AI a thrèanadh.
Bha farsaingeachd na h-obrach airson Shaip a’ toirt a-steach ach cha robh e cuingealaichte ri bhith a’ faighinn mòran de dhàta trèanaidh claisneachd airson aithneachadh cainnt, ag ath-sgrìobhadh chlàran claisneachd ann an grunn chànanan airson a h-uile cànan air ar mapa-rathaid cànain Ìre 1 agus Ìre 2, agus a’ lìbhrigeadh JSON faidhlichean anns a bheil am meata-dàta. Chruinnich Shaip briathran de 3-30 diogan aig sgèile fhad ‘s a bha e a’ cumail na h-ìrean càileachd a bha a dhìth gus modalan ML a thrèanadh airson pròiseactan iom-fhillte.
- Fuaim air a chruinneachadh, air ath-sgrìobhadh & le notaichean: 22,250 hours
- Cànanan le taic: 13 (Danmhairgis, Coirèanais, Arabais Saudi Arabian, Duitsis, Tìr-mòr & Taiwan Sìneach, Frangach Chanada, Spàinntis Mheagsago, Turcais, Hindi, Pòlainn, Seapanais, Ruisis)
- Àireamh de bhriathran: 7M +
- Loidhne-tìm: 7-8 mìosan
Fhad ‘s a bha sinn a’ cruinneachadh abairtean claisneachd aig 16 kHz, rinn sinn cinnteach gum biodh measgachadh fallain de luchd-labhairt a rèir aois, gnè, foghlam, agus dualchainntean ann an àrainneachdan clàraidh eadar-mheasgte.
toradh
Thug an dàta claisneachd àrd-inbhe bho luchd-cànanais eòlach cumhachd don neach-dèiligidh am modal aithneachadh cainnt ioma-chànanach aca a thrèanadh gu ceart ann an 13 cànan Global Tier 1 & 2. Le stòran-dàta trèanaidh aig ìre òir, faodaidh an neach-dèiligidh taic didseatach tùrail is làidir a thabhann gus fuasgladh fhaighinn air duilgheadasan san t-saoghal fhìor.
Ar n-eòlas
Goireasan air am moladh
Stiùireadh Ceannaiche
Stiùireadh Ceannaiche: AI còmhraidh
Bidh an chatbot ris an do bhruidhinn thu a’ ruith air siostam còmhraidh adhartach AI a tha air a thrèanadh, air a dhearbhadh agus air a thogail a’ cleachdadh tonna de sheata dàta aithneachaidh cainnt.
blog
Stàit Còmhraidh AI 2021
Bidh infographics Còmhradh AI 2021 a ’bruidhinn mu dè a th’ ann an AI Còmhraidh, mar a tha e a ’fàs, seòrsaichean, Margaidh Còmhraidh AI a rèir sgìre, Cùisean Cleachdaidh, dùbhlain, msaa.
blog
3 A ’cur bacadh air mean-fhàs AI còmhraidh
Tha Shaip a ’tòiseachadh air mean-fhàs AI còmhraidh mar inneal conaltraidh luchd-cleachdaidh le bhith a’ tabhann an dàta claisneachd le notaichean riatanach ann an 50+ cànan.
Inns dhuinn ciamar as urrainn dhuinn cuideachadh leis an ath iomairt AI agad.