Aithneachadh eintiteas ainmichte (NER)

Aithneachadh Aonad Ainmichte (NER) - Am Bun-bheachd, Seòrsan, agus Tagraidhean

Gach uair a chluinneas sinn facal no a leughas sinn teacsa, tha an comas nàdarra againn am facal aithneachadh agus a sheòrsachadh a-steach do dhaoine, àite, àite, luachan, agus barrachd. Is urrainn dha mac an duine facal aithneachadh gu sgiobalta, a sheòrsachadh agus an co-theacsa a thuigsinn. Mar eisimpleir, nuair a chluinneas tu am facal ‘Steve Jobs,’ faodaidh tu smaoineachadh sa bhad air co-dhiù trì no ceithir buadhan agus an eintiteas a sgaradh gu roinnean,

  • Duine: Steve Jobs
  • Companaidh: Apple
  • Àite: California

Leis nach eil an comas nàdarra seo aig coimpiutairean, tha feum aca air ar cuideachadh gus faclan no teacsa aithneachadh agus an seòrsachadh. Tha e far a bheil Aithneachadh eintiteas ainmichte (NER) thig a-steach.

Nach faigh sinn tuigse ghoirid air NER agus an dàimh a th’ aige ri NLP.

Dè a th’ ann an Aithneachadh eintiteas ainmichte?

Tha Aithneachadh Aonad Ainmichte na phàirt de Phròiseas Cànain Nàdarra. Prìomh amas a Ner tha e ri ghiollachd dàta structaraichte agus neo-structaraichte agus na buidhnean ainmichte sin a sheòrsachadh ann an roinnean ro-mhìnichte. Tha cuid de roinnean cumanta a’ toirt a-steach ainm, àite, companaidh, ùine, luachan airgid, tachartasan, agus barrachd.

Ann an ùine ghoirid, tha NER a’ dèiligeadh ri:

  • Aithneachadh/lorg eintiteas ainmichte – A’ comharrachadh facal no sreath fhaclan ann an sgrìobhainn.
  • Seòrsachadh eintiteas ainmichte - A’ seòrsachadh gach eintiteas a chaidh a lorg ann an roinnean ro-mhìnichte.

Ach ciamar a tha NER co-cheangailte ri NLP?

Bidh giullachd Cànain Nàdarra a’ cuideachadh le bhith a’ leasachadh innealan tuigseach a tha comasach air brìgh a tharraing à cainnt is teacsa. Bidh Ionnsachadh Inneal a’ cuideachadh nan siostaman tuigseach sin a’ leantainn air adhart ag ionnsachadh le bhith a’ trèanadh air tòrr mòr de chànan nàdarra seataichean dàta.

San fharsaingeachd, tha trì prìomh roinnean ann an NLP:

  • A’ tuigsinn structar agus riaghailtean a’ chànain – Syntax
  • A’ faighinn brìgh fhacail, teacsa, agus cainnt agus a’ comharrachadh an dàimh – Semantics
  • Ag aithneachadh agus ag aithneachadh fhacail labhairteach agus gan tionndadh gu teacsa — Òraid

Bidh NER a’ cuideachadh anns a’ phàirt semantach de NLP, a’ toirt a-mach brìgh fhaclan, gan comharrachadh agus gan lorg stèidhichte air na dàimhean aca.

Eisimpleirean cumanta de NER

Cuid de na h-eisimpleirean cumanta de ro-shuidhichte seòrsachadh eintiteas tha:

Eisimpleirean de ner
Eisimpleirean de ner

Duine: Mìcheal Jackson, Oprah Winfrey, Barack Obama, Susan Sarandon

Àite: Canada, Honolulu, Bangkok, Brazil, Cambridge

Buidheann: Samsung, Disney, Oilthigh Yale, Google

Uair: 15.35, 12f,

Tha roinnean eile a’ toirt a-steach luachan àireamhach, Cur an cèill, Seòlaidhean Post-d, agus Goireas.

Neo-chinnteachd ann an Aithneachadh Aonad Ainmichte

Tha an roinn dham buin teirm gu math soilleir dha mac an duine. Ach, chan ann mar sin a tha coimpiutaran - thig iad tarsainn air duilgheadasan seòrsachaidh. Mar eisimpleir:

Cathair Mhanchester (Buidheann) Cupa a’ Phrìomh Lìog a bhuannachadh ach anns an t-seantans a leanas thathas a’ cleachdadh a’ bhuidheann ann an dòigh eadar-dhealaichte. Cathair Mhanchester (Àite) na thaigh-cumhachd aodaich is gnìomhachais.

Feumaidh am modail NER agad dàta trèanaidh a ghiùlan gu ceart toirt a-mach eintiteas agus seòrsachadh. Ma tha thu a’ trèanadh do mhodail air Beurla Shakespeare, gun fheum a ràdh, cha bhith e comasach dha Instagram a mhìneachadh.

Dòighean-obrach NER eadar-dhealaichte

Prìomh amas a modail NER is e sin ainmean a chomharrachadh ann an sgrìobhainnean teacsa agus an seòrsachadh. Tha na trì dòighean-obrach a leanas air an cleachdadh gu coitcheann airson an adhbhair seo. Ach, faodaidh tu taghadh aon no barrachd dhòighean a chur còmhla cuideachd.

Bruidhnidh sinn mun riatanas Dàta Trèanaidh AI agad an-diugh.

Is iad na diofar dhòighean air siostaman NER a chruthachadh:

  • Siostaman stèidhichte air faclair

    Is dòcha gur e an siostam stèidhichte air faclair an dòigh-obrach NER as sìmplidh agus as bunaitiche. Cleachdaidh e faclair le mòran fhaclan, cho-fhaclan, agus cruinneachadh briathrachais. Nì an siostam sgrùdadh a bheil eintiteas sònraichte a tha an làthair anns an teacsa cuideachd ri fhaighinn sa bhriathrachas. Le bhith a’ cleachdadh algairim maidsidh sreang, thathas a’ dèanamh tar-sgrùdadh air buidhnean.

    Is e aon eas-bhuannachd bho bhith a’ cleachdadh an dòigh-obrach seo gu bheil feum air an dàta briathrachais ùrachadh gu cunbhalach airson obrachadh èifeachdach a’ mhodail NER.

  • Siostaman stèidhichte air riaghailtean

    Anns an dòigh-obrach seo, tha fiosrachadh air a thoirt a-mach stèidhichte air seata de riaghailtean ro-shuidhichte. Tha dà phrìomh sheata de riaghailtean air an cleachdadh,

    Riaghailtean stèidhichte air pàtran - Mar a tha an t-ainm a’ moladh, tha riaghailt stèidhichte air pàtran a’ leantainn pàtran morphologach no sreath fhaclan a thathar a’ cleachdadh sa phàipear.

    Riaghailtean stèidhichte air co-theacsa - Tha riaghailtean stèidhichte air co-theacsa an urra ri brìgh no co-theacsa an fhacail anns an sgrìobhainn.

  • Siostaman stèidhichte air ionnsachadh innealan

    Ann an siostaman stèidhichte air ionnsachadh innealan, thathas a’ cleachdadh modaladh staitistigeil gus buidhnean a lorg. Tha riochdachadh stèidhichte air feart den sgrìobhainn teacsa air a chleachdadh san dòigh-obrach seo. Faodaidh tu faighinn thairis air grunn eas-bhuannachdan bhon chiad dà dhòigh-obrach bhon a dh'aithnicheas am modail seòrsaichean eintiteas a dh'aindeoin atharrachaidhean beaga anns na litreachadh aca.

Cleachd Cùisean agus Eisimpleirean de Aithneachadh Aonad Ainmichte?

A’ foillseachadh Iom-fhillteachd Aithneachadh Ainmean Ainmichte (NER):

  1. chatbots: Bidh NER a’ toirt taic do chatbots mar ChatGPT aig OpenAI ann a bhith a’ tuigsinn cheistean luchd-cleachdaidh le bhith a’ comharrachadh prìomh bhuidhnean.
  2. Taic Luchd-cleachdaidh: Bidh e ag eagrachadh fios air ais bho luchd-cleachdaidh a rèir ainmean toraidh, a’ luathachadh amannan freagairt.
  3. Ionmhas: Bidh NER a’ toirt a-mach dàta deatamach bho aithisgean ionmhais, a’ cuideachadh le mion-sgrùdadh ghluasadan agus measadh cunnairt.
  4. Cùram-slàinte: Bidh e a’ tarraing fiosrachadh riatanach bho chlàran clionaigeach, a’ brosnachadh mion-sgrùdadh dàta nas luaithe.
  5. HR: Bidh e a’ sgioblachadh fastadh le bhith a’ toirt geàrr-chunntas air pròifilean thagraichean agus a’ stiùireadh fios air ais bho luchd-obrach.
  6. Luchd-solair Naidheachd: Bidh NER a’ seòrsachadh susbaint gu fiosrachadh agus gluasadan buntainneach, a’ luathachadh aithris.
  7. Einnseanan molaidh: Bidh companaidhean mar Netflix a’ fastadh NER gus molaidhean a phearsanachadh stèidhichte air giùlan luchd-cleachdaidh.
  8. Innealan Rannsachaidh: Le bhith a’ seòrsachadh susbaint lìn, bidh NER ag àrdachadh cruinneas toradh rannsachaidh.
  9. Mion-sgrùdadh sentiment: Bidh NER a’ toirt a-mach iomraidhean branda bho lèirmheasan, a’ brosnachadh innealan sgrùdaidh faireachdainn.

Iarrtasan bho NER

Tha grunn chùisean cleachdaidh aig NER ann an iomadh raon co-cheangailte ri Giullachd Cànain Nàdarra agus cruthachadh stòran-dàta trèanaidh airson ionnsachadh innealan agus ionnsachadh domhainn fuasglaidhean. Is e cuid de thagraidhean NER:

  • Taic teachdaiche nas sìmplidhe

    Is urrainn do shiostam NER gearanan luchd-cleachdaidh, ceistean agus fios air ais a lorg gu furasta stèidhichte air fiosrachadh deatamach leithid ainmean toraidh, sònrachaidhean, àiteachan meur, agus barrachd. Tha an gearan no fios air ais air a sheòrsachadh gu h-iomchaidh agus air a chuir air falbh chun roinn cheart le bhith a’ sìoladh prìomh fhaclan prìomhachais.

  • Goireasan Daonna Èifeachdach

    Bidh NER a’ cuideachadh sgiobaidhean Goireasan Daonna gus am pròiseas fastaidh aca adhartachadh agus na loidhnichean-tìm a lughdachadh le bhith a’ toirt geàrr-chunntas gu sgiobalta air ath-thòiseachadh thagraichean. Faodaidh na h-innealan NER an ath-thòiseachadh a sganadh agus fiosrachadh iomchaidh a tharraing a-mach - ainm, aois, seòladh, teisteanas, colaiste, agus mar sin air adhart.

    A bharrachd air an sin, faodaidh an roinn HR cuideachd innealan NER a chleachdadh gus na sruthan obrach a-staigh a sgioblachadh le bhith a’ sìoladh ghearanan luchd-obrach agus gan cur air adhart gu na ceannardan roinneil buntainneach.

  • Seòrsachadh susbaint nas sìmplidhe

    Tha seòrsachadh susbaint na obair èibhinn dha solaraichean naidheachdan. Le bhith a’ seòrsachadh an t-susbaint ann an diofar roinnean ga dhèanamh nas fhasa faighinn a-mach, seallaidhean fhaighinn, gluasadan a chomharrachadh, agus na cuspairean a thuigsinn. A Ainmichte Aithneachadh Aonachd faodaidh inneal a bhith feumail do sholaraichean naidheachdan. Faodaidh e mòran artaigilean a sganadh, prìomh fhaclan a chomharrachadh, agus fiosrachadh a tharraing a-mach stèidhichte air na daoine, a’ bhuidheann, an àite, agus barrachd.

  • Ag àrdachadh einnseanan luirg

    Rannsaich inneal-luirg Ner a’ cuideachadh le bhith a’ sìmpleachadh agus ag adhartachadh astar agus iomchaidheachd thoraidhean rannsachaidh. An àite a bhith a’ ruith a’ cheist rannsachaidh airson mìltean de artaigilean, faodaidh modal NER a’ cheist a ruith aon uair agus na toraidhean a shàbhaladh. Mar sin, stèidhichte air na tagaichean anns a’ cheist sgrùdaidh, faodar na h-artaigilean co-cheangailte ris a’ cheist a thogail gu sgiobalta.

     

  • Moladh susbaint ceart

    Tha grunn thagraidhean ùr-nodha an urra ri innealan NER gus eòlas teachdaiche làn-leasaichte agus gnàthaichte a lìbhrigeadh. Mar eisimpleir, tha Netflix a’ toirt seachad molaidhean pearsanaichte stèidhichte air eachdraidh sgrùdaidh is seallaidh neach-cleachdaidh a’ cleachdadh aithne eintiteas ainmichte.

Bidh Aithneachadh eintiteas ainmichte a’ dèanamh do ionnsachadh innealan modailean nas èifeachdaiche agus nas earbsaiche. Ach, feumaidh tu stòran-dàta trèanaidh càileachd airson na modailean agad a bhith ag obair aig an ìre as fheàrr agus a’ coileanadh amasan a tha san amharc. Chan eil agad ach com-pàirtiche seirbheis eòlach a bheir dhut stòran-dàta càileachd deiseil airson a chleachdadh. Ma tha sin fìor, is e Shaip an geall as fheàrr agad fhathast. Rach a-mach thugainn airson stòran-dàta coileanta NER gus do chuideachadh le bhith a’ leasachadh fhuasglaidhean ML èifeachdach is adhartach airson na modalan AI agad.

[Leugh cuideachd: Sgrùdadh Cùise: Aithneachadh Aonad Ainmichte (NER) airson NLP Clionaigeach]

Ciamar a tha Aithneachadh Buidhne Ainmichte ag obair?

Le bhith a’ dol a-steach don raon Aithneachadh Aonadh Ainmichte (NER) a’ nochdadh turas eagarach anns a bheil grunn ìrean:

  • Tòcaireachd

    An toiseach, tha an dàta teacsa air a sgaradh gu aonadan nas lugha, ris an canar tokens, a dh’ fhaodadh a bhith eadar faclan gu seantansan. Mar eisimpleir, tha an aithris “Bha Barack Obama na cheann-suidhe air na SA” air a sgaradh ann an comharran mar “Barack”, “Obama”, “bha”, “the”, “ceann-suidhe”, “de”, “the”, agus “ Na Stàitean Aonaichte”.

  • Dearbhadh eintiteas

    A’ cleachdadh co-chruinneachadh de stiùiridhean cànain agus dòighean-obrach staitistigeil, thathas a’ toirt aire do bhuidhnean ainmichte a dh’fhaodadh a bhith ann. Tha e deatamach aig an ìre seo aithneachadh pàtrain leithid calpachadh ann an ainmean (“Barack Obama”) no cruthan sònraichte (leithid cinn-latha).

  • Seòrsachadh eintiteas

    Às deidh lorg, tha buidhnean air an seòrsachadh ann an roinnean ro-mhìnichte leithid “Duine”, “Buidheann”, no “Suidheachadh”. Bidh modalan ionnsachaidh inneal, air àrach air stòran-dàta le bileagan, gu tric a’ stiùireadh an t-seòrsachaidh seo. An seo, tha “Barack Obama” air a chomharrachadh mar “Duine” agus “USA” mar “Suidheachadh”.

  • Measadh Co-theacsail

    Tha comas siostaman NER gu tric air a mheudachadh le bhith a’ measadh a’ cho-theacsa mun cuairt. Mar eisimpleir, anns an abairt “Chunnaic Washington tachartas eachdraidheil”, tha an co-theacsa a’ cuideachadh le bhith ag aithneachadh “Washington” mar àite seach ainm neach.

  • Ùrachadh Iar-luachadh

    Às deidh an comharrachadh agus an seòrsachadh tùsail, is dòcha gun lean ùrachadh às deidh measadh gus na toraidhean a neartachadh. Dh’ fhaodadh an ìre seo dèiligeadh ri mì-chinnt, buidhnean ioma-chomharran a cheangal, no bunaitean eòlais a chleachdadh gus dàta an eintiteas a mheudachadh.

Tha an dòigh-obrach mhionaideach seo chan ann a-mhàin a’ mìneachadh cridhe NER ach cuideachd a’ dèanamh an fheum as fheàrr den t-susbaint airson einnseanan luirg, ag àrdachadh faicsinneachd a’ phròiseas toinnte a tha NER a’ gabhail a-steach.

Buannachdan & Dùbhlain NER?

buannachdan:

  1. Earrann Fiosrachaidh: Bidh NER a’ comharrachadh prìomh dhàta, a’ cuideachadh le lorg fiosrachaidh.
  2. Buidheann Susbaint: Bidh e a 'cuideachadh le bhith a' seòrsachadh susbaint, feumail airson stòran-dàta agus einnseanan luirg.
  3. Eòlas cleachdaiche leasaichte: Bidh NER ag ùrachadh toraidhean sgrùdaidh agus a’ pearsanachadh mholaidhean.
  4. Mion-sgrùdadh lèirsinneach: Bidh e a’ comasachadh mion-sgrùdadh faireachdainn agus lorg gluasadan.
  5. Sruth-obrach fèin-ghluasadach: Bidh NER a 'brosnachadh fèin-ghluasad, a' sàbhaladh ùine agus goireasan.

Cuingeachaidhean/dùbhlain:

  1. Fuasgladh Ambiguity: A’ strì le buidhnean eadar-dhealaichte den aon seòrsa.
  2. Atharrachadh Sònraichte Domain: Dian ghoireasan thar raointean eadar-mheasgte.
  3. An eisimeil Cànain: Tha èifeachdas ag atharrachadh a rèir chànanan.
  4. gainnead dàta air a chomharrachadh: Feum air stòran-dàta le bileagan mòra airson trèanadh.
  5. A’ làimhseachadh dàta neo-structaraichte: Tha feum air dòighean adhartach.
  6. Tomhas Coileanaidh: Tha measadh ceart iom-fhillte.
  7. Giullachd Fìor-ùine: Tha e dùbhlanach astar cothromachaidh le mionaideachd.

sòisealta Sgaoil

Faodaidh tu cuideachd Like