Tofauti Kati ya Nguzo za Hierarkia na Sehemu

Tofauti Kati ya Nguzo za Hierarkia na Sehemu
Tofauti Kati ya Nguzo za Hierarkia na Sehemu

Video: Tofauti Kati ya Nguzo za Hierarkia na Sehemu

Video: Tofauti Kati ya Nguzo za Hierarkia na Sehemu
Video: Shangazwa na Top Ten Fedha Zenye Thamani Zaidi Duniani , zilizoshuka na Historia ya Fedha Duniani 2024, Novemba
Anonim

Hierarchical vs Partitional Clustering

Kuunganisha ni mbinu ya mashine ya kujifunza kwa ajili ya kuchanganua data na kugawanywa katika vikundi vya data sawa. Vikundi hivi au seti za data zinazofanana hujulikana kama makundi. Uchanganuzi wa nguzo huangalia algoriti za nguzo ambazo zinaweza kutambua vikundi kiotomatiki. Hierarkia na Partitional ni aina mbili kama hizo za algoriti za nguzo. Algorithms ya nguzo ya daraja hugawanya data kwa safu ya vikundi. Algorithms ya sehemu hugawanya data iliyowekwa katika sehemu zisizounganishwa.

Kundi la Hierarkia ni nini?

Algoriti za nguzo za kitabia hurudia mzunguko wa kuunganisha makundi madogo hadi makubwa zaidi au kugawanya makundi makubwa hadi madogo. Vyovyote vile, hutoa safu ya nguzo inayoitwa dendogram. Mkakati wa nguzo wa Agglomerative hutumia mkabala wa kutoka chini kwenda juu wa kuunganisha nguzo hadi kubwa zaidi, wakati mkakati wa nguzo wa kugawanya hutumia mbinu ya juu-chini ya kugawanyika hadi ndogo. Kwa kawaida, mbinu ya uchoyo hutumiwa katika kuamua ni nguzo zipi kubwa/ndogo zitatumika kwa kuunganisha/kugawanya. Umbali wa Euclidean, umbali wa Manhattan na ufanano wa kosine ni baadhi ya metriki zinazotumika sana za kufanana kwa data ya nambari. Kwa data isiyo ya nambari, vipimo kama vile umbali wa Hamming hutumiwa. Ni muhimu kutambua kwamba uchunguzi halisi (matukio) hauhitajiki kwa makundi ya hierarchical, kwa sababu tu matrix ya umbali ni ya kutosha. Dendogramu ni uwakilishi wa kuona wa makundi, ambayo inaonyesha uongozi kwa uwazi sana. Mtumiaji anaweza kupata nguzo tofauti kulingana na kiwango ambacho dendogramu imekatwa.

Kuunganisha kwa Sehemu ni nini?

Algoriti za mikusanyiko ya sehemu huzalisha sehemu mbalimbali na kisha kuzitathmini kwa kigezo fulani. Pia zinarejelewa kama zisizo za kiakili kwani kila mfano umewekwa katika mojawapo ya nguzo za k za kipekee. Kwa sababu seti moja tu ya vishada ndiyo matokeo ya algoriti ya kawaida ya nguzo kizigeu, mtumiaji anahitajika kuingiza nambari inayotakiwa ya vishada (kawaida huitwa k). Mojawapo ya algoriti za nguzo za sehemu zinazotumiwa sana ni algoriti ya nguzo ya k-njia. Mtumiaji anahitajika kutoa idadi ya vishada (k) kabla ya kuanza na algoriti kwanza itaanzisha vituo (au vipenyo) vya sehemu za k. Kwa kifupi, k-ina maana ya kujumuisha algoriti kisha huwapa washiriki kulingana na vituo vya sasa na kukadiria vituo kulingana na washiriki wa sasa. Hatua hizi mbili hurudiwa hadi utendaji kazi wa lengo fulani la mfanano wa ndani ya nguzo na utendakazi wa lengo la kutofautiana kati ya nguzo uboreshwe. Kwa hivyo, uanzishaji wa busara wa vituo ni jambo muhimu sana katika kupata matokeo ya ubora kutoka kwa algoriti za sehemu za nguzo.

Kuna tofauti gani kati ya Nguzo za Hierarkia na Sehemu?

Nguzo za Kidaraja na Sehemu zina tofauti muhimu katika muda wa uendeshaji, mawazo, vigezo vya ingizo na makundi ya matokeo. Kwa kawaida, nguzo za sehemu ni kasi zaidi kuliko nguzo za daraja. Nguzo za daraja zinahitaji tu kipimo cha mfanano, wakati nguzo za sehemu zinahitaji mawazo yenye nguvu kama vile idadi ya makundi na vituo vya awali. Mkusanyiko wa viwango vya juu hauhitaji vigezo vyovyote vya ingizo, ilhali algoriti za nguzo za sehemu zinahitaji idadi ya vikundi ili kuanza kufanya kazi. Mkusanyiko wa tabaka hurejesha mgawanyiko wenye maana zaidi na dhabiti wa nguzo lakini mkusanyiko wa sehemu husababisha nguzo k haswa. Algoriti za nguzo za kitabaka zinafaa zaidi kwa data ya kitengo mradi tu kipimo cha mfanano kinaweza kufafanuliwa ipasavyo.

Ilipendekeza: