Uchimbaji Data dhidi ya OLAP
Uchimbaji data na OLAP ni mbili kati ya teknolojia za kawaida za Upelelezi wa Biashara (BI). Ujuzi wa biashara unarejelea mbinu za kompyuta za kutambua na kutoa taarifa muhimu kutoka kwa data ya biashara. Uchimbaji data ni uwanja wa sayansi ya kompyuta ambao, hujishughulisha na kutoa mifumo ya kuvutia kutoka kwa seti kubwa za data. Inachanganya mbinu nyingi kutoka kwa akili ya bandia, takwimu na usimamizi wa hifadhidata. OLAP (uchakataji wa uchanganuzi mtandaoni) kama jina linavyopendekeza ni mkusanyo wa njia za kuuliza hifadhidata zenye sura nyingi.
Uchimbaji wa data pia hujulikana kama Ugunduzi wa Maarifa katika data (KDD). Kama ilivyoelezwa hapo juu, ni uwanja wa sayansi ya kompyuta, ambayo inahusika na uchimbaji wa habari isiyojulikana na ya kuvutia kutoka kwa data ghafi. Kwa sababu ya ukuaji mkubwa wa data, hasa katika maeneo kama vile biashara, uchimbaji wa data umekuwa nyenzo muhimu sana ya kubadilisha utajiri huu mkubwa wa data hadi kwenye akili ya biashara, kwani uchimbaji wa mifumo kwa mikono umekuwa unaonekana kutowezekana katika miongo michache iliyopita. Kwa mfano, kwa sasa inatumika kwa matumizi mbalimbali kama vile uchanganuzi wa mitandao ya kijamii, kugundua ulaghai na uuzaji. Uchimbaji wa data kwa kawaida hushughulika na kazi nne zifuatazo: kuunganisha, uainishaji, kurudi nyuma, na ushirikiano. Kuunganisha ni kutambua vikundi sawa kutoka kwa data isiyo na muundo. Uainishaji ni kanuni za ujifunzaji zinazoweza kutumika kwa data mpya na kwa kawaida zitajumuisha hatua zifuatazo: usindikaji wa awali wa data, uundaji wa miundo, ujifunzaji/uteuzi wa vipengele na tathmini/uthibitishaji. Regression ni kupata chaguo za kukokotoa zilizo na hitilafu ndogo kwa data ya mfano. Na ushirika unatafuta uhusiano kati ya anuwai. Uchimbaji data kwa kawaida hutumiwa kujibu maswali kama vile ni bidhaa zipi kuu ambazo zinaweza kusaidia kupata faida kubwa mwaka ujao katika Wal-Mart.
OLAP ni aina ya mifumo, ambayo hutoa majibu kwa maswali ya pande nyingi. Kwa kawaida OLAP hutumiwa kwa uuzaji, bajeti, utabiri na matumizi sawa. Ni wazi kwamba hifadhidata zinazotumiwa kwa OLAP zimesanidiwa kwa hoja ngumu na za dharula kwa kuzingatia utendakazi wa haraka. Kwa kawaida matrix hutumiwa kuonyesha matokeo ya OLAP. Safu na safu wima huundwa na vipimo vya hoja. Mara nyingi hutumia mbinu za kujumlisha kwenye jedwali nyingi ili kupata muhtasari. Kwa mfano, inaweza kutumika kujua kuhusu mauzo ya mwaka huu katika Wal-Mart ikilinganishwa na mwaka jana? Je, ni utabiri gani juu ya mauzo katika robo ijayo? Je, tunaweza kusema nini kuhusu mtindo kwa kuangalia mabadiliko ya asilimia?
Ingawa ni dhahiri kuwa uchimbaji wa data na OLAP ni sawa kwa sababu zinafanya kazi kwenye data ili kupata akili, tofauti kuu inatokana na jinsi zinavyofanya kazi kwenye data. Zana za OLAP hutoa uchanganuzi wa data wa pande nyingi na hutoa muhtasari wa data lakini kwa kutofautisha, uchimbaji wa data huzingatia uwiano, ruwaza na athari katika seti ya data. Hayo ni makubaliano ya OLAP na ujumlishaji, ambayo yanatokana na utendakazi wa data kupitia "nyongeza" lakini uchimbaji wa data unalingana na "mgawanyiko". Tofauti nyingine kubwa ni kwamba ingawa data ya kielelezo cha zana za uchimbaji madini na kurudisha sheria zinazoweza kutekelezeka, OLAP itafanya mbinu za ulinganishi na utofautishaji kulingana na mwelekeo wa biashara kwa wakati halisi.