前沿拓展:
olap
保質(zhì)期為三年,OLAPLEX,中文名:奧拿匹斯連鎖倍增科技,是一種美發(fā)產(chǎn)品。
文 | 溫正湖
關(guān)于數(shù)據(jù)倉(cāng)庫(kù),早期分享過(guò)不少基礎(chǔ)類文章,偶然間看到知乎上這篇關(guān)于OLAP的深度解讀,從技術(shù)發(fā)展,產(chǎn)品選型,執(zhí)行優(yōu)化等方面做了詳細(xì)的剖析,分享來(lái)給大家看看!
本文主要是想闡述下自己對(duì)數(shù)倉(cāng)和OLAP系統(tǒng)的理解,由于水平有限,難免有所錯(cuò)誤,非常歡迎大家看后能夠指出。
拓展知識(shí):
olap
簡(jiǎn)寫(xiě)為OLAP,隨著數(shù)據(jù)庫(kù)技術(shù)的發(fā)展和應(yīng)用,數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù)量從20世紀(jì)80年代的兆(M)字節(jié)及千兆(G)字節(jié)過(guò)渡到現(xiàn)在的兆兆(T)字節(jié)和千兆兆(P)字節(jié),同時(shí),用戶的查詢需求也越來(lái)越復(fù)雜,涉及的已不僅是查詢或**縱一張關(guān)系表中的一條或幾條記錄,而且要對(duì)多張表中千萬(wàn)條記錄的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析和信息綜合,關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)已不能全部滿足這一要求。在國(guó)外,不少軟件廠商采取了發(fā)展其前端產(chǎn)品來(lái)彌補(bǔ)關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)支持的不足,力圖統(tǒng)一分散的公共應(yīng)用邏輯,在短時(shí)間內(nèi)響應(yīng)非數(shù)據(jù)處理專業(yè)人員的復(fù)雜查詢要求。
給你推薦一款我知道的可以做OLAP的軟件,F(xiàn)ineBI,挺不錯(cuò)的。
olap
OLAP的目的性很明確,使用者知道自己想要的數(shù)據(jù)
數(shù)據(jù)挖掘的目的性難以明確,主要是為了從大量數(shù)據(jù)中獲取隱含其中的模式、規(guī)則等,但使用者實(shí)現(xiàn)是不知道存在這些模式和規(guī)則的
olap
OLAP是DM過(guò)程中的一部分
olap
OLAP與數(shù)據(jù)挖掘DM具有本質(zhì)區(qū)別
(1)功能不同
數(shù)據(jù)挖掘DM的功能在于知識(shí)發(fā)現(xiàn)KDD。如:數(shù)據(jù)挖掘DM中的“分類”包括:貝葉斯分類、粗糙集分類、決策樹(shù)分類等,是從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)規(guī)則,是“透過(guò)現(xiàn)象看本質(zhì)”;
而聯(lián)機(jī)分析OLAP的功能在于“統(tǒng)計(jì)”和統(tǒng)計(jì)結(jié)果的展示,是“現(xiàn)象”和“表象”,不能實(shí)現(xiàn)數(shù)據(jù)挖掘DM的知識(shí)發(fā)現(xiàn)KDD功能。
(2)數(shù)據(jù)組成不同
數(shù)據(jù)挖是從混沌的、具有巨大噪聲的數(shù)據(jù)中提煉知識(shí)規(guī)則;
而聯(lián)機(jī)分析OLAP只是從已經(jīng)規(guī)范化的、純凈的關(guān)系數(shù)據(jù)庫(kù)中組織數(shù)據(jù)。
(3)知識(shí)與數(shù)據(jù)的關(guān)系不同
數(shù)據(jù)挖掘DM是從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)KDD;
而聯(lián)機(jī)分析OLAP是利用人已知的知識(shí)來(lái)有意識(shí)地組織和使用數(shù)據(jù)。
(4)基本方法不同
數(shù)據(jù)挖掘的基礎(chǔ)是數(shù)學(xué)模型和算法;
而OLAP不需要數(shù)學(xué)模型和算法支持,只與數(shù)據(jù)倉(cāng)庫(kù)和OLAP自身知識(shí)相關(guān)。
本回答被網(wǎng)友采納
原創(chuàng)文章,作者:九賢生活小編,如若轉(zhuǎn)載,請(qǐng)注明出處:http://xiesong.cn/32983.html