簡述資料倉儲與關聯式資料庫的區別與聯絡

2021-10-05 02:23:18 字數 5421 閱讀 6789

1樓:路堯家的顧小言

區別:1、資料庫是面向事務的設計,資料倉儲是面向主題設計的。

4、資料庫設計是儘量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。

5、資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。

聯絡:資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,資料倉儲的出現,並不是要取代資料庫。目前,大部分資料倉儲還是用關聯式資料庫管理系統來管理的。

可以說,資料庫、資料倉儲相輔相成、各有千秋。

2樓:派可資料

首先我們來了解資料倉儲和資料庫分別是什麼:

1、資料庫:是一種邏輯概念,用來存放資料的倉庫,通過資料庫軟體來實現。資料庫由很多表組成,表是二維的,一張表裡面有很多欄位。

欄位一字排開,對資料就一行一行的寫入表中。資料庫的表,在於能夠用二維表現多維的關係。如:

oracle、db2、mysql、sybase、mssql server等。

2、資料倉儲:是資料庫概念的升級。從邏輯上理解,資料庫和資料倉儲沒有區別,都是通過資料庫軟體實現存放資料的地方,只不過從資料量來說,資料倉儲要比資料庫更龐大德多。

資料倉儲主要用於資料探勘和資料分析,輔助領導做決策;

區別主要總結為以下幾點:

1.資料庫只存放在當前值,資料倉儲存放歷史值;

2.資料庫內資料是動態變化的,只要有業務發生,資料就會被更新,而資料倉儲則是靜態的歷史資料,只能定期新增、重新整理;

3.資料庫中的資料結構比較複雜,有各種結構以適合業務處理系統的需要,而資料倉儲中的資料結構則相對簡單;

4.資料庫中資料訪問頻率較高,但訪問量較少,而資料倉儲的訪問頻率低但訪問量卻很高;

5.資料庫中資料的目標是面向業務處理人員的,為業務處理人員提供資訊處理的支援,而資料倉儲則是面向高層管理人員的,為其提供決策支援;

6.資料庫在訪問資料時要求響應速度快,其響應時間一般在幾秒內,而資料倉儲的響應時間則可長達數幾小時

資料倉儲與資料探勘的關係,區別與聯絡(概括一點)

3樓:晴好樂園

區別:1、目的不同:

資料倉儲是為了支援複雜的分析和決策,資料探勘是為了在海量的資料裡面發掘出**性的、分析性的資訊,多用來**。

2、階段不同:

資料倉儲是資料探勘的先期步驟,通過資料倉儲的構建,提高了資料探勘的效率和能力,保證了資料探勘中的資料的寬廣性和完整性。

3、處理方式不同:

資料探勘是基於資料倉儲和多維資料庫中的資料,找到資料的潛在模式進行**,它可以對資料進行復雜處理。大多數情況下,資料探勘是讓資料從資料倉儲到資料探勘資料庫中。

聯絡:1、資料倉儲是為了資料探勘做預準備,資料探勘可建立在資料倉儲之上。

2、最終目的都為了提升企業的資訊化競爭能力。

4樓:starlet小星

1、資料探勘就是從大量資料中提取資料的過程。

2、資料倉儲是彙集所有相關資料的一個過程。

3、資料探勘和資料倉儲都是商業智慧工具集合。

4、資料探勘是特定的資料收集。

5、資料倉儲是一個工具來節省時間和提高效率,將資料從不同的位置不同區域組織在一起。

6、資料倉儲三層,即分段、整合和訪問。

5樓:匿名使用者

資料倉儲是一種解決方案,是對原始的運算元據進行各種處理並轉換成有用資訊的處理過程,使用者可以通過分析這些資訊從而作出策略性的決策。因此,在很多場合,我們也把資料倉儲系統稱為決策支援系統。

而資料探勘:是建立在資料倉儲之上,分析資料倉儲的。

資料倉儲系統的查詢大都非常複雜,主要有兩種:一種以報表為主,從資料庫中產生各種形式的業務報表。這種查詢是預先規劃好的(pre-defined query);另一種則是隨機的、動態的查詢(ad-hoc query),對查詢的結果也是不能預料的。

資料倉儲中的查詢由於其複雜性,會經常使用多表的聯接、累計、分類、排序等操作,這些大都要對整個表進行搜尋。每次查詢返回的資料量一般很大,經常需要根據上次查詢的結果進行進一步的搜尋,這個過程常稱為資料探勘。

6樓:匿名使用者

倉庫是為了支援複雜的分析和決策,挖掘是為了在海量的資料裡面發掘出**性的、分析性的資訊,多用來**,挖掘可建立在資料倉儲之上,兩者不是一個為了另一個的關係,而是殊途同歸之意,都為了提升企業的資訊化競爭能力。

7樓:蔚藍の蔚藍

資料倉儲是為了資料探勘做預準備,並且只是其中一種資料**的渠道。

資料庫與資料倉儲的區別

8樓:向日葵

「與時間相關」:資料庫儲存資訊的時候,並不強調一定有時間資訊。資料倉儲則不同,出於決策的需要,資料倉儲中的資料都要標明時間屬性。

決策中,時間屬性很重要。同樣都是累計購買過九車產品的顧客,一位是最近三個月購買九車,一位是最近一年從未買過,這對於決策者意義是不同的。

「不可修改」:資料倉儲中的資料並不是最新的,而是**於其它資料來源。資料倉儲反映的是歷史資訊,並不是很多資料庫處理的那種日常事務資料(有的資料庫例如電信計費資料庫甚至處理實時資訊)。

因此,資料倉儲中的資料是極少或根本不修改的;當然,向資料倉儲新增資料是允許的。

資料倉儲的出現,並不是要取代資料庫。資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它決不是所謂的「大型資料庫」。

目前,大部分資料倉儲還是用關聯式資料庫管理系統來管理的。可以說,資料庫、資料倉儲相輔相成、各有千秋。

9樓:小想的小世界

1. 主要區別在於資料結構,資料庫中的建模一般遵循三正規化,而資料倉儲的建模有特定的方式,一般採用維度建模(你可以參考ralph kimball、bill inmon、還有一種叫dv模型的作者忘記叫啥了),使用這些建模方式的原因是便於olap建立,增加統計查詢較率等。

2. 資料倉儲中資料通常**於多個不同的業務系統資料庫(儲存多年資料),資料量較大,一般做為企業資料中心用。

4. 資料庫設計是儘量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。

5. 資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的id。

6. 資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它決不是所謂的「大型資料庫」。

資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。

為需要業務智慧的企業,提供指導業務流程改進、監視時間、成本、質量以及控制。

資料庫(database)是按照資料結構來組織、儲存和管理資料的倉庫,它產生於距今六十多年前,隨著資訊科技和市場的發展,特別是二十世紀九十年代以後,資料管理不再僅僅是儲存和管理資料,而轉變成使用者所需要的各種資料管理的方式。資料庫有很多種型別,從最簡單的儲存有各種資料的**到能夠進行海量資料儲存的大型資料庫系統都在各個方面得到了廣泛的應用。

10樓:風中微子都

資料庫:傳統的關係型資料庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。

資料倉儲:資料倉儲系統的主要應用主要是olap(on-line analytical processing),支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢結果。

基本每家電商公司都會經歷,從只需要業務資料庫到要資料倉儲的階段。

電商早期啟動非常容易,入行門檻低。找個外包團隊,做了一個可以下單的網頁前端 + 幾臺伺服器 + 一個mysql,就能開門迎客了。這好比手工作坊時期。

第二階段,流量來了,客戶和訂單都多起來了,普通查詢已經有壓力了,這個時候就需要升級架構變成多臺伺服器和多個業務資料庫(量大+分庫分表),這個階段的業務數字和指標還可以勉強從業務資料庫裡查詢。初步進入工業化。

第三個階段,一般需要 3-5 年左右的時間,隨著業務指數級的增長,資料量的會陡增,公司角色也開始多了起來,開始有了 ceo、cmo、cio,大家需要面臨的問題越來越復「上個月的 pv、uv 是多少」,逐漸演化到非常精細化和具體的使用者的叢集分析,特定使用者在某種使用場景中。

那麼在這裡前一種業務資料庫(讀寫都優化)的是業務性資料庫,後一種是分析性資料庫,即資料倉儲。

最後總結一下:

資料庫 比較流行的有:mysql, oracle, sqlserver等

資料倉儲 比較流行的有:aws redshift, greenplum, hive等。

11樓:匿名使用者

首先在一家銀行辦理多張信用卡的話,其實除非你是和家人一起用的,也就是圖方便家人吧,要不然沒什麼用,因為幾張卡是共享信用的,也就是說假如你的信用是1w的話,幾張卡辦下來合計信用還是一萬的。

關於辦理信用卡的問題是這樣的,本來銀行辦理信用卡是需要當事人親自辦理的,而且需要收入證明等。但是因為銀行為了增加發卡量,稽核的不是很嚴格。 再加上業務人員為了拿到提成,就會竭盡所能幫你辦成功。

所以一般在很多城市,身份證+名片 完全可以辦很多銀行的信用卡。但估計信用額度不會太高。

你現在的住址與你身份證上的不一樣絕對不影響你辦信用卡的。可以說沒任何關係。

12樓:電腦科學研究者賢斌

《軟體系統分析師》第9章 資料庫與資料倉儲。系統分析師,英文system analyst,簡稱sa。

13樓:派可資料

首先我們來了解資料倉儲和資料庫分別是什麼:

1、資料庫:是一種邏輯概念,用來存放資料的倉庫,通過資料庫軟體來實現。資料庫由很多表組成,表是二維的,一張表裡面有很多欄位。

欄位一字排開,對資料就一行一行的寫入表中。資料庫的表,在於能夠用二維表現多維的關係。如:

oracle、db2、mysql、sybase、mssql server等。

2、資料倉儲:是資料庫概念的升級。從邏輯上理解,資料庫和資料倉儲沒有區別,都是通過資料庫軟體實現存放資料的地方,只不過從資料量來說,資料倉儲要比資料庫更龐大德多。

資料倉儲主要用於資料探勘和資料分析,輔助領導做決策;

區別主要總結為以下幾點:

1.資料庫只存放在當前值,資料倉儲存放歷史值;

2.資料庫內資料是動態變化的,只要有業務發生,資料就會被更新,而資料倉儲則是靜態的歷史資料,只能定期新增、重新整理;

3.資料庫中的資料結構比較複雜,有各種結構以適合業務處理系統的需要,而資料倉儲中的資料結構則相對簡單;

4.資料庫中資料訪問頻率較高,但訪問量較少,而資料倉儲的訪問頻率低但訪問量卻很高;

5.資料庫中資料的目標是面向業務處理人員的,為業務處理人員提供資訊處理的支援,而資料倉儲則是面向高層管理人員的,為其提供決策支援;

6.資料庫在訪問資料時要求響應速度快,其響應時間一般在幾秒內,而資料倉儲的響應時間則可長達數幾小時

簡述資料庫資料倉儲和資料探勘三者之間的關係

資料倉儲是要整合多種資料來源,比如個人財務記錄和購物記錄,比如企業的原料 生產 銷售的異構資料庫。資料庫一般是單一結構的,沒辦法整合異構源去做一個統一介面,所以在資料分析需求達到巨集觀規模後才弄出這麼個概念來。所謂面向事務和麵向主題就是這個意思。事務是資料記錄查詢的單一任務,主題是資料分析目標的相關...

資料庫是關係的性質簡述就可以,資料庫是關係的性質簡述就可以

1對11對0.1對1.常用的。當然,你排列組合,還有很多方式。簡述資料庫關係的性質?1對11對0.1對1.常用的。當然,你排列組合,還有很多方式。關係中不允許出現相同的元組 關係中元組的順序 即行序 可任意 關係中屬性的順序可任意 同一屬性名下的各個屬性值必須來自同一個域,必須是同一型別的資料 關係...

資料庫多對多關係,高手進多對多關聯式資料庫必須有三張表嗎??

1.學生一個表。id,name,num,score。學生id,名字,學號,和得分情況.主要就是這個score。因為一個學生要記錄他一個學期所有課時的表現。又不可能為每個課時單獨加欄位,所以建議採取字串記錄的方式 4,1 5,0 6,1 7,1 8,1 9,1 10,0 11,1 12,1 13,1 ...