首頁 > 學院 > 常見問題 > 正文

數據庫的數據挖掘概述(二)

2019-09-08 23:34:20
字體:
來源:轉載
供稿:網友
數據挖掘工具是怎樣準確地告訴你那些隱藏在數據庫深處的重要信息的呢?它們又是如何作出預測的?答案就是建模。建模實際上就是在你知道結果的情況下建立起一種模型,并且把這種模型應用到你所不知道的那種情況中。比如說,如果你想要在大海上去尋找一艘古老的西班牙沉船,也許你首先想到的就是去找找過去發現這些寶藏的時間和地點有哪些。那么,經過調查你發現這些沉船大部分都是在百慕大海區被發現,并且那個海區有著某種特征的洋流,以及那個時代的航線也有一定的特征可尋。在這眾多的類似特征中,你將它們抽象并概括為一個普適的模型。利用這個模型,你就很有希望在具有大量相同特征的另外一個地點發現一件不為人知的寶藏。

   當然,在數據挖掘技術甚至計算機出現以前,這種建模抽象的方法就已經廣泛地被人們所使用。在計算機中的建模和以前的建模方法并無很大不同,主要的差異在于計算機能處理的信息量比起以前來更加龐大。計算機中能夠存儲已知了結果的大量不同情況,然后由數據挖掘工具從這些大量的信息里面披沙揀金,將能夠產生模型的信息提取出來。一當模型建立好了之后,就可以應用在那些情形相似但結果尚未知的判斷中了。比如,現在假設你是一個電信公司的營銷主任,公司想發展一些新的長途電話用戶,那么你是不是會漫無目的地到街上去散發廣告呢?――就象漫無目的地在海上去尋寶一樣。其實,比起漫無目的地去進行宣傳來,利用你以前的商業經驗來有目的地去拉攏客戶會產生高得多的效率。

   作為一個營銷主任,你對客戶的很多信息都可以了解得一清二楚:年齡、性別、信用記錄以及長途電話使用狀況。從好的一方面來看,掌握了這些客戶的信息其實就是掌握了很多潛在的用戶的同樣的信息。問題在于你還不一定了解他們的長途電話使用情況(因為他們的長途電話也許是通過的另一個電信公司)?,F在你的主要精力就集中在用戶中誰有比較多的長途電話上。通過下面這個表格,我們可以從數據庫里面抽象某些變量,建立起一個可以對此進行分類營銷的模型。
  客戶 潛力
一般信息
(e.g. demographic data) 已知 已知
私有信息
(e.g. customer transactions) 已知 待定

表二、數據挖掘應用于分類營銷

   根據我們創建的從一般信息到私有信息的計算模型,我們可以得出表二右下方表格中的信息。比如,一個電信公司的簡化模型可以是:年薪6萬美圓以上的98%的客戶,每個月長話費80美圓以上。根據這個模型,我們就能應用這些數據來推斷出公司現在尚不能明確的私有信息,這樣,新客戶群體就可以大體確定出來了。小型市場的試銷數據對于這樣的模型來說顯得極為有用。因為小范圍內試銷數據的挖掘,能夠為全部市場的分類銷售打下一個良好的基礎。表三則描述了另外一樣數據挖掘的普遍應用:預測。
  過去 現在 將來
靜態信息和當前計劃 已知 已知 已知
動態信息 已知 已知 待定

表三、數據挖掘應用于預測

數據挖掘的體系結構

   現有很多數據挖掘工具是獨立于數據倉庫以外的,它們需要獨立地輸入輸出數據,以及進行相對獨立的數據分析。為了最大限度地發揮數據挖掘工具的潛力,它們必須象很多商業分析軟件一樣,緊密地和數據倉庫集成起來。這樣,在人們對參數和分析深度進行變化的時候,高集成度就能大大地簡化數據挖掘過程。下圖顯示了一個大型數據庫中的高級分析過程。




集成后的數據挖掘體系

   應用數據挖掘技術,較為理想的起點就是從一個數據倉庫開始,這個數據倉庫里面應保存著所有客戶的合同信息,并且還應有相應的市場競爭對手的相關數據。這樣的數據庫可以是各種市場上的數據庫:Sybase、Oracle、Redbrick、和其他等等,并且可以針對其中的數據進行速度上和靈活性上的優化。

   聯機分析系統OLAP服務器可以使一個十分復雜的最終用戶商業模型應用于數據倉庫中。數據庫的多維結構可以讓用戶從不同角度,――比如產品分類,地域分類,或者其他關鍵角度――來分析和觀察他們的生意運營狀況。數據挖掘服務器在這種情況下必須和聯機分析服務器,以及數據倉庫緊密地集成起來,這樣就可以直接跟蹤數據和并輔助用戶快速作出商業決策,并且用戶還可以在更新數據的時候不斷發現更好的行為模式,并將其運用于未來的決策當中。

   數據挖掘系統的出現代表著常規決策支持系統的基礎結構的轉變。不象查詢和報表語言僅僅是將數據查詢結果反饋給最終用戶那樣,數據挖掘高級分析服務器把用戶的商業模型直接應用于其數據倉庫之上,并且反饋給用戶一個相關信息的分析結果。這個結果是一個經過分析和抽象的動態視圖層,通常會根據用戶的不同需求而變化?;谶@個視圖,各種報表工具和可視化工具就可以將分析結果展現在用戶面前,以幫助用戶計劃將采取怎樣的行動。

產生利潤的工具

   有很多公司都成功地安裝了數據挖掘工具。早先采用了這種技術的公司大部分都是信息密集型公司,比如金融服務和郵件營銷系統,但是現在這種技術已經準備好應用于各個公司中,只要公司具有大型數據庫,并且有強烈的通過軟件技術改善公司管理的愿望。但是采用數據挖掘技術,公司必須兩個關鍵的因素,一個就是大型的,集成化的數據庫;另一個就是定義完善的商業處理程序,這樣數據挖掘才好緊密地應用于公司數據之上。

   采用數據挖掘技術的一些成功應用,例如一個藥品公司,通過對它最近的營銷強度和銷售結果的分析,來決定哪一種營銷活動在最近幾個月內對高附加值的醫生群體影響最大,這樣的分析建立在競爭對手的銷售活動信息和當地健康狀況的數據系統之上。然后這個藥品公司可以通過其辦公網絡,將分析結果傳達到各地的銷售代表處,銷售代表們則可以根據公司傳遞的關鍵信息來作出相應的銷售抉擇,這樣,在快速變化的、動態的市場上,銷售代表們都可以根據各種特殊情況的分析作出最優的選擇。

結語
   全面集成了客戶、供應者以及市場信息的大型數據倉庫導致公司內的信息呈爆炸性增長,企業在市場競爭中,需要及時而準確地對這些信息作復雜的分析。為了更加及時地,更加準確地作出利于企業的抉擇,建立在關系數據庫和聯機分析技術上的數據挖掘工具為我們帶來了一個新的轉機。目前,數據挖掘工具正以前所未有的速度發展,并且擴大著用戶群體,在未來越加激烈的市場競爭中,擁有數據挖掘技術必將比別人獲得更快速的反應,贏得更多的商業機會。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
久久re6热在线播放