• <ul id="mayc0"></ul>
    <ul id="mayc0"><center id="mayc0"></center></ul>
    <strike id="mayc0"><input id="mayc0"></input></strike>
    <ul id="mayc0"></ul>
  • 始創于2000年 股票代碼:831685
    咨詢熱線:0371-60135900 注冊有禮 登錄
    • 掛牌上市企業
    • 60秒人工響應
    • 99.99%連通率
    • 7*24h人工
    • 故障100倍補償
    您的位置: 網站首頁 > 幫助中心>文章內容

    云計算與大數據環境下的數據集成

    發布時間:  2012/9/5 18:28:59

    云計算與大數據環境下的數據集成

    字號: 2012-09-05 09:48 來源:CIO時代網 我要評論(0)

     

    隨著企業業務的增長,伴隨企業各類應用系統逐步啟用,結果導致數據量幾何級數的增長,傳統的整合數據的方式正在受到挑戰,于此同時,云計算及網上應用在企業內部產生各類結構化、非結構化數據,這些數據所蘊含的信息(尤其是非結構化數據)是傳統分析工具無法捕捉的。本文主要闡述在企業信息化過程中,數據整合的能力建設所需要考慮的一些關鍵問題。

    從根本來說,企業信息化的目的是為了降低溝通成本、提高工作效率、增強科學決策能力,從手段上是將分散、無序、無時效的數據變成有序、可分享、有時效、可追溯的數據,前者數據過渡到后者數據,就是無信息(或不可信信息)變成可信信息的過程。數據蘊含的信息有兩類:1、交易信息,即某一條/或幾條數據本身所包含的信息;2、統計信息,即數據集合所蘊含的規律性信息。下圖表現了交易數據與統計數據的關系和傳統架構方法,即ETL模型。

    傳統整合基本上是基于ETL模式,即從企業內部的信息系統中抽取(Extract),然后根據預先定義的方式轉換(Transform),最后載入到企業的數據倉庫(Load),大部分企業的ETL程序定義在每天晚上運行,這類的方法有以下問題:

    1、數據倉庫的數據不是實時的信息

    2、如果內部信息系統數據量很大,ETL處理時間不可能按時完成。

    3、數據倉庫的信息無法快速反饋數據到基層處理商務的人員,圖示1中紅色打叉的部分。

    4、ERP本身在多年數據積累后,事務處理與訂單查詢都會變慢。

    5、無法處理大數據,ETL的整個數據處理過程都是建立在已知/預定義的模型之上的,也就是ETL無法發掘到數據集蘊含的未知規律。

    a)結構化大數據,除上述第2點外,針對大數據的深度挖據分析能力(非簡單根據預先設計的模型做數據轉換),傳統的系統架構中是無法完成的。

    b)非結構化、半結構化大數據。非架構化數據從本質上來講,是企業無法預先定義規則的數據類型,據IDC的一項調查報告中指出:企業中80%的數據都是非結構化數據,這些數據每年都按指數增長60%.傳統的方式是無法計算統計非結構化大數據包含的新類型統計信息。

    根據上述問題,企業信息系統的數據整合的目標需要滿足以下條件:

    1、提高數據的質量

    低質量的數據帶來的問題:

    1.1統計數據會有誤導,誤導的數據直接結果很可能是企業戰略決策錯誤。

    1.2基層人員工作效率低下。由于基層人員不信任數據,就會產生額外的工作去核對并驗證。由于數據不準確也會產生更多的操作性錯誤,如:發貨地址錯誤,貨款核對產生歧義等。這些都會帶來大量的額外工作,根據2/8原理,80%的額外工作都緣于20%的錯誤。

    1.3無法根據信息系統記錄做更多的分析統計,如6 Sigma類似的項目將無數據基礎,項目無法推進。

    2、數據安全:由于各類中間件的應用、云計算集成環境的廣泛普及,數據源需要提供更廣泛的數據輸出的能力,與此同時,數據保護能力需要更加完善,傳統在應用軟件層面的保護方式是無法滿足此類需求的。保護數據需要考慮:傳輸加密和身份認證。

    3、與“云計算”的集成能力:在云計算環境里,無論是基礎數據還是交易數據,將不僅限于某一種應用系統中使用,甚至數據很可能需要跨越公司的防火墻,與外部的云計算環境集成。

    4、大數據能力:舉個典型的例子,企業使用web日志、社交媒體(social media,如微博)數據分析大量客戶的偏好,同時使用企業與客戶已經成交的交易記錄,建立更好的預測模型,更直接有效的市場推廣或更好的客戶體驗。而上述的web日志和社交媒體的數據都是非結構化的大數據。

    5、高性能/滿足實時的要求:舉個典型的貿易公司為例,該公司需要根據客戶以往的信用記錄決定是否訂貨或發貨,如果沒有實時統計能力,此類的商業模型在執行起來會困難重重。越來越多的企業希望將部分的決策過程下放到執行層面的基層,基層的決策需要實時的統計結果、可追溯的決策結果。


    本文出自:億恩科技【www.vbseamall.com】

    服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線