• <ul id="mayc0"></ul>
    <ul id="mayc0"><center id="mayc0"></center></ul>
    <strike id="mayc0"><input id="mayc0"></input></strike>
    <ul id="mayc0"></ul>
  • 億恩科技有限公司旗下門戶資訊平臺!
    服務器租用 4元建網站

    人工智能、大數據與云計算之間的牽連

    如今,面對快速發展的網絡科技水平,互聯網已逐漸步入人工智能與大數據管理時代,而云計算作為一種高效的技術也提供了強大的技術支持。

    如今,面對快速發展的網絡科技水平,互聯網已逐漸步入人工智能與大數據管理時代,而云計算作為一種高效的技術也提供了強大的技術支持。

    關于Cloudera和Hadoop的關系,想必大家已經了解和知道了,作為Hadoop系統的首創者組織,人們對Cloudera在數據領域的積累已經非常了解,而當云計算和人工智能成為2017年話題的時候,Cloudera大中華區總經理及公司副總裁凌琦也分享了他的理解和Cloudera在做的事情。

    機器學習與人工智能

    事實上,Cloudera作為軟件平臺廠商,其業務主要是針對大數據、非結構化數據的管理,對于機器學習和人工智能的支持。這樣的一個平臺,需要跟很多的解決方案合作伙伴一起合作,到現在為止,該公司在全國已經擁有了超過200家的合作伙伴。經歷了兩年的發展,Cloudera也在北京、上海、廣深,都有團隊,也建立了針對客戶的支持體系。

    而對于機器學習和人工智能,在凌琦看來,對Cloudera而言,人工智能并不是一個新的話題,“我在讀研究生的時候其中一個研究方向就是人工智能,那時候的人工智能更多是基于規則的系統,今天的人工智能和過去有所不同,主要是:第一,計算能力提升了;第二,也是更重要的一點,是有大數據的支持。通過機器學習的模型,投入大量的數據進行培訓和訓練,最后形成一個在實際的應用環境當中可以使用的模型。”

    機器學習時代跟過去時代的不同。第一是計算成本的降低;第二是整個數據量的增加。今天的人工智能需要大量的數據,所以在數據的準備、獲取、處理以及治理方面,數據的生命周期需要很好地進行管理。有了這些數據之后,數據科學家運用各種各樣的分析和人工智能的模型進行機器學習的訓練和模型的驗證,這是一個循環的過程、不斷在改進的過程。最后,把它應用到生產環境當中去。

    應用到生產環境當中,也包括對生產環境的實時管理和運維,以及通過對生產環境當中所取得的數據的離線分析,再一次豐富數據、改變它的模型。看整個過程能夠發現,如果僅僅談到人工智能,其實很大程度上是在于機器學習和分析。

    從整個流程看,企業需要很大程度上在數據準備以及最后的運營管理部分投入。一個能夠支持機器學習和人工智能的好的平臺,必須要滿足這些功能:各種環境下的支持,包括公有云和私有云的支持;以及良好的擴展性,即有很好的彈性;成本、以及安全性和運維的支持。從這個角度看,Cloudera的數據管理平臺,實際上為人工智能提供了一個很好的運營環境。

    AI技術水平的突破

    正如凌琦所言,所有的人工智能、機器學習需要的數據,包括管理數據和清理數據以及長期增強這個數據平臺,是能夠做的事情。那么,Cloudera在AI領域里有哪些規劃?在哪些方面取得了突破性進展?

    凌琦回答記者:Cloudera的業務包括三塊:一是以開源為基礎的軟件平臺,我們稱為CDH;第二,專業服務;第三,培訓業務。

    實際上,軟件業務占Cloudera業務收入的80%甚至更多,是我們的核心部分。今天在Hadoop上的機器學習的平臺,需要管理更大的數據,能夠在一個完整的平臺上使機器學習充分利用所有的數據,而不是一個分散的豎井式的數據對象。可以看到,我們現在整個平臺所能夠管理的規模越來越大,安全性越來越好。

    第二,Cloudera在機器學習上,大量使用新的分布式計算引擎Spark。Spark是現在在機器學習過程當中一個非常重要的計算引擎,當然也還有其他的一些計算引擎。Spark在Hadoop領域里面是最重要的機器學習引擎,在這個部分,Cloudera現在是最大的貢獻者,同時也是最早把Spark引入到整個Hadoop平臺當中,進行全面支持的廠商.

    第三,今天的很多對機器學習進行研究、應用的人當中,除了傳統的數據分析師之外,還有很多數據科學家。數據分析師過去更多的是使用SQL這些描述性的語言,它能夠進行一些分析,但是很多的數據科學家使用一些所他們熟悉的編程語言,比如R、Python、Scala,還有一些傳統的數據科學家使用數學物理的程序庫。

    那么對于使這些數據科學家受制于系統的能力、不能使用的環境,如何使他們能自由地選擇熟悉的編程語言或者程序庫?Cloudera開發了“數據科學工作臺”(Data Science Work Bench)。在兩三個月之前發布了,它可以在一個電腦上能夠充分使數據科學家大量地直接使用Hadoop里面的數據,而不是像過去只取一個子集。用戶可以直接使用Hadoop里面的數據。同時它又是運行在虛擬的Docker的沙箱當中,非常安全、不會破壞實際的運營環境,而且可以支持很多用戶可以同時使用。每個用戶都能按照自己的選擇,想用R就用R,想用Python就用Python,那個工具目前已經發布,受到了很多用戶的歡迎。

    河南億恩科技股份有限公司(www.vbseamall.com)始創于2000年,專注服務器托管租用,是國家工信部認定的綜合電信服務運營商。億恩為近五十萬的用戶提供服務器托管、服務器租用、機柜租用、云服務器、網站建設、網站托管等網絡基礎服務,另有網總管、名片俠網絡推廣服務,使得客戶不斷的獲得更大的收益。
    服務器/云主機 24小時售后服務電話:0371-60135900
    虛擬主機/智能建站 24小時售后服務電話:0371-55621053
    網絡版權侵權舉報電話:0371-60135995
    服務熱線:0371-60135900

    0
    0
    分享到:責任編輯:黃利敏

    相關推介

    共有:0條評論網友評論:

    驗證碼 看不清換一張 換一張

    親,還沒評論呢!速度搶沙發吧!