您好!歡迎登錄 奈特原動力官網!

新聞資訊
有關大數據的6大誤區
2016-09-18 來源:http://www.528247.live 作者:奈特原動力官網 查看次數:15637次

你的公司是否仍然在努力理解大數據是什么,以及如何管理嗎?這里有6個關于大數據的誤區,行業專家將幫助你把真相從虛構的大數據領域中分離出來。

你的組織是否在考慮分析數據的最佳方式?以下是在你采用大數據分析之前,需要注意的有關大數據的6個誤區。

云計算的應用,更快的數據處理速度,以及從物聯網輸入大量的數據,這些意味著,企業現在正在收集前所未見的數據量?,F在大數據比以往任何時候都大。但是如何組織、處理和理解數據仍然是許多組織面臨的一個主要挑戰。

你的公司是否仍然在努力理解大數據是什么,以及如何管理嗎?這里有6個關于大數據的誤區,行業專家將幫助你把真相從虛構的大數據領域中分離出來。

1.大數據意味著“很多”數據

目前,大數據已經成為一個流行詞。但人們通常對它真正的含義還是不清楚。有些人將大數據簡單地認為是大量的數據。但是,這并不完全正確,它比這稍微復雜一些。大數據是指一個數據集,無論是結構(如數據表)或非結構化(如元數據從電子郵件)結合的數據,如社會媒體分析或物聯網數據,形成一個更大的故事。大數據故事說明組織很難用傳統的分析技術來捕獲發生的趨勢。

豐田研究院的數據研究總監吉姆?阿德勒表達了一個很好的觀點:“數據也有質量。這就像水一樣:玻璃容器中的水是非常易于管理。但是,如果混雜在洪水中,這將是壓倒性的災害?!彼f,“在數據分析系統中,工作在一臺機器的的數據將被沖走時,其數據規模將增長100或1000倍。所以,當然,原型雖小,但其架構卻很大?!?/span>

2.數據需要清潔

“最大的誤區就是你必須要有干凈的數據進行分析?!盉eyondCore公司首席執行官阿里吉特?森古普塔說,“沒有人有干凈的數據,必須將數據進行清理,否則分析是行不通的。這是一個瘋狂的想法。你要做的就是進行一個足夠好的分析。你要分析所有的數據,盡管這些數據是骯臟的,這只說明你有數據質量問題。我可以告訴你一些模式,盡管數據存在質量問題,但完全可以進行正常分析?,F在,你可以集中進行數據質量工作,只是提高數據可以得到稍微好一點的洞察力?!?/span>

InOutsource商業智能和分析總監梅根?布茨梅因對此表示贊同,“很多時候,企業就會將這些工作能拖就拖,因為他們認為數據是不干凈的,這是沒有必要的。部署的分析應用程序將可以找到數據的薄弱環節,”她說?!耙坏┻@些問題已經確定,清理計劃可以投入到位。然后,分析應用程序可以利用一種機制,加大清理力度,并監測進展情況?!?/span>

布茨梅因說?!耙坏┠惆堰@些數據整合在一起,你將在一個應用程序中賦予它生命的視覺,你可以看到這些匯集在一起的數據的關聯,你會很快看到你的資料不足?!彼f,“你可以看到數據的問題在于要提供一個清理數據的基準?!?/span>

3.等待,讓你的數據完美

你不應該等待清理你的數據,這里還有一個原因,森古普塔說,“在你完全清除數據之后,這可能需要三個月的時間,然而三個月后,這些數據已經陳舊過時了?!币虼?,這些信息將不再適用。

森古普塔表示,第一州際銀行的喬希?巴特曼在會議提出了一個重要觀點。喬希展示了他是如何運行分析,發現問題,分析變化,重新運行分析的。他說,“你看,我的分析時間只有大約四到五分鐘。所以,如果我可以運行分析,發現問題,解決問題,再重新進行分析,并在四、五分鐘后查看報告,改變如何處理分析的方法?!?/span>

森古普塔用編碼來比喻那些舊方式?!拔业囊磺卸际钦_的,然后我進行編碼。但現在,每個人進行編碼都不太靈活?!彼f?!澳銓懞贸绦蛑?,你必須要測試它,并查看如何能使它更好,那么等它變得更好之后。世界發生了變化,人們仍然采用的是舊的做事方法?!?/span>

4.數據湖

數據湖是持有大量的原始結構化和結構化數據的松散的存儲庫,經常在大數據的背景下提到。

唯一的問題是,盡管他們是如何經常被引用,但它們卻不存在,阿德勒說,“一個組織的數據不被倒入一個數據湖中。這是精心策劃的一個部門的數據庫。鼓勵集中使用專業知識。他們還提供了良好的數據治理和合規性所需的問責性和透明度?!?/span>

5.分析數據是昂貴的

如果假定在數據分析工具涉及一些費用的話,你可能會害怕獲得數據。而可以告訴你的有好消息是,如今有許多免費的數據工具,任何人都可以開始使用這些工具來分析大數據。

同時,森古普塔表示,當今云計算的低成本意味著“你真的可以做那些以前從來不可能實現的的事情?!?/span>

6.機器算法將取代人類分析

森古普塔認為在分析大數據方法有一個有趣的二分法?!坝腥苏f,解決這個問題需要成千上萬的數據科學家來分析解決,隨后,又有人說,采用機器學習就可以做到這一切。這將是完全自動的?!?/span>

但是,桑古塔并不認為這些都是合適的解決方案?!皼]有足夠的數據科學家,成本將快速上升?!彼f,“此外,企業用戶有多年的域名登錄經驗,并有著對他們業務的直覺。當你請來一個數據科學家,并認為他會搞定這些工作,并告訴你該怎么做。這實際上創造了一個確切的錯誤,數據科學家們往往無法無法足夠了解企業的業務?!?/span>

“完美”的數據科學家,是那些準確理解具體業務如何運作,以及其數據是如何工作的,這是一個誤區。森古普塔說,“這樣的人根本不存在?!?/span>

在現實中,森古普塔說,“大多數數據科學項目實際上沒有得到實施,因為它是如此艱難,需要幾個月得到完成,而當它完成的時候,你所關心的問題是已經陳舊過時了?!?/span>

但是,也有過于依賴機器學習問題?!皺C器學習只是給出一個答案,但并沒有解釋。它告訴人們該怎么做,而不是為什么要那樣做,”他說?!叭藗儾幌矚g別人告訴他該怎么做,尤其是神奇的機器?!彼f,其關鍵是不只是答案,而是其解釋和建議。

一方面,他說,數據科學家將變得越來越專業化,而這是真正困難的問題?!跋胍幌敫鳈C構和企業開始建設了數據處理部門和一些處理部門。世界500強企業也有數據處理部門“或數字加工部門。但他們基本上變成了Excel,Word和PowerPoint?!北M管如此,人們仍然是數據和數字處理方面的專家。

“如果我去摩根士丹利,相信我,那些數據處理和數字處理方面的專家仍然存在。他們只是有著不同的名稱和不同的工作,但在真正的情況下,這些人仍然存在,但80%-90%的專家已經轉移到Excel,Word和PowerPoint方面,這是全球在大數據方面應該發展的主要原因?!?/span>

 

互联网什么职业赚钱吗 1950的时时彩平台 互联网理财平台排名 股票配资在线就找卓信宝配资 在哪可以玩江西快三 基金配资房产抵押贷款 排列三排列五的开奖结果 澳大利亚有快乐8吗 11选5云南 模拟炒股软件 盛鹏配资