未來(lái)大數(shù)據(jù)發(fā)展的五個(gè)趨勢(shì)
1、數(shù)據(jù)科學(xué)越來(lái)越大眾化
隨著像Coursera、Udacity和Edx等這些和數(shù)據(jù)分析相關(guān)的網(wǎng)絡(luò)教育平臺(tái)的流行,越來(lái)越多的人不用花一分錢便可以學(xué)到所有的知識(shí),從基礎(chǔ)的統(tǒng)計(jì)學(xué)知識(shí)到自然語(yǔ)言處理和機(jī)器學(xué)習(xí)。除了這個(gè),Oxdata化簡(jiǎn)和集成了R語(yǔ)言后推出的分析產(chǎn)品,Quid正在做的具有機(jī)器學(xué)習(xí)和人工智能概念的工具也設(shè)計(jì)了傻瓜式的使用界面和形象具體的用戶展示方法。更有像Kaggle這樣的公司推出了關(guān)于預(yù)測(cè)模型的眾包平臺(tái)。所以大數(shù)據(jù)的處理的趨勢(shì)之一便是像Datahero,Infogram和Statwing他們一樣,把數(shù)據(jù)分析變得易用,大眾。
2、Hadoop對(duì)MapReduce的依賴越來(lái)越小
Hadoop平臺(tái)只為MapReduce服務(wù)的時(shí)代從Hadoop的2.0版本開始正式結(jié)束了。新版本支持的產(chǎn)品和服務(wù)將會(huì)和Cloudera的Impala一樣用一個(gè)SQL查詢引擎,或者其他的方法來(lái)替代MapReduce.HBaseNoSQL數(shù)據(jù)庫(kù)就是Hadoop離開MapReduce約束后的一個(gè)很好的例子。大型的網(wǎng)絡(luò)公司,像Facebook、eBay等都已經(jīng)用HBase去處理事務(wù)型的應(yīng)用了。
3、大數(shù)據(jù)越來(lái)越多的被用到了我們身邊的應(yīng)用中
首先是大數(shù)據(jù)應(yīng)用對(duì)我們的開發(fā)者的要求變低了,有時(shí)候開發(fā)大數(shù)據(jù)應(yīng)用就像在你的應(yīng)用的代碼中加入幾行,或者像是寫一段兒腳本一樣。其次,大數(shù)據(jù)的應(yīng)用范圍也得到了拓展,用戶習(xí)慣分析,網(wǎng)絡(luò)安全,人工智能,售后服務(wù)等等都可以通過(guò)將大數(shù)據(jù)處理做成產(chǎn)品或者應(yīng)用而實(shí)現(xiàn),F(xiàn)在的大數(shù)據(jù)技術(shù)已經(jīng)被帶入了許多網(wǎng)絡(luò)和手機(jī)的應(yīng)用中,從購(gòu)物推薦到找到和自己有關(guān)聯(lián)的人等等。
4、機(jī)器學(xué)習(xí)無(wú)處不在
很容易就可以看到機(jī)器學(xué)習(xí)越來(lái)越流行,從我們身邊的小應(yīng)用Prismatic、Summly、Trifacta、CloudFlare、Twitter、Google、Facebook、Bidgely、Healthrageous、Predilytics、BloomReach、DataPop、Gravity……如今很難想象一個(gè)沒(méi)有機(jī)器學(xué)習(xí)技術(shù)的科技公司可以生存。Heck,甚至是微軟都在機(jī)器學(xué)習(xí)上下了很大賭注它將成為一個(gè)重要的收入來(lái)源。
5、手機(jī)將成為人工智能的數(shù)據(jù)來(lái)源
我們的手機(jī)和手機(jī)中的應(yīng)用目前可能是最大的私人信息來(lái)源。通過(guò)機(jī)器學(xué)習(xí),語(yǔ)音識(shí)別和其他一些技術(shù),這些應(yīng)用可以知道我們?nèi)ツ膬,我們的朋友都是誰(shuí),我們的日歷上都有哪些提醒,我們上網(wǎng)都瀏覽什么。通過(guò)新一代的私人助理應(yīng)用(Siri,Saga和GoogleNow等)我們的手機(jī)更能夠理解我們的言論,知道我們經(jīng)常出入的地方,我們平時(shí)吃什么,我們?cè)诩、工作和郊游的時(shí)間等等。