萬(wàn)物分析的大數據
2019-05-22 14:47:09陽(yáng)光高考網(wǎng)
一、專(zhuān)業(yè)解析
什么是大數據?
進(jìn)入互聯(lián)網(wǎng)時(shí)代,中國的網(wǎng)民人數已超7億,大數據的應用涉及到生活的方方面面。例如,你在網(wǎng)站上買(mǎi)書(shū),商家就會(huì )根據你的喜好和其他購書(shū)者的評價(jià)給你推薦另外的書(shū)籍;手機定位數據和交通數據可以幫助城市規劃;甚至用戶(hù)的搜索習慣和股市都有很大關(guān)系。
在談到大數據的時(shí)候,人們往往知道的就是數據很大,但大數據≠大的數據。對外經(jīng)濟貿易大學(xué)信息學(xué)院副院長(cháng)華迎教授介紹:“現在的大數據包括來(lái)自于多種渠道的多類(lèi)數據,其中主要來(lái)源網(wǎng)絡(luò )數據。數據分析不是新的,一直都有,但是為什么叫大數據呢?主要是因為網(wǎng)絡(luò )數據的格式、體量、價(jià)值,都超出了傳統數據的規模。對這些海量信息的采集、存儲、分析、整合、控制而得到的數據就是大數據。大數據技術(shù)的意義不在于掌握龐大的數據信息,而在于對這些數據進(jìn)行專(zhuān)業(yè)化處理,通過(guò)‘加工’實(shí)現數據的‘增值’,更好地輔助決策。”
數據科學(xué)與大數據技術(shù)專(zhuān)業(yè)
本科專(zhuān)業(yè)中和大數據相對應的是“數據科學(xué)與大數據技術(shù)”專(zhuān)業(yè),它是2015年教育部公布的新增專(zhuān)業(yè)。2016年3月公布的《高校本科專(zhuān)業(yè)備案和審批結果》中,北京大學(xué)、對外經(jīng)濟貿易大學(xué)和中南大學(xué)3所高校首批獲批開(kāi)設“數據科學(xué)與大數據技術(shù)”專(zhuān)業(yè)。隨后第二年又有32所高校獲批“數據科學(xué)與大數據技術(shù)”專(zhuān)業(yè)。兩次獲批的名單中顯示,該專(zhuān)業(yè)學(xué)制為四年,大部分為工學(xué)。
“數據科學(xué)與大數據技術(shù)是個(gè)交叉性很強的專(zhuān)業(yè),很難說(shuō)完全歸屬于哪個(gè)獨立的學(xué)科。所以,不同的學(xué)校有的是信息學(xué)院申報,有的是計算機學(xué)院牽頭申報,有的設在統計學(xué)院,還有的在經(jīng)管學(xué)院。像北京大學(xué)這個(gè)專(zhuān)業(yè)是放在理學(xué)下,授予理學(xué)學(xué)位。大多數是設在工學(xué)計算機門(mén)類(lèi)下,授予的是工學(xué)學(xué)位。”華迎教授說(shuō):“數據科學(xué)很早就存在,是個(gè)比較經(jīng)典的學(xué)科,現在和大數據技術(shù)結合形成了這個(gè)專(zhuān)業(yè)。目前教育部設定的本科專(zhuān)業(yè)名稱(chēng)為‘數據科學(xué)與大數據技術(shù)’,專(zhuān)科名稱(chēng)是‘大數據技術(shù)與應用’。”
數據科學(xué)與大數據技術(shù)學(xué)什么?
以對外經(jīng)濟貿易大學(xué)該專(zhuān)業(yè)為例,專(zhuān)業(yè)知識結構包括數學(xué)、統計、計算機和大數據分析四大模塊,具體課程設置如下:
數學(xué):數學(xué)分析一、數學(xué)分析二、高等代數、離散數學(xué)。統計學(xué):概率論與數理統計、多元統計分析、隨機過(guò)程。計算機:數據結構、計算機組成原理、操作系統、數據庫系統原理、C++程序設計、Java程序設計、Python與大數據分析、科學(xué)計算與Matlab應用、R語(yǔ)言等。大數據分析:數據科學(xué)導論、機器學(xué)習與數據挖掘、信息檢索與數據處理、自然語(yǔ)言處理、智能計算、推薦系統原理、大數據分析技術(shù)基礎、數據可視化、大數據存儲與管理、大數據分析實(shí)踐等課程。
華迎教授介紹:“數據科學(xué)與大數據技術(shù)是一門(mén)實(shí)踐性很強的新興交叉復合型學(xué)科,無(wú)論是開(kāi)設在哪個(gè)學(xué)院下,數學(xué)、統計學(xué)、計算機三大塊課程是必須得有。各高校在這幾門(mén)背景學(xué)科的基礎上,交叉融合其他的專(zhuān)業(yè)知識技能。如我校在數學(xué)、統計學(xué)、計算機知識體系模塊中又增加了體現學(xué)校特色的財經(jīng)類(lèi)行業(yè)應用和外語(yǔ)模塊,以提升學(xué)生的行業(yè)應用能力和國際化水平。根據各校偏重的專(zhuān)業(yè)方向,課程設置有所差異,感興趣的同學(xué)可以具體查看各校的專(zhuān)業(yè)和課程設置情況。”
二、專(zhuān)業(yè)與就業(yè)
行業(yè)增速快 人才缺口180萬(wàn)
隨著(zhù)移動(dòng)互聯(lián)網(wǎng)和智能終端的普及,信息技術(shù)與經(jīng)濟社會(huì )的交匯融合,引發(fā)了數據迅猛增長(cháng)。新摩爾定律認為,人類(lèi)有史以來(lái)的數據總量,每過(guò)18個(gè)月就會(huì )翻一番。而海量的數據蘊含著(zhù)巨大生產(chǎn)力和商機。
2011年至2014年四年間,我國大數據處于起步階段,每年均增長(cháng)在20%以上。2015年,大數據市場(chǎng)規模已達到98.9億元。2016年增速達到45%,超過(guò)160億元。預計2020年,我國大數據市場(chǎng)規模將超過(guò)8000億元,有望成世界第一數據資源大國。但數據開(kāi)放度低、技術(shù)薄弱、人才缺失、行業(yè)應用不深入等都是產(chǎn)業(yè)發(fā)展中亟待解決的問(wèn)題。
根據領(lǐng)英發(fā)布《2016年中國最熱職位人才報告》顯示,有六類(lèi)熱門(mén)職位的人才當前都處于供不應求狀態(tài),稀缺程度各有不同,其中,數據分析人才的供給指數最低,僅為0.05,屬于高度稀缺。
中國商業(yè)聯(lián)合會(huì )數據分析專(zhuān)業(yè)委員會(huì )資料顯示,未來(lái)3至5年,中國需要180萬(wàn)數據人才,但截至目前,中國大數據從業(yè)人員只有約30萬(wàn)人。同時(shí),大數據行業(yè)選才的標準也在不斷變化。初期,大數據人才的需求主要集中在ETL研發(fā)、系統架構開(kāi)發(fā)、數據倉庫研究等偏硬件領(lǐng)域,以IT、計算機背景的人才居多。隨著(zhù)大數據往各垂直領(lǐng)域延伸發(fā)展,對統計學(xué)、數學(xué)專(zhuān)業(yè)的人才,數據分析、數據挖掘、人工智能等偏軟件領(lǐng)域的需求加大。
大數據主要就業(yè)方向
2015年9月國務(wù)院印發(fā)《促進(jìn)大數據發(fā)展行動(dòng)綱要》,系統部署大數據發(fā)展工作!毒V要》明確提出了七方面政策機制,其中第六條就是加強專(zhuān)業(yè)人才培養,建立健全多層次、多類(lèi)型的大數據人才培養體系。目前,大數據主要有三大就業(yè)方向:大數據系統研發(fā)類(lèi)、大數據應用開(kāi)發(fā)類(lèi)和大數據分析類(lèi)。具體崗位如:大數據分析師、大數據工程師等。
“大數據分析師是用適當的統計分析方法對收集來(lái)的大量數據進(jìn)行分析,強調的是數據的應用,側重于統計層面內容會(huì )多一些。比如做產(chǎn)品經(jīng)理,可以通過(guò)數據建立金融模型,來(lái)推出一些理財產(chǎn)品。而大數據工程師則側重于技術(shù),主要是圍繞大數據平臺系統級的研發(fā),偏開(kāi)發(fā)層面。”華迎教授介紹:“我們把大數據分析在業(yè)務(wù)中使用的流程總結起來(lái),分為以下幾個(gè)步驟:數據獲取和預處理、數據存儲管理、數據分析建模、數據可視化。在這個(gè)應用流程中,畢業(yè)生可以根據自己的興趣和特長(cháng),在不同的環(huán)節選擇就業(yè)。”