大數據是什么意思?
2021-12-27 22:27:29高三網(wǎng)
大數據是巨量數據集合,指無(wú)法在一定時(shí)間范圍內用常規軟件工具進(jìn)行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長(cháng)率和多樣化的信息資產(chǎn)。
1什么是大數據
對于“大數據”(Big data)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力來(lái)適應海量、高增長(cháng)率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類(lèi)型和價(jià)值密度低四大特征。
大數據技術(shù)的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進(jìn)行專(zhuān)業(yè)化處理。換而言之,如果把大數據比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現盈利的關(guān)鍵,在于提高對數據的“加工能力”,通過(guò)“加工”實(shí)現數據的“增值”。
從技術(shù)上看,大數據與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數據必然無(wú)法用單臺的計算機進(jìn)行處理,必須采用分布式架構。它的特色在于對海量數據進(jìn)行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術(shù)。
2大數據學(xué)習一般都學(xué)什么
大數據技術(shù)的學(xué)習內容有很多,包括:
基礎階段:Linux、Docker、KVM、MySQL基礎、Oracle基礎、MongoDB、redis。
hadoop mapreduce hdfs yarn:hadoop:Hadoop 概念、版本、歷史,HDFS工作原理,YARN介紹及組件介紹。
大數據存儲階段:hbase、hive、sqoop。
大數據架構設計階段:Flume分布式、Zookeeper、Kafka。
大數據實(shí)時(shí)計算階段:Mahout、Spark、storm。
大數據數據采集階段:Python、Scala。
大數據商業(yè)實(shí)戰階段:實(shí)操企業(yè)大數據處理業(yè)務(wù)場(chǎng)景,分析需求、解決方案實(shí)施,綜合技術(shù)實(shí)戰應用。
相關(guān)推薦:
動(dòng)物科學(xué)專(zhuān)業(yè)是文科還是理科
最新高考資訊、高考政策、考前準備、志愿填報、錄取分數線(xiàn)等
高考時(shí)間線(xiàn)的全部重要節點(diǎn)
盡在"高考網(wǎng)"微信公眾號