2018-2023年中國(guó)車路協(xié)同行業(yè)發(fā)展現(xiàn)狀與趨勢(shì)預(yù)測(cè)研究報(bào)告
車路協(xié)同是采用先進(jìn)的無(wú)線通信和新一代互聯(lián)網(wǎng)等技術(shù),全方位實(shí)施車車、車路動(dòng)態(tài)實(shí)時(shí)信息交互,并在全時(shí)空動(dòng)態(tài)交通信息采集與融合的基礎(chǔ)上開(kāi)展車輛主動(dòng)安全控制和道路協(xié)同管理,充分實(shí)現(xiàn)人車路的...
大數(shù)據(jù)處理方法步驟:
1. 大數(shù)據(jù)處理之一:采集
大數(shù)據(jù)的采集是指利用多個(gè)數(shù)據(jù)庫(kù)來(lái)接收發(fā)自客戶端(Web、App或者傳感器形式等)的 數(shù)據(jù),并且用戶可以通過(guò)這些數(shù)據(jù)庫(kù)來(lái)進(jìn)行簡(jiǎn)單的查詢和處理工作。比如,電商會(huì)使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)MySQL和Oracle等來(lái)存儲(chǔ)每一筆事務(wù)數(shù)據(jù),除 此之外,Redis和MongoDB這樣的NoSQL數(shù)據(jù)庫(kù)也常用于數(shù)據(jù)的采集。
在大數(shù)據(jù)的采集過(guò)程中,其主要特點(diǎn)和挑戰(zhàn)是并發(fā)數(shù)高,因?yàn)橥瑫r(shí)有可能會(huì)有成千上萬(wàn)的用戶 來(lái)進(jìn)行訪問(wèn)和操作,比如火車票售票網(wǎng)站和淘寶,它們并發(fā)的訪問(wèn)量在峰值時(shí)達(dá)到上百萬(wàn),所以需要在采集端部署大量數(shù)據(jù)庫(kù)才能支撐。并且如何在這些數(shù)據(jù)庫(kù)之間 進(jìn)行負(fù)載均衡和分片的確是需要深入的思考和設(shè)計(jì)。
2. 大數(shù)據(jù)處理之二:導(dǎo)入/預(yù)處理
雖然采集端本身會(huì)有很多數(shù)據(jù)庫(kù),但是如果要對(duì)這些海量數(shù)據(jù)進(jìn)行有效的分析,還是應(yīng)該將這 些來(lái)自前端的數(shù)據(jù)導(dǎo)入到一個(gè)集中的大型分布式數(shù)據(jù)庫(kù),或者分布式存儲(chǔ)集群,并且可以在導(dǎo)入基礎(chǔ)上做一些簡(jiǎn)單的清洗和預(yù)處理工作。也有一些用戶會(huì)在導(dǎo)入時(shí)使 用來(lái)自Twitter的Storm來(lái)對(duì)數(shù)據(jù)進(jìn)行流式計(jì)算,來(lái)滿足部分業(yè)務(wù)的實(shí)時(shí)計(jì)算需求。
導(dǎo)入與預(yù)處理過(guò)程的特點(diǎn)和挑戰(zhàn)主要是導(dǎo)入的數(shù)據(jù)量大,每秒鐘的導(dǎo)入量經(jīng)常會(huì)達(dá)到百兆,甚至千兆級(jí)別。
3. 大數(shù)據(jù)處理之三:統(tǒng)計(jì)/分析
統(tǒng)計(jì)與分析主要利用分布式數(shù)據(jù)庫(kù),或者分布式計(jì)算集群來(lái)對(duì)存儲(chǔ)于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通 的分析和分類匯總等,以滿足大多數(shù)常見(jiàn)的分析需求,在這方面,一些實(shí)時(shí)性需求會(huì)用到EMC的GreenPlum、Oracle的Exadata,以及基于 MySQL的列式存儲(chǔ)Infobright等,而一些批處理,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求可以使用Hadoop。
統(tǒng)計(jì)與分析這部分的主要特點(diǎn)和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,其對(duì)系統(tǒng)資源,特別是I/O會(huì)有極大的占用。
4. 大數(shù)據(jù)處理之四:挖掘
與前面統(tǒng)計(jì)和分析過(guò)程不同的是,數(shù)據(jù)挖掘一般沒(méi)有什么預(yù)先設(shè)定好的主題,主要是在現(xiàn)有數(shù) 據(jù)上面進(jìn)行基于各種算法的計(jì)算,從而起到預(yù)測(cè)(Predict)的效果,從而實(shí)現(xiàn)一些高級(jí)別數(shù)據(jù)分析的需求。比較典型算法有用于聚類的Kmeans、用于 統(tǒng)計(jì)學(xué)習(xí)的SVM和用于分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過(guò)程的特點(diǎn)和挑戰(zhàn)主要是用于挖掘的算法很復(fù)雜,并 且計(jì)算涉及的數(shù)據(jù)量和計(jì)算量都很大,常用數(shù)據(jù)挖掘算法都以單線程為主。
細(xì)分市場(chǎng)研究 可行性研究 商業(yè)計(jì)劃書 專項(xiàng)市場(chǎng)調(diào)研 兼并重組研究 IPO上市咨詢 產(chǎn)業(yè)園區(qū)規(guī)劃 十三五規(guī)劃
中研網(wǎng) 發(fā)現(xiàn)資訊的價(jià)值
研究院 掌握產(chǎn)業(yè)最新情報(bào) 中研網(wǎng)是中國(guó)領(lǐng)先的綜合經(jīng)濟(jì)門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領(lǐng)域,致力于為中高端人士提供最具權(quán)威性的產(chǎn)業(yè)資訊。每天對(duì)全球產(chǎn)業(yè)經(jīng)濟(jì)新聞進(jìn)行及時(shí)追蹤報(bào)道,并對(duì)熱點(diǎn)行業(yè)專題探討及深入評(píng)析。以獨(dú)到的專業(yè)視角,全力打造中國(guó)權(quán)威的經(jīng)濟(jì)研究、決策支持平臺(tái)!
廣告、內(nèi)容合作請(qǐng)點(diǎn)這里尋求合作
智付電子被罰近日,央行開(kāi)出了今年最高罰單,第三方支付企業(yè)智付電子因違反支付結(jié)算管理被罰 2500 萬(wàn)元。根據(jù)報(bào)道,...
你知道總資產(chǎn)與凈資產(chǎn)的區(qū)別是什么?凈資產(chǎn)(Net asset)是屬企業(yè)所有,并可以自由支配的資產(chǎn),即所有者權(quán)益或者權(quán)益n...
缺碘會(huì)導(dǎo)致哪種疾???碘是人體必需的微量元素,是合成甲狀腺激素必不可少的重要原料,在維持機(jī)體健康的過(guò)程中發(fā)揮著重...
由于患有罕見(jiàn)病的發(fā)病人群較少,制藥企業(yè)給予該領(lǐng)域的關(guān)注度較低,相關(guān)的治療藥物也較少,這類藥物就被稱為孤兒藥。根...
iPhoneX Plus發(fā)布時(shí)間 根據(jù)最新消息報(bào)道,蘋果今年秋季將發(fā)布三款新iPhone。將會(huì)有更新版本的iPhone X,一個(gè)更大(...
華為暢享8和暢享8plus哪個(gè)好,有什么區(qū)別?華為暢享8 Plus和暢享8在屏幕尺寸和分辨率、處理器、RAM內(nèi)存、ROM存儲(chǔ)、前8...
中研普華集團(tuán)聯(lián)系方式廣告服務(wù)版權(quán)聲明誠(chéng)聘英才企業(yè)客戶意見(jiàn)反饋報(bào)告索引網(wǎng)站地圖 Copyright ? 1998-2020 ChinaIRN.COM All Rights Reserved. 版權(quán)所有 中國(guó)行業(yè)研究網(wǎng)(簡(jiǎn)稱“中研網(wǎng)”) 粵ICP備18008601號(hào)