蜜桃av色欲a片精品一区,麻豆aⅴ精品无码一区二区,亚洲人成网站在线播放影院在线,亚洲 素人 字幕 在线 最新

微立頂科技

新聞資訊

創(chuàng)新 服務(wù) 價(jià)值

  企業(yè)級(jí)數(shù)據(jù)中臺(tái)架構(gòu)

發(fā)布日期:2022/11/17 10:29:14      瀏覽量:

一、什么是數(shù)據(jù)中臺(tái)

數(shù)據(jù)中臺(tái)是一種將企業(yè)沉睡的數(shù)據(jù)變成數(shù)據(jù)資產(chǎn),持續(xù)使用數(shù)據(jù)、產(chǎn)生智能、為業(yè)務(wù)服務(wù),從而實(shí)現(xiàn)數(shù)據(jù)價(jià)值變現(xiàn)的系統(tǒng)和機(jī)制。通過(guò)數(shù)據(jù)中臺(tái)提供的方法和運(yùn)行機(jī)制,形成匯聚整合、提純加工、建模處理、算法學(xué)習(xí),并以共享服務(wù)的方式將數(shù)據(jù)提供給業(yè)務(wù)使用,從而與業(yè)務(wù)聯(lián)動(dòng)。再者,結(jié)合業(yè)務(wù)中臺(tái)的數(shù)據(jù)生產(chǎn)能力,最終構(gòu)建數(shù)據(jù)生產(chǎn)一消費(fèi)一再生的閉環(huán)。

數(shù)據(jù)中臺(tái)與大數(shù)據(jù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖、 商業(yè)智能BI有什么區(qū)別,請(qǐng)參考另外一篇文章:https://www.toutiao.com/article/7166179034006209061/。

二、數(shù)據(jù)中臺(tái)功能架構(gòu)

數(shù)據(jù)中臺(tái)建設(shè)是一個(gè)宏大的工程,涉及整體規(guī)劃、組織搭建、中臺(tái)落地與運(yùn)營(yíng)等方方面面的工作,本文重點(diǎn)從物理形態(tài)上講述企業(yè)的數(shù)據(jù)中臺(tái)應(yīng)該如何搭建。一般來(lái)講,企業(yè)的數(shù)據(jù)中臺(tái)在物理形態(tài)上分為三個(gè)大層:工具平臺(tái)層、數(shù)據(jù)資產(chǎn)層和數(shù)據(jù)應(yīng)用層。


2.1.工具平臺(tái)層

工具平臺(tái)層是數(shù)據(jù)中臺(tái)的載體,包含大數(shù)據(jù)處理的基礎(chǔ)能力技術(shù),如集數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、數(shù)據(jù)安全等于一個(gè)的大數(shù)據(jù)平臺(tái);還包含建設(shè)數(shù)據(jù)中臺(tái)的一系列工具,如離線或?qū)崟r(shí)數(shù)據(jù)研發(fā)工具、數(shù)據(jù)聯(lián)通工具、標(biāo)簽計(jì)算工具、算法平臺(tái)工具、數(shù)據(jù)服務(wù)工具及自助分析工具。以上工具集基本覆蓋了數(shù)據(jù)中臺(tái)的數(shù)據(jù)加工過(guò)程。

(1)數(shù)據(jù)開發(fā)平臺(tái)

大數(shù)據(jù)的4V(Volume 數(shù)據(jù)量大、 Variety類型繁多、Velocity 速度快效率高、 Value價(jià)值密度低)特征決定了大數(shù)據(jù)處理是一個(gè)復(fù)雜的工程。建設(shè)數(shù)據(jù)中臺(tái)需要搭建數(shù)據(jù)中臺(tái)的基建工具,要滿足各種結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的采集、存儲(chǔ)與處理,要根據(jù)場(chǎng)景處理離線和實(shí)時(shí)數(shù)據(jù)的計(jì)算與存儲(chǔ),要將一個(gè)個(gè)數(shù)據(jù)處理任務(wù)串聯(lián)起來(lái)以保障數(shù)據(jù)的運(yùn)轉(zhuǎn)能賦能到業(yè)務(wù)端。

(2)數(shù)據(jù)資產(chǎn)管理

數(shù)據(jù)中臺(tái)建設(shè)的成功與否,與數(shù)據(jù)資產(chǎn)是否管理有序有直接關(guān)系。數(shù)據(jù)中臺(tái)是需要持續(xù)運(yùn)營(yíng)的,隨著時(shí)間的推移,數(shù)據(jù)不斷涌人數(shù)據(jù)中臺(tái),如果沒有一套井然有序的數(shù)據(jù)資產(chǎn)平臺(tái)來(lái)進(jìn)行管理,后果將不堪設(shè)想。

數(shù)據(jù)資產(chǎn)管理工具既能幫助企業(yè)合理評(píng)估、規(guī)范和治理信息資產(chǎn),又可以發(fā)揮數(shù)據(jù)資產(chǎn)價(jià)值并促進(jìn)數(shù)據(jù)資產(chǎn)持續(xù)增值。對(duì)于數(shù)據(jù)資產(chǎn)管理,不推薦事后管理,而要與數(shù)據(jù)研發(fā)的過(guò)程聯(lián)動(dòng)。也就是說(shuō),當(dāng)數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)開發(fā)平臺(tái)加工的鏈路時(shí),數(shù)據(jù)資產(chǎn)管理平臺(tái)就已經(jīng)無(wú)聲無(wú)息地介入了。數(shù)據(jù)資產(chǎn)管理的首要任務(wù)是管理好進(jìn)入數(shù)據(jù)中臺(tái)的元數(shù)據(jù),這里的元數(shù)據(jù)包括數(shù)據(jù)源、構(gòu)建的各種模型、通過(guò)模型拆解出來(lái)的指標(biāo)與標(biāo)簽。有序管理這些數(shù)據(jù)資產(chǎn)的元數(shù)據(jù)是前提條件,只有做好了這一步,才能繼續(xù)對(duì)數(shù)據(jù)流向的追溯,對(duì)指標(biāo)、標(biāo)簽體系的生命可期進(jìn)行管理。

(3)標(biāo)簽工廠

標(biāo)簽工廠又稱標(biāo)簽平臺(tái),標(biāo)簽建設(shè)是數(shù)據(jù)中臺(tái)走向數(shù)據(jù)業(yè)務(wù)化的關(guān)鍵步驟,嚴(yán)格來(lái)說(shuō)標(biāo)簽工廠也屬于數(shù)據(jù)開發(fā)平臺(tái)的一部分。一個(gè)強(qiáng)大的標(biāo)簽工廠是數(shù)據(jù)中臺(tái)價(jià)值體現(xiàn)的有力保障,標(biāo)簽的使用場(chǎng)景豐富,標(biāo)簽與業(yè)務(wù)結(jié)合得非常緊密。標(biāo)簽工廠致力于屏蔽底層復(fù)雜的大數(shù)據(jù)框架,面向普通開發(fā)人員、數(shù)據(jù)分析師、運(yùn)營(yíng)人員提供友好的界面交互配置,完成標(biāo)簽的全生命周期管理;同時(shí),對(duì)上層業(yè)務(wù)系統(tǒng)提供自身 API 能力,與各業(yè)務(wù)系統(tǒng)形成數(shù)據(jù)閉環(huán)。

標(biāo)簽工廠按功能一般分為兩部分:底層的標(biāo)簽計(jì)算引擎與上層的標(biāo)簽配置與管理門戶。標(biāo)簽計(jì)算引擎一般會(huì)使用 MapReduce 、 Spark 、 Flink 等大數(shù)據(jù)計(jì)算框架,而計(jì)算后的標(biāo)簽存儲(chǔ)可采用 Elasticsearch 或者 HBase ,這樣存儲(chǔ)的好處是便于快速檢索。而標(biāo)簽配置與管理門戶則支持通過(guò)配置標(biāo)簽規(guī)則提交到標(biāo)簽計(jì)算引擎,就能定時(shí)算出所需要的標(biāo)簽。標(biāo)簽配置和官理戶還提供標(biāo)準(zhǔn)的標(biāo)簽服務(wù)申請(qǐng)與調(diào)用。通過(guò)標(biāo)簽工廠,數(shù)據(jù)中口團(tuán)隊(duì)可減少大量的數(shù)據(jù)開發(fā)工作。

(4) ID - Mapping

ID - Mapping 又稱 ID 打通工具,是數(shù)據(jù)中臺(tái)建設(shè)的可選項(xiàng),可選不代表不重要,在一些多渠道、多觸點(diǎn)的新零售企業(yè),離開這個(gè)工具,數(shù)據(jù)質(zhì)量將大打折扣。ID - Mapping 功能的建設(shè)一般會(huì)利用強(qiáng)大的圖計(jì)算功能,通過(guò)兩兩之間的關(guān)系實(shí)現(xiàn)互通,目動(dòng)高效地將關(guān)聯(lián)的身份映射為同一身份即唯一 ID 的數(shù)據(jù)工具。它能大幅度降低處理成本,提高效率,挖掘更多用戶信息,形成更完整的畫像,大大利于數(shù)字營(yíng)銷的推進(jìn)。另外, ID - Mapping 工具也可用于企業(yè)主數(shù)據(jù)治理。

5)機(jī)器學(xué)習(xí)平臺(tái)

在整個(gè)機(jī)器學(xué)習(xí)的工作流中,模型訓(xùn)練的代碼開發(fā)只是其中一部分。除此之外,數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、特征提取、超參數(shù)的選擇與優(yōu)化、訓(xùn)練任務(wù)的監(jiān)控、模型的發(fā)布與集成、日志的回收等,都是流程中不可或缺的部分。機(jī)器學(xué)習(xí)平臺(tái)支持訓(xùn)練數(shù)據(jù)的高質(zhì)量采集與高效標(biāo)注,內(nèi)置預(yù)訓(xùn)練模型,封裝機(jī)器學(xué)習(xí)算法,通過(guò)可視化拖曳實(shí)現(xiàn)模型訓(xùn)練,支持從數(shù)據(jù)處理、模型訓(xùn)練、模型部署為在線預(yù)測(cè)服務(wù),通過(guò) RESTful API 的形式與業(yè)務(wù)應(yīng)用集成,實(shí)現(xiàn)預(yù)測(cè),打通機(jī)器學(xué)習(xí)全鏈路,幫助企業(yè)更好地完成傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的落地。

(6)統(tǒng)一數(shù)據(jù)服務(wù)

統(tǒng)一數(shù)據(jù)服務(wù)旨在為企業(yè)搭建統(tǒng)一的數(shù)據(jù)服務(wù)門戶,幫助企業(yè)提升數(shù)據(jù)資產(chǎn)的價(jià)值,同時(shí)保證數(shù)據(jù)的可靠性、安全性和有效性。統(tǒng)一數(shù)據(jù)服務(wù)支持通過(guò)界面配置的方式構(gòu)建 API 和數(shù)據(jù)服務(wù)接口,以滿足不同數(shù)據(jù)的使用場(chǎng)景,同時(shí)降低數(shù)據(jù)的開發(fā)門檻,幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)應(yīng)用價(jià)值最大化。統(tǒng)一數(shù)據(jù)服務(wù)作為唯一的數(shù)據(jù)服務(wù)出口,實(shí)現(xiàn)了數(shù)據(jù)的統(tǒng)一市場(chǎng)化管理,在有效降低數(shù)據(jù)開放門檻的同時(shí),保障了數(shù)據(jù)開放的安全。

2.2.?dāng)?shù)據(jù)資產(chǎn)層

數(shù)據(jù)資產(chǎn)層是數(shù)據(jù)中臺(tái)的核心層,它依托于工具平臺(tái)層,具體內(nèi)容因企業(yè)的業(yè)務(wù)與行業(yè)而異,但總體來(lái)講,可以劃分為主題域模型區(qū)、標(biāo)簽?zāi)P蛥^(qū)和算法模型區(qū)

(1)主題域模型

主題域模型是指面向業(yè)務(wù)分析,將業(yè)務(wù)過(guò)程或維度進(jìn)行抽象的集合。業(yè)務(wù)過(guò)程可以概括為一個(gè)個(gè)不可拆分的行為事件,如訂單、合同、營(yíng)銷等。為了保障整個(gè)體系的生命力,主題域即數(shù)據(jù)域需要抽象提煉,并且長(zhǎng)期維護(hù)和更新,但是不輕易變動(dòng)。在劃分?jǐn)?shù)據(jù)域時(shí),既要涵蓋當(dāng)前所有業(yè)務(wù)的需求,又要保證新業(yè)務(wù)能夠無(wú)影啊地被包含進(jìn)來(lái)。

(2)標(biāo)簽?zāi)P?/strong>

標(biāo)簽?zāi)P偷脑O(shè)計(jì)與主題域模型方法大同小異,同樣需要給日業(yè)務(wù)過(guò)程進(jìn)行設(shè)計(jì),需要充分理解業(yè)務(wù)討程。標(biāo)簽一般會(huì)涉及企業(yè)經(jīng)營(yíng)過(guò)程中的實(shí)體對(duì)象,如會(huì)員、商品、門店、經(jīng)銷商等,這些主體一般來(lái)說(shuō)都穿插在各個(gè)業(yè)務(wù)流程中,比如會(huì)員一般都穿插在注冊(cè)、登錄、瀏覽、下單、評(píng)價(jià)、服務(wù)等環(huán)節(jié)。那么在設(shè)計(jì)標(biāo)簽系統(tǒng)的時(shí)候就而要充分理解這此業(yè)務(wù)流程,在流程中發(fā)現(xiàn)標(biāo)簽的應(yīng)用點(diǎn),結(jié)合這些應(yīng)用點(diǎn)來(lái)搭建企業(yè)的標(biāo)簽系統(tǒng)。設(shè)計(jì)標(biāo)簽?zāi)P蜁r(shí)非常關(guān)鍵的要索是標(biāo)簽?zāi)P鸵欢ㄒ哂锌蓴U(kuò)展性。畢竟標(biāo)簽這種數(shù)據(jù)資產(chǎn)是需要持續(xù)運(yùn)營(yíng)的,也是有生命周期的,在運(yùn)營(yíng)的過(guò)程中隨時(shí)可能增加新的標(biāo)簽。

(3)算法模型

算法模型更加貼近業(yè)務(wù)場(chǎng)景。在設(shè)計(jì)算法模型的時(shí)候要反復(fù)推演算法模型使用的場(chǎng)景,包括模型的冷啟動(dòng)等問(wèn)題。整個(gè)模型搭建過(guò)程包含定場(chǎng)景、數(shù)據(jù)源準(zhǔn)備、特征工程、模型設(shè)計(jì)、模型訓(xùn)練、正式上線、參數(shù)調(diào)整7個(gè)環(huán)節(jié)。以新零售企業(yè)為例,常用的機(jī)器學(xué)習(xí)算法有決策樹、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)、聚類、貝葉斯、支持問(wèn)量機(jī)等。這些算法已經(jīng)非常成熟,可以用來(lái)實(shí)現(xiàn)商品個(gè)性化推薦、銷量預(yù)測(cè)、流失預(yù)測(cè)、商品組貨優(yōu)化等新零售場(chǎng)景的算法模型。

2.3.?dāng)?shù)據(jù)應(yīng)用層

數(shù)據(jù)應(yīng)用層嚴(yán)格來(lái)說(shuō)不屬于數(shù)據(jù)中臺(tái)的范疇,但數(shù)據(jù)中臺(tái)的使命就是為業(yè)務(wù)賦能,幾乎所有企業(yè)在建設(shè)數(shù)據(jù)中臺(tái)的同時(shí)都已規(guī)劃好數(shù)據(jù)應(yīng)用。數(shù)據(jù)應(yīng)用可按數(shù)據(jù)使用場(chǎng)景來(lái)劃分為以下多個(gè)使用領(lǐng)域。

(1)分析與決策應(yīng)用

分析與決策應(yīng)用主要面向企業(yè)的領(lǐng)導(dǎo)、運(yùn)營(yíng)人員等角色,基于企業(yè)的業(yè)務(wù)背景和數(shù)據(jù)分析訴求,針對(duì)客戶拉新、老客運(yùn)營(yíng)、銷售能力評(píng)估等分析場(chǎng)景,通過(guò)主題域模型、標(biāo)簽?zāi)P秃退惴P?,為企業(yè)提供可視化分析專題。用戶在分析與決策應(yīng)用中快速獲取企業(yè)現(xiàn)狀和問(wèn)題,同時(shí)可對(duì)數(shù)據(jù)進(jìn)行鉆取、聯(lián)動(dòng)分析等,深度分析企業(yè)問(wèn)題及其原因,從而輔助企業(yè)進(jìn)行管理和決策,實(shí)現(xiàn)精準(zhǔn)管理和智能決策。

(2)標(biāo)簽應(yīng)用

標(biāo)簽旨在挖掘?qū)嶓w對(duì)象(如客戶、商品等)的特征,將數(shù)據(jù)轉(zhuǎn)化成真正對(duì)業(yè)務(wù)有價(jià)值的產(chǎn)物并對(duì)外提供標(biāo)簽數(shù)據(jù)服務(wù),多應(yīng)用于客戶圈選、精準(zhǔn)營(yíng)銷和個(gè)性化推薦等場(chǎng)景,從而實(shí)現(xiàn)資產(chǎn)變現(xiàn),不斷擴(kuò)大資產(chǎn)價(jià)值。標(biāo)簽體系的設(shè)計(jì)立足于標(biāo)簽使用場(chǎng)景,不同使用場(chǎng)景對(duì)你簽需求是不同的,警如在客戶個(gè)性化推薦場(chǎng)景下,需要客戶性別、近期關(guān)注商品類型、消費(fèi)能力和消費(fèi)習(xí)慣等標(biāo)簽。因此,在標(biāo)簽體系設(shè)計(jì)前,需要先基于業(yè)務(wù)需求分析標(biāo)簽的使用場(chǎng)景,再詳細(xì)設(shè)計(jì)標(biāo)簽體系和規(guī)則。

(3)智能應(yīng)用

智能應(yīng)用是數(shù)智化的一個(gè)典型外在表現(xiàn)。比如在營(yíng)銷領(lǐng)域,不僅可實(shí)現(xiàn)千人千面的用戶個(gè)性化推薦,如猜你喜歡、加購(gòu)?fù)扑]等,還可借助智能營(yíng)銷工具進(jìn)行高精準(zhǔn)度的用戶觸達(dá)。除了傳統(tǒng)統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)之外,還可以融入深度學(xué)習(xí),自然語(yǔ)言處理等,滿足更多智能化應(yīng)用場(chǎng)景。

三、數(shù)據(jù)中臺(tái)技術(shù)架構(gòu)

隨著大數(shù)據(jù)與人工智能技術(shù)的不斷迭代以及商業(yè)大數(shù)據(jù)工具產(chǎn)品的推出,數(shù)據(jù)中臺(tái)的架構(gòu)設(shè)計(jì)大可不必從零開始,可以采購(gòu)一站式的研發(fā)平臺(tái)產(chǎn)品,或者基于一些開源產(chǎn)品進(jìn)行組裝。企業(yè)可根據(jù)自身情況進(jìn)行權(quán)衡考慮,但無(wú)論采用哪種方案,數(shù)據(jù)中臺(tái)的架構(gòu)設(shè)計(jì)以滿足當(dāng)前數(shù)據(jù)處理的全場(chǎng)景為基準(zhǔn)。

以開源技術(shù)為例,數(shù)據(jù)中臺(tái)的技術(shù)架構(gòu)如下圖所示,總體來(lái)看一般包含以下幾種功能:數(shù)據(jù)采集、數(shù)據(jù)計(jì)算、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)服務(wù);在研發(fā)、運(yùn)維和公共服務(wù)方面包括離線開發(fā)、實(shí)時(shí)開發(fā)、數(shù)據(jù)資產(chǎn)、任務(wù)調(diào)度、數(shù)據(jù)安全、集群管理。


3.1.?dāng)?shù)據(jù)采集層

按數(shù)據(jù)的實(shí)時(shí)性,數(shù)據(jù)采集分為離線采集和實(shí)時(shí)采集。離線采集使用 DataX 和 Sqoop ,實(shí)時(shí)米集使用 Kafka Connect 、 Flume 、 Kafka。 在離線數(shù)據(jù)采集中,建議使用 DataX 和Sqoop相結(jié)合。 DataX 適合用在數(shù)據(jù)量較小且采用非關(guān)系型數(shù)據(jù)庫(kù)的場(chǎng)景,部署方式很簡(jiǎn)單。 Sqoop 適合用在數(shù)據(jù)量較大且采用關(guān)系型數(shù)據(jù)庫(kù)的場(chǎng)景。在實(shí)時(shí)數(shù)據(jù)采集中,對(duì)于數(shù)據(jù)庫(kù)的變更數(shù)據(jù),如 MySQL 的 binlog 、 Oracle 的OGG,使用 Kafka Connect 進(jìn)行數(shù)據(jù)的實(shí)時(shí)采集。對(duì)于其他數(shù)據(jù),先將數(shù)據(jù)實(shí)時(shí)寫成文件,然后采用 Flume 對(duì)文件內(nèi)容進(jìn)行實(shí)時(shí)采集。將實(shí)時(shí)采集后的數(shù)據(jù)推送到 Kafka ,田 Flink 進(jìn)行數(shù)據(jù)處理。

3.2.?dāng)?shù)據(jù)計(jì)算層

數(shù)據(jù)計(jì)算采用 YARN 作為各種計(jì)算框架部署的執(zhí)行調(diào)度引擎,計(jì)算框架有 MapReduce 、 Spark 及 Spark SQL 、 Flink 、 Spark MLlib 等。 MapReduce 是最早開源的大數(shù)據(jù)計(jì)算框架,雖然性能相當(dāng)較差,但它的資源占用比較小,尤其是內(nèi)存方面。因此在部分?jǐn)?shù)據(jù)量過(guò)大,而其他計(jì)算框架由干硬件資源的限制(主要是內(nèi)存限制)無(wú)法執(zhí)行的場(chǎng)景,可以將 MapReduce 作為首選框架。 SparK 及 Spark SQL 是在批處理方面擁有出色的性能技術(shù)方案,適合大部分的離線處理場(chǎng)景。Flink 是實(shí)時(shí)數(shù)據(jù)處理方面的首選,在處理的時(shí)效性、性能和易用性方面都有很大優(yōu)勢(shì)。

機(jī)器學(xué)習(xí)一般采用 Spark 家族的 Spark MLlib 為技術(shù)底座。 Spark MLlib 內(nèi)置大量的常規(guī)算法包,如隨機(jī)森林、邏輯回歸、決策樹等,可以滿足大部分?jǐn)?shù)據(jù)智能應(yīng)用場(chǎng)景。同時(shí),數(shù)據(jù)中臺(tái)不斷進(jìn)化,也還新融人 AI 能力。如人臉識(shí)別、以圖搜圖、智能客服等能力的實(shí)現(xiàn)就需要 AI 平臺(tái)。目前較為成熟的 AI 平臺(tái)有 TensorFlow 及 PyTorch 。

3.3.?dāng)?shù)據(jù)存儲(chǔ)層

數(shù)據(jù)存儲(chǔ)層所有的存儲(chǔ)引擎都基于 Hadoop 的 HDFS 分布式存儲(chǔ),從而達(dá)到數(shù)據(jù)多份冗余和充分利用物理層多磁盤的 I / O 性能。在 HDFS 上分別搭建 Hive 、 HBase 作為存儲(chǔ)數(shù)據(jù)庫(kù),在這兩個(gè)數(shù)據(jù)庫(kù)的基礎(chǔ)上再搭建 Impala 、 Phoenix 、 Presto 引擎。

Hive 為大數(shù)據(jù)廣泛使用的離線數(shù)據(jù)存儲(chǔ)平臺(tái),用于存儲(chǔ)數(shù)據(jù)中臺(tái)的全量數(shù)據(jù),在建模階段可以使用 Hive SQL 、 Spark SQL 進(jìn)行數(shù)據(jù)處理和建模。 HBase 為主流的大數(shù)據(jù) NoSQL ,適合數(shù)據(jù)的快速實(shí)時(shí)讀寫。在實(shí)時(shí)數(shù)據(jù)處理時(shí),可將數(shù)據(jù)實(shí)時(shí)保存到 HBase 中,并且可以從 HBase 中實(shí)時(shí)讀取數(shù)據(jù),從而滿足數(shù)據(jù)的時(shí)效性。 Impala 可以對(duì) Hive 、 HBase 等大數(shù)據(jù)數(shù)據(jù)庫(kù)進(jìn)行準(zhǔn)實(shí)時(shí)的數(shù)據(jù)分析,能滿足對(duì)分析結(jié)果速度有一定要求的場(chǎng)景。

Phoenix 是構(gòu)建在 HBase 上的一個(gè) SQL 層,能讓我們用標(biāo)準(zhǔn)的 JDBC API 而不是 HBase 客戶端 API 來(lái)創(chuàng)建表、插人數(shù)據(jù)和對(duì) HBase 數(shù)據(jù)進(jìn)行查詢。 Presto 是一個(gè)開源的分布式 SQL 查詢引擎,適用于交互式分析查詢。 Presto 支持 Hive 、 HBase 、 MySQL 等多種關(guān)系型和大數(shù)據(jù)數(shù)據(jù)庫(kù)的查詢,并且文持 join 表。對(duì)于對(duì)接自助分析和統(tǒng)一數(shù)據(jù)服務(wù)的場(chǎng)景,可以通過(guò) Presto 來(lái)統(tǒng)一訪問(wèn)具體存儲(chǔ)的數(shù)據(jù)庫(kù),從而達(dá)到語(yǔ)法統(tǒng)一和數(shù)據(jù)源統(tǒng)一。

3.4.?dāng)?shù)據(jù)服務(wù)層

數(shù)據(jù)服務(wù)層采用的技術(shù)與業(yè)務(wù)應(yīng)用類似,主要基于開源 Spring Cloud 、 Spring Boot 等構(gòu)建,使用統(tǒng)一的服務(wù)網(wǎng)關(guān)、低代碼平臺(tái)來(lái)構(gòu)建。



  業(yè)務(wù)實(shí)施流程

需求調(diào)研 →

團(tuán)隊(duì)組建和動(dòng)員 →

數(shù)據(jù)初始化 →

調(diào)試完善 →

解決方案和選型 →

硬件網(wǎng)絡(luò)部署 →

系統(tǒng)部署試運(yùn)行 →

系統(tǒng)正式上線 →

合作協(xié)議

系統(tǒng)開發(fā)/整合

制作文檔和員工培訓(xùn)

售后服務(wù)

馬上咨詢: 如果您有業(yè)務(wù)方面的問(wèn)題或者需求,歡迎您咨詢!我們帶來(lái)的不僅僅是技術(shù),還有行業(yè)經(jīng)驗(yàn)積累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     聯(lián)系人:石先生/雷先生