• 八方資訊網(wǎng)歡迎您!
    八方資訊網(wǎng)>時(shí)尚>正文

    幾年的大數(shù)據(jù)開(kāi)發(fā)經(jīng)驗(yàn),盤(pán)點(diǎn)下那些注意的細(xì)節(jié),避免采坑

    2020-03-26 06:52:27 來(lái)源: 閱讀:

    深深的感受到“細(xì)節(jié)決定成敗”,“蝴蝶效應(yīng)“一句話細(xì)節(jié)體現(xiàn)工作質(zhì)量也體現(xiàn)個(gè)人能力。今天復(fù)盤(pán)回顧一個(gè)個(gè)坑哭的小細(xì)節(jié),更好的迎接未來(lái)挑戰(zhàn)。

    1,窺見(jiàn)數(shù)據(jù)三重門(mén)

    全局著眼,登高望遠(yuǎn),窺見(jiàn)數(shù)據(jù)的三重門(mén):ODS,DW,APP

    每一層的存在分管著不同的數(shù)據(jù)工作,一起探探門(mén)里的細(xì)節(jié),把握清晰的脈絡(luò)。

    ODS層:是關(guān)注用戶重點(diǎn)事務(wù)的原始業(yè)務(wù)表,重在離線統(tǒng)計(jì)用戶細(xì)節(jié)的行為日志表。日志表可以包含業(yè)務(wù)表的相關(guān)數(shù)據(jù),但是缺乏結(jié)構(gòu),需要ETL。

    DW層:將ODS層作為直接的數(shù)據(jù)源,去建設(shè)滿足業(yè)務(wù)分析要求的數(shù)倉(cāng),進(jìn)行基礎(chǔ)整合BAS,然后開(kāi)發(fā)出事實(shí)層/維度層/寬表層。其目的將一大坨數(shù)據(jù)整合分類(lèi),方便快速查詢。

    APP層:是我們熟知的應(yīng)用層,有報(bào)表,數(shù)據(jù)產(chǎn)品,API接口,特征數(shù)據(jù),專(zhuān)題集市,OLAP, 業(yè)務(wù)系統(tǒng)

    三層形成上下游的環(huán)形網(wǎng)絡(luò),缺一不可。從而解耦三者的關(guān)系實(shí)現(xiàn)低耦合高內(nèi)聚任重道遠(yuǎn)。

    2,危險(xiǎn)的金字塔

    三重門(mén)可以拆解成一個(gè)倒立的金字塔,這個(gè)倒立著的金字塔是危險(xiǎn)的,總要一種搖搖欲墜的感覺(jué),需要數(shù)據(jù)攻城獅們殫心竭慮的守護(hù)。

    因?yàn)镺DS數(shù)據(jù)源:業(yè)務(wù)表,埋點(diǎn)日志的采集 兩大源頭,一些細(xì)枝末節(jié)的變動(dòng),牽動(dòng)ODS基礎(chǔ)層,生產(chǎn)一只黑蝴蝶,讓DW/APP層來(lái)一場(chǎng)雪崩。累慘數(shù)據(jù)工程師。

    業(yè)務(wù)表和日志采集:動(dòng)要有原則:

    1,能添加值不要新增列,比如在json類(lèi)型中加值,不要增加額外的列名。

    2,能增加列不要新增一個(gè)表。

    3,能加一個(gè)輔助表,不要重構(gòu)原有表結(jié)構(gòu)。

    4,遵循添值,增列,副表的優(yōu)先集,提前周知變化,早做應(yīng)對(duì)。

    3,動(dòng)一下就是一萬(wàn)年

    數(shù)據(jù)開(kāi)發(fā)的工作流程是這樣的。

    接到一個(gè)數(shù)據(jù)需求,

    第一步,我們要分析需求的合理性,能不能做。

    第二步,我們要怎么做,哪一種方式最合適,安全快速。

    第三步,需要哪些數(shù)據(jù)資源權(quán)限。

    第四步,用SQL實(shí)現(xiàn)出自己的ETL邏輯代碼。

    第五步,測(cè)試自己的邏輯代碼,看看小單位數(shù)據(jù)是否合理。

    第六步,提交審核,生產(chǎn)數(shù)據(jù)(回溯數(shù)據(jù)很慢)。

    其實(shí)在大數(shù)據(jù)量面前,生產(chǎn)數(shù)據(jù)的過(guò)程是漫長(zhǎng)的,需要花費(fèi)很多時(shí)間去等待。

    第五步的測(cè)試極為重要 ,而且需要使用八倍鏡,仔細(xì)推薦,認(rèn)真核對(duì)。

    比如:統(tǒng)計(jì)當(dāng)日支付要看支付時(shí)間不要看下單時(shí)間應(yīng)為下單可以在第二天支付。還有一個(gè)小小“=”號(hào)讓統(tǒng)計(jì)意義南轅北轍。也一定要主要主要表的字段類(lèi)型,不要望文生義,id不一定是數(shù)字。

    第五步一定要多花點(diǎn)時(shí)間反復(fù)校驗(yàn),不要因?yàn)樾〖?xì)節(jié)而花大時(shí)間回溯數(shù)據(jù)。

    4,借助工具

    用IDE 管理自己的ETL代碼,方便查找。

    高亮的語(yǔ)法提示也能更好的發(fā)現(xiàn)細(xì)節(jié)。

    代碼一定有做好格式處理,清晰可讀很重要。

    多寫(xiě)wiki,磨練寫(xiě)作基本功,沉淀常用的數(shù)據(jù)方法。

    工具不要多,兩個(gè)就夠了。

    數(shù)據(jù)倉(cāng)的經(jīng)典模型

    碼字不易,如果您覺(jué)得文章寫(xiě)得不錯(cuò),

    請(qǐng)您 1.關(guān)注作者,您的關(guān)注是我寫(xiě)作的最大動(dòng)力

    2.留下你寶貴的評(píng)論,哪怕一個(gè)字都行!

    3.私信我“大數(shù)據(jù)”

    我將與您分享一套最新的大數(shù)據(jù)學(xué)習(xí)資源和全套開(kāi)發(fā)工具

    本文為企業(yè)推廣,本網(wǎng)站不做任何建議,僅提供參考,作為信息展示!

    推薦閱讀:小米旗艦機(jī)

    網(wǎng)友評(píng)論
    請(qǐng)登錄后進(jìn)行評(píng)論| 0條評(píng)論

    請(qǐng)文明發(fā)言,還可以輸入140

    您的評(píng)論已經(jīng)發(fā)表成功,請(qǐng)等候?qū)徍?/p>

    小提示:您要為您發(fā)表的言論后果負(fù)責(zé),請(qǐng)各位遵守法紀(jì)注意語(yǔ)言文明

    回到首頁(yè) 回到頂部
    八方資訊網(wǎng) 關(guān)于我們| 聯(lián)系我們| 招聘信息| 老版地圖| 網(wǎng)站地圖
    免責(zé)聲明:八方資訊網(wǎng)所有文字、圖片、視頻、音頻等資料均來(lái)自互聯(lián)網(wǎng),不代表本站贊同其觀點(diǎn),本站亦不為其版權(quán)負(fù)責(zé)。相關(guān)作品的原創(chuàng)性、文中陳述文字以及內(nèi)容數(shù)據(jù)龐雜本站無(wú)法一一核實(shí),如果您發(fā)現(xiàn)本網(wǎng)站上有侵犯您的合法權(quán)益的內(nèi)容,請(qǐng)聯(lián)系我們,本網(wǎng)站將立即予以刪除!
    Copyright © 2012-2019 http://www.quan28.cn, All rights reserved.
    主站蜘蛛池模板: 国产精品99久久99久久久| 91精品国产高清久久久久久io| 国产精品成人免费观看| 国产VA免费精品高清在线| 国产精品热久久无码av| 日本aⅴ精品中文字幕| 国产精品三级在线观看无码| 久久国产美女免费观看精品| 天天爽夜夜爽8888视频精品| 一本久久a久久精品综合香蕉| 在线精品亚洲一区二区小说| 无码人妻精品一区二区三区久久| 久久精品国产亚洲av麻豆小说 | 久久久久久一区国产精品| 久久丝袜精品中文字幕| 香蕉久久夜色精品国产小说| 欧美成人精品一区二三区在线观看| 亚洲人成国产精品无码| 国产乱码伦精品一区二区三区麻豆| 久久精品亚洲欧美日韩久久| 麻豆精品久久久一区二区| 久久五月精品中文字幕| 亚洲精品私拍国产福利在线| 99久久精品国产麻豆| 久久精品国产网红主播| 午夜精品一区二区三区免费视频| 久久亚洲av无码精品浪潮| 精品国产日韩亚洲一区| 久久99精品国产自在现线小黄鸭| 久久久久久极精品久久久| 精品国产成人国产在线观看| 国产精品福利在线观看免费不卡 | 国自产精品手机在线观看视频 | 无码国产乱人伦偷精品视频| 亚洲福利精品一区二区三区| 激情亚洲一区国产精品| 国产精品美女久久久免费| 911亚洲精品国内自产| 亚洲精品成人网站在线观看 | 精品午夜福利在线观看| 精品久久久久久无码中文野结衣 |