mmdd縮寫(xiě)是什么意思,mmdd的全稱(chēng)及含義,mmdd全稱(chēng)意思大全
mmdd縮寫(xiě)是什么意思
MMDD英文含義
1、MMDD的英文全稱(chēng):Multi-Media Domain Development | 中文意思:───多媒體領(lǐng)域的發(fā)展
2、MMDD的英文全稱(chēng):2 Digit Month, 2 Digit Day | 中文意思:───2位月2位日
3、MMDD的英文全稱(chēng):Maximum Modified Dry Density | 中文意思:───最大干密度
4、MMDD的英文全稱(chēng):Medical Manuals and Documents Division | 中文意思:───醫療手冊和文件司
5、MMDD的英文全稱(chēng):Misma Mierda Distinto Día | 中文意思:───親自媽淸晰的DÍA
hadoop表名規則?
在Hadoop中,表名的命名規則應該遵循以下幾點(diǎn):
1.表名應該簡(jiǎn)明扼要,能夠準確描述表的內容;
2.表名應該用小寫(xiě)字母,并且單詞之間用下劃線(xiàn)分隔;
3.表名應該避免使用特殊字符或空格,以免造成命名沖突或錯誤;
4.表名的長(cháng)度應該不超過(guò)50個(gè)字符,以保證表名的可讀性和易于管理。在實(shí)際應用中,我們應該根據具體需求和數據特點(diǎn),合理命名表名,以方便后續的數據處理和管理。
hadoop表名規則?
為了避免底層業(yè)務(wù)變動(dòng)對上層需求影響過(guò)大,屏蔽底層復雜的業(yè)務(wù)邏輯,盡可能簡(jiǎn)單、完整的在接口層呈現業(yè)務(wù)數據,建設高內聚松耦合的數據組織,使數據從業(yè)務(wù)角度可分割,顯得尤為重要。從整個(gè)集團業(yè)務(wù)條線(xiàn)出發(fā),形成數據倉庫總體概念框架,并對整個(gè)系統所需要的功能模塊進(jìn)行劃分,明確各模塊技術(shù)細節,建設一套完整的開(kāi)發(fā)規范。
分層規范
ODS(原始數據層):也被稱(chēng)為貼源層,ODS層是數據倉庫準備區,為DWD層提供基礎原始數據。
DWD(明細數據層):和ODS粒度一致的明細數據,對數據進(jìn)行去重,臟數據過(guò)濾,空處理,保證數據質(zhì)量。
DWS(服務(wù)數據層):輕度匯總數據及建寬表(按主題)存放數據。
ADS(應用數據層):存放應用類(lèi)表數據。
ODS - DWD - DWS - ADS
ODS - DW(輕度數據匯總層、高度數據匯總層) - DM(數據集市)
表規范
命名
維表 命名形式:dim_描述
事實(shí)表 命名形式:fact_描述_[AB]
臨時(shí)表 命名形式:tmp_ 正式表名_ [C自定義序號]
寬表 命名形式:dws_主題_描述_[AB]
備份表 命名形式:正式表名_bak_yyyymmdd
表命名解釋?zhuān)?/p>
1)表名使用英文小寫(xiě)字母,單詞之間用下劃線(xiàn)分開(kāi),長(cháng)度不超過(guò)40個(gè)字符,命名一般控制在小于等于6級。
2)其中ABC第一位"A"時(shí)間粒度:使用"c"代表當前數據,"h"代表小時(shí)數據,"d"代表天數據,"w"代表周數據,"m"代表月數據,"q"代表季度數據, "y"代表年數據。
3)其中ABC的第二位"B"表示對象屬性,用"t"表示表,用"v"表示視圖。
4)其中ABC的第三位"C"自定義序號用于標識多個(gè)臨時(shí)表的跑數順序。
注釋
注釋要結合表的英文名,要求注釋簡(jiǎn)潔明了,體現出表的業(yè)務(wù)出處、主題和用途。
存儲格式
所謂的存儲格式就是在Hive建表的時(shí)候指定的將表中的數據按照什么樣子的存儲方式,如果指定了方式,那么在向表中**入數據的時(shí)候,將會(huì )使用該方式向HDFS中添加相應的數據類(lèi)型。在數倉中建表默認用的都是PARQUET存儲格式,相關(guān)語(yǔ)句如下所示:
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
字符集
Hadoop和hive 都是用utf-8編碼的,在建表時(shí)可能涉及到中文亂碼問(wèn)題,所以導入的文件的字符編碼統一為utf-8格式。
約定
理論上在數倉落地的表不應該出現null未知類(lèi)型,對于可能出現null的字段,如果為字符型統一為空字符串,如果是數值則給0。
字段規范
命名
1)使用英文小寫(xiě)字母,單詞之間用下劃線(xiàn)分開(kāi),長(cháng)度不超過(guò)30個(gè)字符,命名一般控制在小于等于4級;
2)和源數據ods層表字段名一致,如為新增字段,盡量言簡(jiǎn)意賅;
3)英文名盡量專(zhuān)業(yè),符合業(yè)界要求,不得使用漢語(yǔ)拼音;
4)盡量避免使用關(guān)鍵字。如無(wú)法避免,使用”`”轉義;
5)指標字段能使用縮寫(xiě)的盡量使用統一的縮寫(xiě),如申請金額統計apply_amt_sum。
注釋
注釋本著(zhù)簡(jiǎn)潔、詳實(shí)、完整的原則,對于有業(yè)務(wù)含義的字段,在注釋中需要枚舉并解釋其業(yè)務(wù)含義,如ods_loan_apidata_order_info.order_status 訂單狀態(tài):1待支付,2支付不成功,3支付成功;
類(lèi)型
日期時(shí)間等格式統一用string類(lèi)型,字符串也是用string,數值的話(huà),會(huì )根據字段定義來(lái)確定,對于有小數點(diǎn)要求的,比如某些金額、利率,需要用到decimal類(lèi)型,無(wú)小數點(diǎn)要求的用浮點(diǎn)類(lèi)型double和整數類(lèi)型(int,bigint)。
代碼規范
sql編碼
1)關(guān)鍵字右對齊,代碼注釋詳盡,查詢(xún)字段時(shí)每行不超過(guò)三個(gè)字段,縮進(jìn)時(shí)空四格等相關(guān)書(shū)寫(xiě)規范。
2)明細數據層依賴(lài)于ods層,應用數據層依賴(lài)于服務(wù)數據層,原則上,不允許跨層查詢(xún)。
3)如果SQL語(yǔ)句連接多表時(shí),應使用表的別名來(lái)引用列。
4)WHERE條件中參數與參數值使用的類(lèi)型應當匹配,避免進(jìn)行隱式類(lèi)型轉化。
5)在SELECT語(yǔ)句中只獲取實(shí)際需要的字段。
shell腳本
調度腳本主要是通過(guò)跑shell腳本,shell腳本的注意點(diǎn):
1)命名與所跑的目標表名相同,注釋要完善,后綴以.sh結尾。
2)腳本頭需要加上分割線(xiàn)、作者、日期、目的、描述等信息。
版權聲明: 本站僅提供信息存儲空間服務(wù),旨在傳遞更多信息,不擁有所有權,不承擔相關(guān)法律責任,不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責。如因作品內容、版權和其它問(wèn)題需要同本網(wǎng)聯(lián)系的,請發(fā)送郵件至 舉報,一經(jīng)查實(shí),本站將立刻刪除。