主頁 >  其他 > 阿里云MaxComputer SQL學習之內置函式

阿里云MaxComputer SQL學習之內置函式

2022-01-25 07:30:05 其他

😸在上一節中,我們學習了MaxComputer SQL的DML語言,并用DataWork給大家演示了一遍,今天我們進入內置函式的學習,這一部分中,我們接觸到的內置函式比較多,大家只要記住一些常用的,其他的函式知道有這么一個功能存在就行,對往期內容感興趣的小伙伴可以參考下面的文章👇:

  • hadoop專題: hadoop系列文章.
  • spark專題: spark系列文章.
  • 阿里云系列: 阿里云MaxComputer SQL學習之DDL.
  • 阿里云系列: 阿里云MaxComputer SQL學習之DML.

👀 今天所有的內置函式依舊會在DataWorks上給大家演示,讓大家了解內置函式的同時,也了解阿里云的大資料平臺,好了,讓我們開啟今日份的學習吧!

目錄

  • 1. 內置函式的內容
  • 2. 測驗資料表的建立
  • 3. 各型別內置函式的介紹
    • 3.1 值函式
      • 3.1.1 數學運算函式
      • 3.1.2 字串處理函式
      • 3.1.3 日期型別函式
    • 3.2 視窗函式
    • 3.3 聚合函式和其他型別的函式
  • 4. 總結
  • 5. 參考資料

1. 內置函式的內容

內置函式主要包括以下幾個部分的函式:

  1. 值函式:數學運算、字串處理、日期處理函式
  2. 視窗函式:常見統計量類、排名類、偏移定位類、分組抽樣類
  3. 聚合函式:常見統計量類、字串類
  4. 其他函式:型別轉換函式、分支判別函式、其他

2. 測驗資料表的建立

依舊是建立一個臨時查詢
在這里插入圖片描述

  • 創建dual表,并插入資料

在這里插入圖片描述

  • 創建實驗測驗表t_dml

在這里插入圖片描述
客戶端上傳資料在這里插入圖片描述
查看資料

在這里插入圖片描述

  • 創建實驗測驗t_product表(程序同上)

在這里插入圖片描述

  • 創建實驗測驗t_sign表

在這里插入圖片描述
下面的演示階段

3. 各型別內置函式的介紹

3.1 值函式

3.1.1 數學運算函式

在這里插入圖片描述
實驗

1.已知三角形兩邊長度為10,20,夾角為60度,求三角形面積?
在這里插入圖片描述

2.對數字進行加工處理,請分別顯示數字 3.1415926 的向上取整值、向下取整值、四舍五入保留3位小數的值、截掉小數位的值以及用二進制來表示該值,在這里插入圖片描述

3.隨機函式
在這里插入圖片描述

3.1.2 字串處理函式

在這里插入圖片描述
實驗

1.查看欄位字符、位元組長度
在這里插入圖片描述

2.查找目前銷售記錄中,哪些省、市名字比較接近?
在這里插入圖片描述

3.目前銷售記錄中,省份的第一個字在城市名中是否出現?有沒有出現多次的?
在這里插入圖片描述

4.要把資料從一個編碼為 utf8 的庫匯入到一個字符集為 gb2132 的庫中,其中有些繁體字,如“阿裏雲”等字樣,請問會出現亂碼的情況嗎?
在這里插入圖片描述

5.拼接字符,將省和市拼接起來,并用‘|’隔開
在這里插入圖片描述

3.1.3 日期型別函式

在這里插入圖片描述
實驗

1.日期獲取:根據日期,截取部分資訊,截取年、月、日、時、分、秒
在這里插入圖片描述

2.日期截取,截取天
在這里插入圖片描述

3.獲得具體日期
在這里插入圖片描述
4.字串轉成日期, 日期轉換成字串
在這里插入圖片描述

5.Unix時間和ODPS時間互轉
在這里插入圖片描述

6.判斷字串是否滿足預定義的日期格式
在這里插入圖片描述

7.日期運算:統計5月1日從產品5第一次成交后一小時三十分鐘內(含),產品5銷量(含第一次成交)占同期總銷量的比例:
在這里插入圖片描述

8.日期相減
在這里插入圖片描述

3.2 視窗函式

在這里插入圖片描述
實驗

1.根據5月份銷售資料,統計出日銷量波動最小的產品(即標準差最小),
在這里插入圖片描述

2.根據5月份銷售資料,統計出同一產品成交最短時間間隔(以產品1為例,列出出兩次成交時間差最小的記錄),
在這里插入圖片描述

3.3 聚合函式和其他型別的函式

在這里插入圖片描述
實驗

1.給出銷售資訊表t_dml中的不同產品的銷售金額的基本統計資訊,
在這里插入圖片描述

2.將產品標稱單價在50-100元的,生成一個清單,不同產品名稱之間用|分隔開,
在這里插入圖片描述

3.COALESCE 處理NULL值:將 t_sign 中的名字(name)和生日(birth_day)拼成一個串
在這里插入圖片描述

4.decode 分支函式:將銷售記錄t_dml中浙江、上海和北京的銷量單獨統計出來:(實作if else的分支功能)
在這里插入圖片描述

5.sample 采樣函式:通過采樣分析的手段,從銷售記錄表t_dml中得到1/100的資料,分析采樣樣本,試著推斷總體的銷售金額的平均值、標準差、極值、極差等,然后從總體中計算出這些統計量進行驗證,調整采樣比例,重復上述推斷程序,找到一個準確程度和樣本體量的平衡點,進一步思考:這個平衡點有多大參考價值?(100份取一份,)
在這里插入圖片描述

4. 總結

在這些函式中,我的實驗部分使用的都是比較常用的函式,足以應付大多數的開發任務,如果上述函式滿足不了業務需求,可以嘗試自己撰寫函式,我們這里主要要記住以下部分

  • 平均值、最大最小值、常用的計算
  • 日期格式轉換、相加減
  • 磁區排序
  • 字串處理空值、截取字符、處理正則等

5. 參考資料

《阿里云全球培訓中心》
《阿里云DataWorks使用手冊》

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/420480.html

標籤:其他

上一篇:年終獎領完想跳槽?先看看這份程式員薪資調查報告吧

下一篇:返回列表

標籤雲
其他(135983) Python(24228) JavaScript(15073) Java(14739) C(11147) 區塊鏈(8215) AI(6935) 基礎類(6313) MySQL(5230) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4207) Linux(4118) PHP(3814) C#(3716) 爪哇(3561) html(3374) C語言(3288) C++語言(3117) sql(3024) R(2776) 熊猫(2774) Java相關(2746) 数组(2739) 疑難問題(2699) 反应(2482) 單片機工控(2479) css(2105) 数据框(1968) Web開發(1951) 节点.js(1938) VBA(1919) 網絡通信(1793) 蟒蛇-3.x(1774) 數據庫相關(1767) VB基礎類(1755) .NETCore(1671) ASP.NET(1650) 開發(1646) 系統維護與使用區(1617) C++(1582) 列表(1581) 基礎和管理(1579) json(1568) JavaEE(1566) 安卓(1523) HtmlCss(1519) 專題技術討論區(1515) Windows客戶端使用(1484) 扑(1469) iOS(1432) 查询(1408) .NET技术(1404) 打字稿(1376) Unity3D(1366) VCL組件開發及應用(1353) sql-server(1287) Qt(1283) 细绳(1226) HTML(CSS)(1220)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 阿里云MaxComputer SQL學習之內置函式

    ????在上一節中,我們學習了MaxComputer SQL的DML語言,并用DataWork給大家演示了一遍,今天我們進入內置函式的學習,這一部分中,我們接觸到的內置函式比較多,大家只要記住一些常用的,其他的函式知道有這么一個功能存在就行,對往期內容感興趣的小伙伴可以參考下面的文章????:hadoop專題: hadoop系列文章.spark專題: spark系列文章.阿里云系列: 阿里云MaxComputer SQL學習之DDL.阿里云系列: 阿里云MaxComputer SQL學習之DML....

    uj5u.com 2022-01-25 07:30:05 more
  • 年終獎領完想跳槽?先看看這份程式員薪資調查報告吧

    前言隨著 AI、大資料、云計算、5G 技術的成熟,各類技術人才成為各大行業爭奪重點。據相關資料顯示,大資料方面人才的需求,66% 來自于資訊技術行業,其他需求來源,則分布于智能制造、金融、地產、現代服務業等行業,且這部分需求有進一步增加的趨勢。過去的 2021 年,IT 技術崗位當中什么崗位最受歡迎?各崗位的薪資水平如何呢?你目前的薪資處于什么級別?有沒有技術含量低但高薪的職位呢?各類程式員崗位薪酬漲幅明顯與 2020 年平均薪酬相比,2021 年程式員崗位則是 1-3 年、3-5 年 及 5-1...

    uj5u.com 2022-01-25 07:28:02 more
  • spark技術學習與思考(sparkcore&sparksql)

    Spark 產生之前,已經有 MapReduce 這類非常成熟的并行計算框架存在了,并提供了高層次的API(map/reduce),它在集群上進行計算并提供容錯能力,從而實作分布式計算。所以為什么 spark 會流行呢?...

    uj5u.com 2022-01-25 07:26:53 more
  • Java開發之實時計算--Flink

    簡介介紹計算框架對java開發的重要性介紹flink的架構介紹flink的基本概念:常用算子、checkpoint、state、window介紹flink的編程模型:DataStream、DataSet、Table API、SQL介紹flink的部署計算框架每個Java開發一定要懂至少一個流行的計算框架,因為現在的資料量越來越大,光靠資料庫或者手寫代碼去實作難度已經越來越大,不僅涉及到資源調度,還要考慮分布式,并且還要考慮高可用、容錯等等,因此我們需要借助現有的分布式計算框架來實作我們大規...

    uj5u.com 2022-01-25 07:25:33 more
  • ElasticSearch

    介紹了ElasticSearch的基本概念,以及相關使用,并結合專案中的業務進行了總結。...

    uj5u.com 2022-01-25 07:25:08 more
  • hive中多表full join主鍵重復問題

    目錄0. 其他1. 問題描述2. 問題復現2.1. 建表陳述句2.2. 插入資料2.3. 查詢SQL以及問題3. 問題原因4. 問題解決0. 其他1. 問題描述在Hive中(其他類似SQL,比如PostgreSQL可能也存在此問題),當對多張表(3張及以上)進行full join時,會存在每張表的主鍵都是唯一,但當full join后,會發現主鍵可能有重復。2. 問題復現2.1. 建表陳述句create table realtime_dw......

    uj5u.com 2022-01-25 07:24:53 more
  • RabbitMQ 超詳細入門篇

    RabbitMQ 入門篇????MQ 的基本概念:什么是 MQ ?MQ全稱為Message Queue即訊息佇列"訊息佇列" 是在訊息的傳輸程序中保存訊息的容器它是典型的:生產者————消費者模型生產者不斷向訊息佇列中生產訊息 ———————— 消費者不斷的從佇列中獲取訊息.這樣的好處: 生產者只需要關注發訊息,消費者只需要關注收訊息,二者沒有業務邏輯的侵入,這樣就實作了生產者和消費者的解耦.為什么要使用 MQ?或者說MQ 有什么好處,MQ 主要可以實作三種功能:服務解耦...

    uj5u.com 2022-01-25 07:23:56 more
  • 九章云極DataCanvas公司榮獲機器之心三大獎項,助力產業數智化升級

    近日,國內領先的前沿科技媒體和產業服務平臺機器之心發布了「AI 中國」機器之心 2021 年度榜單。九章云極DataCanvas公司憑借在人工智能領域優秀的技術、豐富的AI解決方案、智能化場景的創新應用以及適合國內市場的商業模式,入選 “最佳人工智能公司 TOP 30”、“最具商業價值解決方案TOP30”、“最具創新價值落地案例TOP30”。圖片來源:機器之心作為人工智能技術及產業發展的風向標,機器之心「AI中國」年度評選自2017年設立,已連續舉辦5屆,成為國內人工智能界的權威年度獎項之一。本次榜單...

    uj5u.com 2022-01-25 07:22:09 more
  • 2021—很有意義的一年

    最大的改變2021年,對于我來說,最大的改變應該就是有在努力想要提高自己的溝通能力。我的溝通能力和表達能力對于我來說,就是一個永遠搬不動的大山,擋在我前進的路上。其實,我知道自己的弱點,也想要改變,但是就是不付諸行動,也不知咋改變這種現狀。直到離開學校,開始步入社會,進入了一個完全陌生的圈子。很慶幸的是,遇到了一個特別好的導師,他給了我很多的幫助,給我提了很多建議,不管是作業上、生活上、還是人生發展,都是很寶貴的建議。由于我的性格,我有時候不敢在群里發言,導師經常鼓勵我要多在群上發言,這樣可以克服交流的...

    uj5u.com 2022-01-25 07:21:57 more
  • Centos7下安裝Jdk1.8

    Centos7下安裝Jdk1.8官網下載jdk-8u202-linux-x64.tar.gz下載后使用檔案傳輸工具SecureFX上傳服務器/opt/software目錄。(這里是在/opt/目錄下創建了software、module檔案夾)# 解壓包存放目錄$ mkdir -p /opt/module# 壓縮包存放目錄$ mkdir -p /opt/software查看當前linux是否裝有java$ java -version如果有則卸載原裝版本java#查看和ope...

    uj5u.com 2022-01-25 07:21:48 more