主頁 > 後端開發 > R語言資料繪圖學習(0x01)-安裝ggplot2與嘗試

R語言資料繪圖學習(0x01)-安裝ggplot2與嘗試

2023-05-13 07:41:55 後端開發

0x01 安裝與R基礎

一直聽說資料分析里R語言是比較‘正統’,況且久聞ggplot2這些R語言的資料分析庫大名,想到今后資料分析和整理的需要,這里開一個簡單的系列學習一些R語言和ggplot2的繪圖基礎,本人學習的書籍是Winston Chang大佬的《R Graphics Cookbook》,且稍有一點Python里的Plotnine繪圖基礎,但我算是R語言小白,所以整個系列也可以記錄自己學習遇到的坑,供大家參考,

庫安裝

我使用的R版本為3.6.3,需要下載的庫包括ggplot2,gcookbook和dplyr庫,可以使用如下的安裝指令:

install.packages("ggplo2")
install.packages("dplyr")
install.packages("gcookbook")

如果遇到了installation of package ‘ggplot2’ had non-zero exit status類似的問題,可以指定安裝程式強制安裝二進制檔案[1],如

install.packages("ggplo2", type = "binary")

R語言資料處理基礎

首先簡單介紹資料輸入常用的兩種方法,一種是CSV資料,我們可以采用函式read.csv(file, args)輸入;另一種常用資料EXCEL資料可以使用read_excel(file)函式輸入資料,

dplyr包(magrittr包)提供了一種運算子%>%,可以在R中實作類似連續函式呼叫的編程方法,以嵌套函式f,g,h為例:

h(g(f(x)))

# 等價于
x %>% 
  f() %>% 
  g() %>% 
  h()

這樣的函式呼叫相比嵌套函式更加直觀,尤其是在多個連續的資料集處理場合,

基礎繪圖以及概念

散點圖和完整流程

繪制圖片使用的資料集為mtcars:

mtcars %>% head()
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

在開始繪圖之前,有一點基本的R語言基礎設施需要準備,R語言畫圖需要有基礎的畫布,可以用dev.new()函式來開啟一個新的畫布(如果是windows系統需要使用windows()函式),

dev.new()
# windows() # windows系統使用

下面直接展示最簡單的散點圖繪制代碼:

p <- ggplot(mtcars, aes(x = wt, y = mpg)) +
  geom_point()

上面的代碼就是一個使用ggplot2繪圖的最基本結構,ggplot函式是保存資料集和映射資訊(aes)等基本資訊的繪圖主函式,也可以理解為存盤所有資訊的畫布底層,第一個引數放入資料集,后續的映射都在此資料集上進行,本例中就是使用了mtcars中的wt列作為x,mpg列作為y值,ggplot2中的函式基本均是加法進行組合,所以這里加上了geom_point函陣列合進繪圖,此時geom_point函式通過ggplot函式可以得知其繪圖需要用到的鍵資訊(x, y)分別對應的資料值,代碼運行結果如下:

繪制完圖后,可以選擇print(p)來查看圖片并保存,或者使用ggplot2自帶的函式ggsave來保存圖片,基本的格式例如png,pdf等都有[2],

ggsave(p, "p.png")

如果想要繪圖的資料不屬于同一個data frame,那么可以不指定ggplot函式的資料項,在aes映射中直接定義,如下所示:

ggplot(data=https://www.cnblogs.com/medianet-ytc/archive/2023/05/13/null, aes(x = mtcars$wt, y = mtcars$mpg))

其他基本繪圖與基礎

下面的代碼展示了R語言繪制線形圖的基本函式geom_line,同時展示了ggplot2通過組合函式geom_line和geom_point來繪圖的基本邏輯:

p <- ggplot(pressure, aes(x = temperature, y = pressure)) +
  geom_line() +
  geom_point()

對于柱形圖,ggplot2的相關支持比較多,這里展示最基礎的兩種,一個是geom_bar函式:

p <- ggplot(mtcars, aes(x = factor(cyl))) +
  geom_bar()

這里有一個新的函式factor,這個函式是將資料列變化為因子,體現在圖上類似于將連續變數轉化為了離散的變數,可以看到,上述的映射資訊中不包括y值,這是因為geom_bar函式默認的運作方式count,也就是統計x的出現次數并繪圖,相當于geom_bar(stat="count"),其中stat選項是統計函式的意思,如果需要繪制具體數值類似y值的柱形圖就需要用到下一個函式了,
第二個柱形圖的函式是geom_col函式:

p <- ggplot(BOD, aes(x = factor(Time), y = demand)) +
  geom_col()

其實geom_col的效果與geom_bar(stat="identity")是一致的,這樣就能隨心所欲的繪制柱形圖了,

下面的代碼示例展示了繪制和柱形圖很像的直方圖的案例:

p <- ggplot(mtcars, aes(x = mpg)) +
  geom_histogram(binwidth = 3)
直方圖也是默認的頻率統計,這里略微調整了引數binwidth來放大每個直方的寬度,

下面的代碼展示了如何繪制箱型圖的例子:

p <- ggplot(ToothGrowth, aes(x = interaction(supp, dose), y = len)) +
  geom_boxplot()
上面除了基本代碼還用到了interaction函式,用于組合變數,類似cross join的結果,

除開這些基本繪圖,數學函式的繪制也比較容易:

# 自定義函式
myfun <- function(xvar) {
  1 / (1 + exp(-xvar + 10))
}

p <- ggplot(data.frame(xdata = https://www.cnblogs.com/medianet-ytc/archive/2023/05/13/c(0, 20)), aes(x = xdata)) +
stat_function(fun = myfun, geom ="line")
上面的代碼首先定義了一個簡單的函式,然后將函式作為自定義統計函式stat_function的fun引數輸入,并選擇繪圖方式為line,這樣就可以得到一條函式曲線,

總結

本節主旨在于R語言ggplot2繪圖的初探,熟悉基本的繪圖模式,后續將會一一展開學習庫中的繪圖細節,完善繪圖質量,

參考資料:

[1] 解決R包“had non-zero exit status”安裝報錯,
[2] ggplot2圖片保存

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/552315.html

標籤:其他

上一篇:python高級技術(行程二)

下一篇:返回列表

標籤雲
其他(158928) Python(38129) JavaScript(25420) Java(18034) C(15226) 區塊鏈(8265) C#(7972) AI(7469) 爪哇(7425) MySQL(7179) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5339) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1972) 功能(1967) Web開發(1951) HtmlCss(1936) python-3.x(1918) C++(1915) 弹簧靴(1913) xml(1889) PostgreSQL(1875) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • R語言資料繪圖學習(0x01)-安裝ggplot2與嘗試

    0x01 安裝與R基礎 一直聽說資料分析里R語言是比較‘正統’,況且久聞ggplot2這些R語言的資料分析庫大名,想到今后資料分析和整理的需要,這里開一個簡單的系列學習一些R語言和ggplot2的繪圖基礎。本人學習的書籍是Winston Chang大佬的《R Graphics Cookbook》,且 ......

    uj5u.com 2023-05-13 07:41:55 more
  • python高級技術(行程二)

    一 行程物件及其他方法 '''一臺計算機上面運行著很多行程,那么計算機是如何區分并管理這些行程服務端的呢?計算機會給每一個運行的行程分配一個PID號如何查看 windows電腦 進入cmd輸入tasklist即可查看 tasklist|findstr PID查看具體的行程 linux電腦 進入終端之 ......

    uj5u.com 2023-05-13 07:36:35 more
  • 使用 IDEA 時突然斷電導致 git 本地分支損壞的解決方案

    使用IDEA提交專案的時候突然斷電,重啟后專案 git 損壞,所有檔案變成了 untracked,IDEA 界面上表示為所有檔案名變成綠色,并且無法 pull (也可能是無法 push) 提示 Git Pull Failed From http://***************** * branc ......

    uj5u.com 2023-05-13 07:24:33 more
  • Spring AOP 分享

    初級篇 AOP是什么? Aspect-oriented Programming (AOP) 即面向切面編程。簡單來說,AOP 是一種編程范式,允許我們模塊化地定義橫跨多個物件的行為。AOP 可以幫助我們將應用程式的關注點分離,使得代碼更加清晰、易于維護和擴展。 大白話:在方法執行前后運行指定代碼,比 ......

    uj5u.com 2023-05-13 07:22:03 more
  • 閱讀論文的方法和技巧(快速且有效)

    如何從一個小白快速開始入手看論文,然后看論文,發論文。請仔細看下面的講解。歡迎大家一起交流和補充。 閱讀論文的方法和技巧 一.閱讀論文五個重要步驟(通常用時30-60分鐘) 1.第一遍是快速瀏覽論文的摘要、結論、框架圖,有助于把握核心,對論文的內容形成整體感知。(5-10分鐘) 當然,這一遍建議在網 ......

    uj5u.com 2023-05-12 10:48:00 more
  • Java的列舉型別

    如果類的物件的數量只有有限個,并且可以確定物件的屬性,那么考慮使用列舉類。所有的列舉型別都是 Enum 類的子類。它們繼承了這個類的許多方法。 ......

    uj5u.com 2023-05-12 10:47:56 more
  • 閱讀論文的方法和技巧(快速且有效)

    如何從一個小白快速開始入手看論文,然后看論文,發論文。請仔細看下面的講解。歡迎大家一起交流和補充。 閱讀論文的方法和技巧 一.閱讀論文五個重要步驟(通常用時30-60分鐘) 1.第一遍是快速瀏覽論文的摘要、結論、框架圖,有助于把握核心,對論文的內容形成整體感知。(5-10分鐘) 當然,這一遍建議在網 ......

    uj5u.com 2023-05-12 10:47:13 more
  • Java的列舉型別

    如果類的物件的數量只有有限個,并且可以確定物件的屬性,那么考慮使用列舉類。所有的列舉型別都是 Enum 類的子類。它們繼承了這個類的許多方法。 ......

    uj5u.com 2023-05-12 10:46:48 more
  • 高效c語言2物件、函式和型別

    本章中,你將學習物件、函式和型別。我們將研究如何宣告變數(有識別符號的物件)和函式,獲取物件的地址,并對這些物件指標的解參考。你已經看到了C語言程式員可用的一些型別, C語言中的型別不是物件就是函式。 物件、函式、型別和指標 物件是你可以表示數值的存盤。準確地說,C標準(ISO/IEC 9899:20 ......

    uj5u.com 2023-05-12 08:05:02 more
  • Fast-GRPC: 用python輕松開發grpc介面

    簡介 Fast-GRPC 旨在幫助開發者更加輕松快捷地使用 Python 開發 gRPC 介面。它的特點包括簡化步驟、簡單上手、快速開發,同時支持異步和同步代碼,以及支持 middleware,靈感來自FastAPI。 安裝 需要python 3.7+ pip install python-fast ......

    uj5u.com 2023-05-12 08:04:58 more