主頁 > 後端開發 > 【pandas基礎】--資料修改

【pandas基礎】--資料修改

2023-05-16 19:20:12 後端開發

pandas 作為一種常用的資料分析工具,提供了廣泛的資料修改方法,
既可以針對或者的資料進行修改,也可以對具體單個元素進行修改,還可以基于條件選擇要修改的或者的資料,

1. 增加資料

1.1 增加行資料

pandasDataFrame增加一行或者多行資料之前是使用append方法,

import pandas as pd

df = pd.DataFrame(columns=["name", "age", "gender"])
df = df.append(
    [
        {"name": "小紅", "age": 13, "gender": "女"},
        {"name": "小明", "age": 15, "gender": "男"},
    ],
    ignore_index=True,
)
df

image.png
使用append方法會有FutureWarning警告,說明append方法以后會被淘汰,不建議使用此方法來增加資料,

建議使用的方法是 concat
當兩個DataFrame列相同的時候,通過concat可以其中一個DataFrame的行添加到另一個DataFrame中,

import pandas as pd

df = pd.DataFrame(columns=["name", "age", "gender"])
new_data = https://www.cnblogs.com/wang_yb/archive/2023/05/16/pd.DataFrame(
    {"name": ["小紅", "小明"],
        "age": [13, 15],
        "gender": ["男", "女"],
    }
)
df = pd.concat([df, new_data[:1])
df

image.png

1.2 增加列資料

增加列資料用insert方法,insert方法有關鍵引數有三個:

  1. loc:列插入的位置,從0開始
  2. column:列名稱
  3. value:插入的值
import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明"],
        "age": [13, 15],
        "gender": ["男", "女"],
    }
)
df.insert(3, "score", [100, 95])
df

image.png

如果想把新的列插入到前面,修改insert方法的第一個引數,

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明"],
        "age": [13, 15],
        "gender": ["男", "女"],
    }
)
df.insert(1, "score", [100, 95])
df

image.png

此外,前面增加行資料concat方法也可以增加列資料,按列添加時,設定axis=1

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明"],
        "age": [13, 15],
        "gender": ["男", "女"],
    }
)
new_data = https://www.cnblogs.com/wang_yb/archive/2023/05/16/pd.DataFrame({"score": [100, 95]})
df = pd.concat([df, new_data], axis=1)
df

image.png

2. 洗掉資料

洗掉資料使用drop方法,drop方法的axis引數控制洗掉行還是列,

2.1 洗掉行

洗掉單行:

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)

df.drop(1, axis=0)

image.png

洗掉多個行:

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)

df.drop([0, 2], axis=0)

image.png

2.2 洗掉列

洗掉單個列:

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)
df.drop("age", axis=1)

image.png

洗掉多個列:

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)
df.drop(["age", "gender"], axis=1)

image.png

3. 修改資料

修改資料既可以使用之前介紹過的lociloc方法,也可以通過條件過濾出需要修改的值,
這里再次提醒下lociloc的區別:

  1. loc使用標簽,iloc使用索引
  2. loc的行和列的標簽是包含端點的,iloc的行和列的索引是不包含端點

3.1 單個資料修改

通過loc或者iloc定位到具體的元素,然后修改,

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)
df.loc[0, "name"] = "小黃"
# OR df.iloc[0, 0] = "小黃"

image.png

3.2 多個資料修改

通過loc或者iloc定位多個行和列,然后修改,

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)

df.loc[0:1, "age"] = 18
# OR df.iloc[0:2, 1] = 18

image.png

3.3 按條件修改

loc或者iloc也可以設定條件來過濾出要修改的資料,

import pandas as pd

df = pd.DataFrame(
    {
        "name": ["小紅", "小明", "小華"],
        "age": [13, 15, 14],
        "gender": ["男", "女", "男"],
    }
)

df.loc[df["age"] > 13, "age"] = 20
# OR df.iloc[df["age"] > 13, 1] = 20

image.png

4. 總結回顧

資料分析中,調整資料的值來試驗分析結果的變化情況是很常見的操作,

本篇主要介紹了資料修改的常用方法,從行列的修改到單個元素的修改,以及按照條件修改資料,
熟練掌握上面介紹的方法,讓我們在資料分析中更好的掌控自己的資料,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/552619.html

標籤:其他

上一篇:java例外處理

下一篇:返回列表

標籤雲
其他(159139) Python(38143) JavaScript(25431) Java(18048) C(15227) 區塊鏈(8267) C#(7972) AI(7469) 爪哇(7425) MySQL(7191) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1975) 功能(1967) Web開發(1951) HtmlCss(1937) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1877) .NETCore(1861) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • 【pandas基礎】--資料修改

    pandas 作為一種常用的資料分析工具,提供了廣泛的資料修改方法。 既可以針對行或者列的資料進行修改,也可以對具體單個元素進行修改,還可以基于條件選擇要修改的行或者列的資料。 1. 增加資料 1.1 增加行資料 pandas的DataFrame增加一行或者多行資料之前是使用append方法。 im ......

    uj5u.com 2023-05-16 19:20:12 more
  • java例外處理

    java例外處理 軟體程式在運行程序中,可能出現意外(Exception),運行中不期而至的問題。 檢查性例外:用戶錯誤或問題引起的例外,程式員無法預見的 運行時例外:可能被程式員避免的例外,可以在編譯時被忽略 錯誤:錯誤不是例外,而是脫離程式員控制的問題。錯誤在代碼中通常被忽略。例如堆疊溢位 jav ......

    uj5u.com 2023-05-16 19:20:06 more
  • Python多執行緒爬取鏈家房源,保存表格,實作資料可視化分析!

    使用Python來爬取二手房源資料,并保存表格,實作資料分析! 軟體環境 Python 3.8 Pycharm 代碼展示 模塊 # 資料請求模塊 --> 第三方模塊, 需要安裝 pip install requests import requests # 決議資料模塊 --> 第三方模塊, 需要安裝 ......

    uj5u.com 2023-05-16 19:19:45 more
  • Spring原始碼:Bean生命周期(五)

    在今天的文章中,我們將深入探討 Bean 的屬性注入和初始化流程,從而使其成為一個真正意義上的 Bean。這個程序包括屬性注入、Aware 介面回呼、BeanPostProcessor 的前置和后置處理等多個步驟,通過本文的學習,讀者將能夠更深入地了解 Spring 框架中 Bean 的屬性注入和初... ......

    uj5u.com 2023-05-16 19:19:16 more
  • Java網路編程----通過實作簡易聊天工具來聊聊BIO

    IO模型即輸入輸出模型,我們今天主要來聊的是java網路編程中的IO模型 BIO模型。BIO即阻塞式IO,Blocking IOblocking [?bl?k??] v. 堵塞; 阻塞; 堵住(某人的路等); 擋住(某人的視線等); 妨礙; 阻礙;那究竟什么是阻塞呢?這里的阻塞和多執行緒并發控制中,對 ......

    uj5u.com 2023-05-16 19:05:19 more
  • python 基礎教程:使用jieba庫對文本進行分詞

    一、jieba庫是什么? Python的jieba庫是一個中文分詞工具,它可以將一段中文文本分割成一個一個的詞語,方便后續的自然語言處理任務,如文本分類、情感分析等。jieba庫使用了基于前綴詞典的分詞方法,能夠處理中文的各種復雜情況,如歧義詞、新詞等。它還提供了多種分詞模式,如精確模式、全模式、搜 ......

    uj5u.com 2023-05-16 19:05:12 more
  • Java入門8(Comparator比較器,HashMap)

    comparator比較器 ? Comparator不同于Comparable,使用更加的靈活,可以在不同場景下使用比較器,實際開發中,更推薦comparator比較器 // 新建一個學生類,作為栗子 public class Student { private int sno; private f ......

    uj5u.com 2023-05-16 19:04:44 more
  • Celery入坑記錄

    1. 前言 最近需要用到Celery,初步學習了一下,但是遇到了一些問題,被搞的心力交瘁。。。,在此記錄下。 環境說明:win11 + python3.11 + celery5.2.7 + redis 2. 問題 2.1 學習檔案的選擇 剛開始在Eege直接搜索celery結果排在最前面的是10年前 ......

    uj5u.com 2023-05-16 18:20:27 more
  • 【pandas基礎】--資料修改

    pandas 作為一種常用的資料分析工具,提供了廣泛的資料修改方法。 既可以針對行或者列的資料進行修改,也可以對具體單個元素進行修改,還可以基于條件選擇要修改的行或者列的資料。 1. 增加資料 1.1 增加行資料 pandas的DataFrame增加一行或者多行資料之前是使用append方法。 im ......

    uj5u.com 2023-05-16 18:18:54 more
  • Python多執行緒爬取鏈家房源,保存表格,實作資料可視化分析!

    使用Python來爬取二手房源資料,并保存表格,實作資料分析! 軟體環境 Python 3.8 Pycharm 代碼展示 模塊 # 資料請求模塊 --> 第三方模塊, 需要安裝 pip install requests import requests # 決議資料模塊 --> 第三方模塊, 需要安裝 ......

    uj5u.com 2023-05-16 18:18:36 more