作業中突然要操作一堆Excel表格,就想著能否用Python來處理,這一篇就學習一下Python操作Excel表,
我需要在一個內網環境安裝python開發環境,在網上下載了pycharm2018,好像再新的版本沒有windows 32位的版本了,
安裝:
安裝步驟:先下載安裝python3.8,然后安裝第三方庫openpyxl,openpyxl需要下載openpyxl-3.0.7-py2.py3-none-any.whl,安裝還需要其jdcal和et_xmlfile庫的支持,下載jdcal-1.4.1-py2.py3-none-any.whl,et_xmlfile-1.1.0-py3-none-any.whl,
將這三個檔案放在一個檔案夾中,命令視窗切換至這個檔案夾,執行pip命令進行安裝,前提是在環境變數path中增加了python的路徑,能夠找到pip命令,pip命令在python目錄下的scripts子目錄下,
pip install jdcal-1.4.1-py2.py3-none-any.whl
pip install et_xmlfile-1.1.0-py3-none-any.whl
pip install openpyxl-3.0.7-py2.py3-none-any.whl
然后安裝pycharm,安裝成功后,有一個問題,雖然前面安裝openpyxl成功了,但是在pycharm中還是沒有,需要在pycharm的python console中重新執行一遍前面的三條pip命令,
使用:
首先要有一個概念的體系結構,對excel的操作,最大的物件就是作業簿,即Workbook,然后是作業表,即Sheet,最后是單元格,即Cell,
創建一個新的作業簿:使用openpyxl.Workbook,這相當于呼叫openpyxl.workbook.Workbook


這就生成了一個作業簿物件,這個作業簿里面還沒有作業表,這跟我們操作excel是打開excel自動會創建3個默認作業表不一樣,需要手工創建作業表:

然后是單元格:

生成了一個單元格物件,操作單元格

保存作業簿,就是在磁盤中生成保存excel檔案,最后關閉作業簿

打開新生成的檔案:
可以看到在創建的作業表之外,還有一個默認創建的Sheet表,
操作已有表:就使用已創建的test1111.xlsx,修改一下:

打開已有excel檔案,使用:

load_workbook()第一個引數是打開的作業簿的檔案名稱,后面的引數主要注意data_only選項,這個選項控制讀取的單元格內容,如果單元格里是一個公式,那么使用這個選項,讀取出來的就是公式計算后的值,否則,讀取的是公式本身,

獲取作業表:

可以看到,get_sheet_by_name方法也不被建議使用,直接使用作業簿加作業表的索引來參考相應的作業表:
讀取單元格:

跟獲得作業表類似,使用索引的方法,中括號中是要讀取單元格的地址,但是獲得的是單元格物件,要獲取其值,需要使用value屬性:

pycharm沒有提示出來:

讀取C2單元格試一下:

讀取的是公式本身
修改一下:

此時讀取的是公式計算后的值,
做一個測驗:wb物件能夠彈出data_only屬性,

打開作業簿后,不能再次設定data_only, 
對于取一個區域的單元格,其回傳的是一個嵌套的元組,里面的元組是以同一行的多列單元格為元素,
具體專案1:有多個考核明細表,編程實作將多個明細表的資料匯總到一個表中,
明細表、匯總表的結構:


程式:
#!/usr/bin/env python3
# -*- coding:utf-8 -*-
import openpyxl
import os
mxfiles = os.listdir('excelmx') # 獲取全部明細考核表檔案
hzfile = '考核匯總表.xlsx' # 匯總表檔案
wbhz = openpyxl.load_workbook(hzfile) #打開匯總表作業簿
wshz = wbhz['Sheet1'] # 獲得匯總的作業表
hzrowstart = 4 # 匯總表的開始行號
# 下面的while陳述句判斷匯總表開始寫入資料的行號,匯總表中可能有前期的資料了
# 判斷的依據就是B列從第4行開始往下的第一個空單元格開始插入資料
while True:
celltemp = 'B' + str(hzrowstart)
if wshz[celltemp].value == None:
break
hzrowstart += 1
# 下面的for回圈遍歷每個明細表,將資料一條一條插入匯總表
for mxfile in mxfiles:
mxfile_t = 'excelmx\\' + mxfile # mxfile需要加上子目錄,形成excelmx\xxxx.xlsx形式完整名
n = 1
wbmx = openpyxl.load_workbook(mxfile_t)
wsmx = wbmx['Sheet1'] # 明細表固定在Sheet1作業表上
while True:
# 組合明細表和匯總表對應拷貝的單元格,明細表中的B4拷貝到匯總表中的B4,C4到C4,,,
hzcellb = 'B' + str(hzrowstart)
mxcellb = 'B' + str(n+3)
hzcellc = 'C' + str(hzrowstart)
mxcellc = 'C' + str(n + 3)
hzcelld = 'D' + str(hzrowstart)
mxcelld = 'D' + str(n + 3)
hzcelle = 'E' + str(hzrowstart)
mxcelle = 'E' + str(n + 3)
hzcellf = 'F' + str(hzrowstart)
mxcellf = 'F' + str(n + 3)
hzcellg = 'G' + str(hzrowstart)
mxcellg = 'G' + str(n + 3)
hzcellh = 'H' + str(hzrowstart)
mxcellh = 'H' + str(n + 3)
hzcelli = 'I' + str(hzrowstart)
mxcelli = 'I' + str(n + 3)
if wsmx[mxcellb].value == None: # 判斷如果明細表資料為空了,就結束
wbmx.close()
break
wshz[hzcellb] = wsmx[mxcellb].value
wshz[hzcellc] = wsmx[mxcellc].value
wshz[hzcelld] = wsmx[mxcelld].value
wshz[hzcelle] = wsmx[mxcelle].value
wshz[hzcellf] = wsmx[mxcellf].value
wshz[hzcellg] = wsmx[mxcellg].value
wshz[hzcellh] = wsmx[mxcellh].value
wshz[hzcelli] = wsmx[mxcelli].value
hzrowstart += 1
n += 1
wbhz.save(hzfile)
wbhz.close()
具體專案2:上面的匯總明細表,以前四項為唯一值,即作為一個考核匯總項,形成一個新的考核表,將匯總明細表中不同的考核人+考核說明填到這個考核表的考核說明中,如單位名稱1+1月+ 基礎作業+小項1共有2個人考核,有兩個說明,要把這個兩個人的說明合并填寫到這個表的一個單元格中,實際作業中有二十多個考核人,并且每個考核人考核的項也不相同,每個人按照不同的分工對自己負責的一部分進行考核打分,用excel本身實作合并很麻煩,編程實作,

解決思路:

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
import openpyxl
destfile = '考核匯總表.xlsx'
wb = openpyxl.load_workbook(destfile)
wshz = wb['Sheet1'] #匯總作業表物件
wskh = wb['Sheet2'] #考核作業表物件
khrow = 4 #考核表資料開始行號
while True:
cell_tmp = 'B' + str(khrow)
if wskh[cell_tmp].value == None:
break
khrow += 1 #while陳述句判斷考核表資料的行數,最后一行資料的行號為khrow-1
hzrow = 4 #匯總表資料也從第4行開始
while True:
cellhz_temp = 'B' + str(hzrow)
if wshz[cellhz_temp].value == None:
break
hzrow += 1
#計算匯總表資料范圍
cellrange = 'B4:E' + str(hzrow-1) #選擇匯總表的前前四列資料
wshz_tmp = wshz[cellrange]
wshz_list = []
for temp in wshz_tmp:
s = ''
for temp1 in temp:
s = s + temp1.value
wshz_list.append(s)
# for陳述句將匯總表的前四列合并然后添加到wskh_list,形成一個串列
for k in range(4,khrow):
s1 = ''
match_temp = ''
khcellb,khcellc,khcelld,khcelle = 'B' + str(k),'C' + str(k),'D' + str(k),'E' + str(k)
s1 = s1 + wskh[khcellb].value + wskh[khcellc].value + wskh[khcelld].value + wskh[khcelle].value
i = 0
while i < len(wshz_list):
if s1 == wshz_list[i]:
cell_h = 'H' + str(i + 4)
cell_i = 'I' + str(i + 4)
match_temp = match_temp + wshz[cell_h].value + ':' + wshz[cell_i].value + '|'
i += 1
wskh['H'+str(k)] = match_temp
wb.save(destfile)
wb.close()
以上是最簡單的excel使用,只是從功能上實作了作業中需求,性能上因為個人剛學習,水平所限,無法判斷好壞,如有高手希望指點一二,謝謝,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/289593.html
標籤:python
