主頁 > 軟體設計 > 國家統計局全國統計用區劃代碼和城鄉劃分代碼Python爬蟲樣例

國家統計局全國統計用區劃代碼和城鄉劃分代碼Python爬蟲樣例

2020-09-12 17:22:59 軟體設計

為了專案后續資料需要做準備,開始漸進深入去學習爬蟲,最近做了一個實戰樣例demo,寫了一個爬蟲,獲取全國統計用區劃代碼,資料來源,國家統計局:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/

整體分析一下,這個網站的布局樣式簡直不忍直視,可以說是一覽無遺,基本上啥都沒有,突出了政府網站一貫的簡潔高效風格,

我將按照代碼順序,差穿插著說明開發思路程序,

代碼目錄:

資料庫表設計:

CREATE TABLE `nbs_region` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `nbs_code` varchar(20) DEFAULT NULL COMMENT '國家統計局統計用區劃code',
  `nbs_parent_code` varchar(20) DEFAULT NULL COMMENT '國家統計局父級統計用區劃code',
  `nbs_level` varchar(16) DEFAULT NULL COMMENT '國家統計局區域層級',
  `nbs_name` varchar(128) DEFAULT NULL COMMENT '國家統計局名稱',
  `nbs_town_country_code` varchar(10) DEFAULT NULL COMMENT '國家統計局城鄉分類代碼【五級才有值】',
  `create_time` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '資料記錄創建時間',
  `update_time` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '資料記錄修改時間',
  PRIMARY KEY (`id`) USING BTREE,
  KEY `nbs_code` (`nbs_code`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC COMMENT='國家統計局全國五級行政區劃【http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/】';

先介紹下用到的基礎python檔案,

Bean包下兩個類,NbsRegionDTO用于存放爬取決議后的資料,便于最后存庫,欄位和資料庫對應,

'''
國家統計局行政區劃物體類
'''
class NbsRegionDTO:

    # 統計用區劃代碼
    nbs_code = ''

    #'國家統計局父級統計用區劃code',
    nbs_parent_code = ''

    # '國家統計局區域層級', 1 - 5
    nbs_level = 0

    # '國家統計局名稱',
    nbs_name = ''

    # 城鄉分類代碼  五級才有資料
    nbs_town_country_code = ''


    #定義構造方法
    def __init__(self,nbs_code,nbs_parent_code,nbs_level,nbs_name,nbs_town_country_code):
        self.nbs_code = nbs_code
        self.nbs_parent_code = nbs_parent_code
        self.nbs_level = nbs_level
        self.nbs_name = nbs_name
        self.nbs_town_country_code = nbs_town_country_code
ParseErrorClass 用于封裝爬取程序中出現問題的資料資訊,便于最后集中處理,
'''
決議暫時出現例外的資料物體類
'''
class ParseErrorClass:

    # 當前 父節點code
    parent_code = ''

    # 當前  父節點區劃等級
    parent_level = 0

    # 當前待決議url
    to_parse_url = ''

    # 定義構造方法
    def __init__(self, parent_code, parent_level, to_parse_url):
        self.parent_code = parent_code
        self.parent_level = parent_level
        self.to_parse_url = to_parse_url


util包下有兩個工具類檔案

UrlGetUtil 用于抓取相關url頁面,里面提供兩種方法,request.get() 和 urlopen() ,兩種方式都是可行的,

import sys
from urllib.request import urlopen

from pip._vendor import requests

'''
工具類
'''
class UrlGetUtil:

    '''
    url 待抓取url
    tarBianMa 目標編碼,eg: 'gbk'
    '''
    def getByRequestGet(self,url,tarBianMa):
        response = requests.get(url)
        #print(response.encoding) #查看現有編碼
        response.encoding = tarBianMa  # 改變編碼
        #print(response.encoding)#查看改變后的編碼
        html = response.text
        return html

    '''
    url 待抓取url
    tarBianMa 目標編碼,eg: 'gbk'
    '''
    def getByUrlOpen(self,url,tarBianMa):
        #10s超時
        html_obj = urlopen(url,timeout = 10)
        html = html_obj.read().decode(tarBianMa)
        return html
DataBaseUtil 提供兩個方法,用于獲取連接物件和游標物件
import pymysql
'''
資料庫操作工具類
'''
class DataBaseUtil:

    '''獲取連接物件'''
    def getConnObj(self,host_param,unix_socket_param,user_param,passwd_param,db_param):
        conn = pymysql.connect(host=host_param,unix_socket=unix_socket_param,user=user_param,passwd=passwd_param,db=db_param,charset='utf8')
        return conn
    '''
    獲取游標物件
    引數:連接物件conn
    '''
    def getCurObj(self,conn):
        return conn.cursor()

另外還有三個檔案,NbsMain是程式運行入口,NbsCycleSpider用于深層次遞回爬取下級行政區劃資料,SaveData用于存盤資料到資料庫,

★SaveData中主要就是一個批量插入資料到mysql的方法,

1,方法引數傳進來是一個集合,里面存放一個個封裝好的資料NbsRegionDTO物件,為了便于后面批量插入,先把集合引數tar_obj_set處理轉成串列套元組的形式,

2,準備資料庫連接引數,用戶名,密碼,資料庫,ip等老幾樣資料,獲取連接物件和游標物件,

3,執行sql,關于批量插入的注意事項,代碼中的注釋有詳述

4,最后,記得關閉連接和游標,防止泄露,


'''
國家統計局 資料入庫存盤
'''
from NbsRegionSpider.Util.DataBaseUtil import DataBaseUtil

#批量插入
def nbsDataToSaveBatch(tar_obj_set):
    #引數處理成串列套元組的形式
    tar_list = list()   #或  tar_list = []
    for tar_obj in tar_obj_set:
        tar_tuple = (tar_obj.nbs_code,tar_obj.nbs_parent_code,tar_obj.nbs_level,tar_obj.nbs_name,tar_obj.nbs_town_country_code)
        tar_list.append(tar_tuple)
    # 資料庫資訊
    dataBaseUtilObj = DataBaseUtil()
    host_param = 'xxxx.xx.xx.xx'
    unix_socket_param = ''
    user_param = 'root'
    passwd_param = 'xxxxx'
    db_param = 'qqq'
    conn = dataBaseUtilObj.getConnObj(host_param,unix_socket_param,user_param,passwd_param,db_param)
    cur = dataBaseUtilObj.getCurObj(conn)

    #執行sql
    cur.execute("use qqq")
    # 注意這里使用的是executemany而不是execute,下邊有對executemany的詳細說明
    '''
    另外,針對executemany
    execute(sql) : 接受一條陳述句從而執行
    executemany(templet,args):能同時執行多條陳述句,執行同樣多的陳述句可比execute()快很多,強烈建議執行多條陳述句時使用executemany
        templet : sql模板字串,  例如 ‘insert into table(id,name,age) values(%s,%s,%s)’
        args: 模板字串中的引數,是一個list,在list中的每一個元素必須是元組!!!  例如: [(1,‘mike’),(2,‘jordan’),(3,‘james’),(4,‘rose’)]
    '''
    cur.executemany('insert into nbs_region(nbs_code,nbs_parent_code,nbs_level,nbs_name,nbs_town_country_code) values (%s,%s,%s,%s,%s)',tar_list)
    conn.commit()
    cur.close()
    conn.close()

★NbsMain:

基本邏輯

在NbsMain中決議省一級資料,然后在NbsCycleSpider中遞回該省的下級資料的深度爬蟲,把每一層的爬取結果集合,回傳到上一級,再同本級結果集合取并集來合并所有結果,同時把出現爬取例外的資料暫存到錯誤資料集合全域變數error_data_set,最侄訓傳爬取結果集到NbsMain中,然后執行該省資料的存盤入庫,然后回圈下一個省份的處理,最后再處理上述程序中產生的錯誤資料集合error_data_set,進行重試爬取并入庫,進行回圈,每次回圈,創建一個error_data_set_second 來保存出現的錯誤資料,本次資料入庫后,更新error_data_set = error_data_set_second,直到最后,error_data_set容量為0 為止,

之所以不直接操作error_data_set 而是每次用一個新的error_data_set_second,是為了避免再迭代error_data_set的時候,又對其進行洗掉、添加的操作,導致出現迭代例外,

import time
from urllib.request import urlopen
from bs4 import BeautifulSoup
from NbsRegionSpider.Bean.NbsRegionDTO import NbsRegionDTO
from NbsRegionSpider.NbsCycleSpider import cycleSpider
from NbsRegionSpider.SaveData import nbsDataToSaveBatch
from NbsRegionSpider.Util.UrlGetUtil import UrlGetUtil

'''國家統計局省級區域資料爬取 程式入口'''
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/'
urlGetUtilObj = UrlGetUtil()
#兩種方式二選一來爬取url頁面
#urlopern方式
html = urlGetUtilObj.getByUrlOpen(base_url,'gbk')
# request.get 方式
#html = urlGetUtilObj.getByRequestGet(base_url,'gbk')
'''
例外:Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.
https://www.cnblogs.com/HANYI7399/p/6080070.html
'''
#bs = BeautifulSoup(html, 'html.parser', from_encoding = "iso-8859-1")
bs = BeautifulSoup(html,'html.parser')
#找出存放省資訊的tr行
trs = bs.findAll('tr',{'class':'provincetr'})
#先取出所有的省資料節點
data_item_set = set()
for tr in trs:
	tds = tr.findAll('td')
	for td in tds:
		a_flag = td.a
		if a_flag is None:
			continue
		data_item_set.add(a_flag)

#全域變數,存盤爬取程序中出現錯誤的資料
error_data_set = set()
# 每一輪節點的回圈都是對一個省的資料處理
for a_flag in data_item_set:
	# 本省所有行政區劃結果集
	tar_obj_set = set()
	#決議資料
	province_name = a_flag.get_text()# 獲取省名稱
	print('-'*12 +province_name+'---爬取開始'+ '-'*12)
	province_code = ''
	to_spider_url = a_flag['href']
	if len(province_name) == 0:
		continue
	if len(to_spider_url) != 0:
		province_code = ''.join(filter(str.isdigit, to_spider_url))#串列轉字串,獲取省一級code
	# 省一級資料封裝成物體
	tarObj = NbsRegionDTO(province_code,'',1,province_name,'')
	grade_2_url = base_url + to_spider_url #基礎路徑拼接當前路徑 相當于 下一級的url決議路徑
	tar_obj_set.add(tarObj)
	#呼叫回圈方法,去決議子層級區域
	tar_obj_set_result = cycleSpider(province_code,1,grade_2_url,error_data_set)
	# 合并兩個集合結果集【取并集】
	tar_obj_set = tar_obj_set | tar_obj_set_result
	print('-'*12 +province_name+'---爬取結束'+'-'*12)
	time.sleep(10)
	#本省資料入庫存盤
	try:
		nbsDataToSaveBatch(tar_obj_set)
	except Exception as e:
		print('-'*12 +province_name+'---資料入庫存盤例外')
		print(e)

#全國資料初次處理完畢,開始處理整體程序中失敗的資料,重試
print('------開始處理初次全國爬取失敗的資料,共------'+str(len(error_data_set))+'條')
while(len(error_data_set) > 0):
	error_data_set_second = set()
	for item in error_data_set:
		tar_save_set = cycleSpider(item.parent_code, item.parent_level, item.to_parse_url,error_data_set_second)
		#存盤入庫
		try:
			nbsDataToSaveBatch(tar_save_set)
		except Exception as e:
			print('---全國爬取程序的錯誤資料重試爬取后入庫存盤例外,---')
			print(e)
			for item in tar_save_set:
				print(item.nbs_code + '-'*6 + item.nbs_parent_code + '-'*6 + str(item.nbs_level) + '-'*6 + item.nbs_name + '-'*6 + item.nbs_town_country_code)

	#更新error_data_set
	print('------再次失敗的資料,共------' + str(len(error_data_set_second)) + '條')
	error_data_set = error_data_set_second
	time.sleep(10)

NbsCycleSpider:

'''
    多層級回圈遞回呼叫決議區域,然后回傳資料集合
'''
import socket
import time
from urllib.error import HTTPError
from urllib.request import urlopen
from bs4 import BeautifulSoup
from NbsRegionSpider.Bean.NbsRegionDTO import NbsRegionDTO

from NbsRegionSpider.Bean.ParseErrorClass import ParseErrorClass
from NbsRegionSpider.Util.UrlGetUtil import UrlGetUtil



def cycleSpider(parent_code,parent_level,to_parse_url,error_data_set):
    # 本次爬取行政區劃資料結果集
    tar_obj_set = set()
    #按層級使用不同的決議標簽關鍵字
    tr_flag = ''
    current_level = parent_level + 1#級別級別
    if current_level == 2:
        tr_flag = 'citytr'
    elif current_level == 3:
        tr_flag = 'countytr'
    elif current_level == 4:
        tr_flag = 'towntr'
    elif current_level == 5:
        tr_flag = 'villagetr'
    else:
        pass
    #決議
    try:
        urlGetUtilObj = UrlGetUtil()
        # urlopern方式
        html = urlGetUtilObj.getByUrlOpen(to_parse_url,'gbk')
        # request.get 方式
        # html = urlGetUtilObj.getByRequestGet(to_parse_url,'gbk')
    except socket.timeout:
        print('parent_code = '+parent_code+'---待決議URL:' + to_parse_url + '請求超時')
        # 暫時跳過,將出現例外的待決議資料暫存起來
        error_data_set.add(ParseErrorClass(parent_code, parent_level, to_parse_url))
        return tar_obj_set
    except HTTPError as e:
        print('parent_code = '+parent_code+'---待決議URL:' + to_parse_url + '出現http錯誤:')
        print(e)
        # 暫時跳過,將出現例外的待決議資料暫存起來
        error_data_set.add(ParseErrorClass(parent_code, parent_level, to_parse_url))
        return tar_obj_set
    except Exception as e:
        print('parent_code = '+parent_code+'---待決議URL:'+to_parse_url+'請求出現例外')
        print(e)
        #暫時跳過,將出現例外的待決議資料暫存起來
        error_data_set.add(ParseErrorClass(parent_code,parent_level,to_parse_url))
        return tar_obj_set
    else:
        pass
    bs = BeautifulSoup(html, 'html.parser')
    #獲取本頁所有資料節點
    trs = bs.findAll('tr', {'class': tr_flag})
    for tr in trs:
        #注意,5極頁面有三個td,和別的等級頁面中的相同td位置,存放資料不是一樣的型別,所以進行判斷
        td_1 = tr.find('td')#第一個td節點
        current_code = td_1.get_text()
        current_url = ''
        current_name = ''
        current_town_country_code = ''
        td_2 = td_1.next_sibling#第二個td節點
        if(current_level == 5):
            current_town_country_code = td_2.get_text()
            current_name = td_2.next_sibling.get_text()
        else:
            td_1_a = td_1.a
            if td_1_a is not None:  #比如青海省西寧市市轄區 ,才到三級,就咩有下級了,所以a標簽為None物件
                current_url = td_1_a['href']
            current_name = td_2.get_text()
        #列印開始日志
        if (current_level == 2):
            print('-'*8 + current_name)
        elif(current_level == 3):
            print('-' * 4 + current_name)
        #封裝資料
        tarObj = NbsRegionDTO(current_code, parent_code, current_level, current_name, current_town_country_code)
        tar_obj_set.add(tarObj)
        # 遞回呼叫,獲取下級資料
        tar_obj_set_result = set()
        if (current_level != 5 and current_url != ''): # 五級一定沒有下級
            # 當前決議頁面截取最后一個'/'之前的url ,再拼接當前頁面的href   就是下一級別的決議url
            pos = to_parse_url.rfind("/")
            next_url_data = to_parse_url[:pos] + '/' + current_url
            tar_obj_set_result = cycleSpider(current_code,current_level,next_url_data,error_data_set)
        # 合并兩個集合結果集【取并集】 并回傳
        tar_obj_set = tar_obj_set | tar_obj_set_result

    if(current_level == 2 or current_level == 3):
        time.sleep(10)
    return tar_obj_set






部分運行日志:

代碼中已經寫了詳細的步驟注釋,理解起來應該沒有什么問題,不過還有很大的改進空間,比如改當前的深度爬取為廣度爬取,可以有效降低服務器負載等,后續不斷積累經驗,越來越好吧,歡迎批評指正交流,

-----------------------------------20200911補充:

實際運行發行最后一直有三個url鏈接無法成功,一直在回圈重試、失敗著列印日志,別的資料都正常,這三個url為:

待決議URL:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/42/06/02/420602006.html
待決議URL:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/42/06/84/420684103.html
待決議URL:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/51/06/81/510681114.html
例外如下:'gbk' codec can't decode byte 0xfe in position 3068: illegal multibyte sequence

是編碼問題,然而別的資料都是用的gbk都沒問題,這個已經也在網頁源代碼中確認,說明這三個url有問題,

參考文章:https://blog.csdn.net/zangbianer/article/details/84526011 ,使用gb18030 問題解決,

為了針對這三個資料處理,我對原有代碼做了一點重構:

新建新的類M,代碼如下,專門用于處理一直失敗的資料,同時為了復用代碼,把原來NbsMain中的對錯誤資料處理的代碼抽取出來,放到下面的handle_error_retry()中,然后把爬取鏈接引數處的gbk改為gb18030,運行下面的M代碼,即可,

'''
對于一直處理報錯的url,最終手動處理
'''
import time

from NbsRegionSpider.Bean.ParseErrorClass import ParseErrorClass
from NbsRegionSpider.NbsCycleSpider import cycleSpider
from NbsRegionSpider.SaveData import nbsDataToSaveBatch

'''
出現錯誤的資料重試方法
'''
def handle_error_retry(error_data_set):
	while (len(error_data_set) > 0):
		error_data_set_second = set()
		for item in error_data_set:
			tar_save_set = cycleSpider(item.parent_code, item.parent_level, item.to_parse_url, error_data_set_second)
			# 存盤入庫
			try:
				nbsDataToSaveBatch(tar_save_set)
			except Exception as e:
				print('---全國爬取程序的錯誤資料重試爬取后入庫存盤例外,---')
				print(e)
				for item in tar_save_set:
					print(item.nbs_code + '-' * 6 + item.nbs_parent_code + '-' * 6 + str(
						item.nbs_level) + '-' * 6 + item.nbs_name + '-' * 6 + item.nbs_town_country_code)

		# 更新error_data_set
		print('------再次失敗的資料,共------' + str(len(error_data_set_second)) + '條')
		error_data_set = error_data_set_second
		time.sleep(10)


data_set = set()
'''
所有的資料中就只有這三個一直失敗,別的都成功,例外如下:
'gbk' codec can't decode byte 0xfe in position 3068: illegal multibyte sequence
網頁編碼的確時gbk沒錯的,參考文章:https://blog.csdn.net/zangbianer/article/details/84526011
改為 gb18030成功解決,
又看了下這三個url網頁,發現每一頁中都有一條資料的地名中,包含特殊字符,網頁上顯示的是一個小方格,罪魁禍首就是他了,
一共這三個名字包含未知字符的地點的code是:510681114209     420684103005    420602006207
'''
data_set.add(ParseErrorClass('420602006000', 4,'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/42/06/02/420602006.html'))
data_set.add(ParseErrorClass('420684103000', 4,'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/42/06/84/420684103.html'))
data_set.add(ParseErrorClass('510681114000', 4,'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/51/06/81/510681114.html'))
handle_error_retry(data_set)

這三個url中的元兇被我給揪了出來;

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/15705.html

標籤:其他

上一篇:python 行程超時自動退出 裝飾器

下一篇:預測GDP應用:Numpy 線性回歸+Matplotlib 作圖

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more