主頁 > 軟體設計 > 自制爬蟲框架

自制爬蟲框架

2020-10-21 07:00:24 軟體設計

自制python爬蟲程式模板(爬蟲小白亦可用)

        • 1.mysql資料庫鏈接
        • 2. 頁面請求程序
        • 3. 資料提取處理
        • 4. 資料保存處理,

??在平時揮手大干專案的程序中,時不時會有一些小的爬蟲任務需要處理,因此專門寫了一個爬蟲框架,基本覆寫平常用到的網站,覺得使用效果不錯,分享出來給大家使用,也請各路大神走過路過提些好的意見,
??接下來為大家簡單介紹一下每個模塊實作程序及思路,本文結束后處會附全部代碼,前面代碼只是便于大家理解,無需挨個粘貼,

1.mysql資料庫鏈接

??本程式使用mysql資料庫讀取和保存資料,為了作業程序中的安全和方便,我們通過另外一個程式將資料庫鏈接賬號密碼等資料,保存中windows注冊表中,可通過 win+regedit 調出查看,(此塊僅適用于windows系統,若需在linux上使用,則不使用此模塊鏈接資料庫),本模塊中資料庫鏈接方式見代碼:

    def read_setttings_zhuce(self, file, winn_c_u=winreg.HKEY_CURRENT_USER):
        """
            讀取注冊表中的設定
        """
        parentkey = winreg.OpenKey(winn_c_u, file)
        # 獲取該鍵的所有鍵值,因為沒有方法可以獲取鍵值的個數,所以只能用這種方法進行遍歷
        item = dict()
        try:
            i = 0
            while True:
                # EnumValue方法用來列舉鍵值,EnumKey用來列舉子鍵
                name, value, type = winreg.EnumValue(parentkey, i)
                item[name] = value
                i += 1
        except Exception as e:
            pass
        return item
    
    def __init__(self, start_p):
        # 注意,super().__init__() 一定要寫
        # 而且要寫在最前面,否則會報錯,
        super().__init__()
        self.item_fwq = self.read_setttings_zhuce("Software\lxl\lxl_program")
        # 鏈接資料庫
        self.conn = pymysql.connect(
            user=self.item_fwq["user"], password=self.item_fwq["password"], host=self.item_fwq["host"], port=int(self.item_fwq["port"]),
            database=self.item_fwq["database"], use_unicode=True,
            charset="utf8")
        self.start_p = start_p
        print("資料庫開啟中......")
        # 獲取游標
        self.cursor = self.conn.cursor()

2. 頁面請求程序

??此處說明一下,整個模塊是通過dict來傳遞資料的,因此在使用程序中,可以隨時隨地添加我們需要傳遞的引數,我們平常用到的頁面一般是get或post請求方式,get方式通過修改傳遞的url鏈接即可請求獲取資料,post方式通過data引數傳遞獲取資料,因此將兩種方式分開處理,同時將請求回來的資料做deocde解碼處理,一般遇到的有utf8或者GBK的,我寫了兩種,如果你們使用程序中出現其他的解碼,添加上去即可,此處代碼比較low我就不貼在此處了,各位結尾處直接復制即可,(我貼幾行重點吧,否則好像顯得此處特殊),

        item_fwq_ip = read_setttings_zhuce("Software\lxl\lxl_program")
        # 讀取實時寫入windows注冊表中的ip代理  本人喜歡使用無憂代理 不是打廣告,而是品質確實好
        proxies = {"http": "%s" % item_fwq_ip["ip"], "https": "%s" % item_fwq_ip["ip"]}
        headers = {
             "user-agent": item_fwq_ip['user_agent']
        }
        try:
            response = requests.get(url=url, headers=headers, timeout=20).content
            if response:
                return response
        except Exception as f:
            print("重新請求")
        try:
            response = requests.post(url=url, headers=headers, data=data,timeout=20).content
            if response:
                return response
        except Exception as f:
            print("重新請求")

3. 資料提取處理

??頁面請求成功之后,會回傳三種格式,一種是html格式,一種是json格式,還有一種是我請求不到資料回傳的無資料結果(未針對此處如何處理,若有需要,自行處理),針對html格式我們使用xpath決議資料(本來想著能不能通過代碼去自動處理xpath,太忙沒時間,以后補上吧);針對json格式,就簡單許多了,直接對應讀取出來即可,兩種格式處理之后,將資料以dict格式傳遞至資料保存處理中即可 見代碼:

    def response_json(self, response, meta={}):
        """
            json 格式決議
        """
        list_data = response['result']['data']
        for ds in list_data:
            item = dict()
            """
                此處可以對資料進行處理,若不需特殊處理的 則直接合并到item字典中,保存入資料庫
                列: item["pid] = ds['id']
            """
            item = {**item, **meta}
            where_list = ["pid"]  # 此處添加mysql保存判斷條件中查詢的欄位 可寫多個欄位
            table_name = 'your_databases_tablename'  # 此處添加你需要保存的資料表名稱 注: 若沒有新建資料表, 代碼可自動建立新的資料表
            self.mysql_f_item(item, table_name=table_name, where_list=where_list)
    
    def response_html(self, response, meta={}):
        """
            html 格式決議
        """
        list_response = response.xpath('//div[@class="name"]')
        for resp in list_response:
            item = dict()
            """
                此處可以對資料進行xpath決議處理,保存入資料庫
                列: item["pid] = resp.xpath('./a/@href')[0]
            """
            print(item)
            item = {**item, **meta}
            where_list = ["pid"]  # 此處添加mysql保存判斷條件中查詢的欄位 可寫多個欄位
            table_name = "your_databases_tablename" # 此處添加你需要保存的資料表名稱 注: 若沒有新建資料表, 代碼可自動建立新的資料表
            self.mysql_f_item(item, table_name, where_list=where_list)

4. 資料保存處理,

??資料庫選用mysql保存,在此模塊中,我加入了自動創建表和自動拼接sql的功能,傳入一個資料表名稱,若存在則進行下一步處理,不存在會進行資料表創建,此時dict中的欄位名稱就起到了一定的作用,我通過欄位中所帶的值,作為創建欄位的型別(此處也可自行添加);同時資料保存程序中,有時會需要做判重,通過在指定串列 where_list 中添加欄位即可(默認為空,不判重,其他的沒什么了都是一些常規操作了,見代碼:

        sql = "insert into %s(" % table_name
        for item in lst:
            sql = sql + "`%s`," % item
        sql = sql.strip(',') + ") values ("
        if list_flag is False:
            for item in lst:
                sql = sql + "'{%s}'," % item
        else:
            for i in range(len(lst)):
                sql = sql + "'{0[%s]}'," % i
        sql = sql.strip(',') + ")"
        return sql

                sql_begin = """CREATE TABLE `%s` (  `id` int(11) NOT NULL AUTO_INCREMENT,""" % table_name
        sql_end = """ PRIMARY KEY (`id`)
                    ) ENGINE=%s AUTO_INCREMENT=0 DEFAULT CHARSET=%s;""" % (engine, charset)
        sql_temp = " `%s` varchar(256) DEFAULT NULL,"
        sql_temp_time = "`%s` datetime DEFAULT NULL,"
        sql_temp_content = "`%s` text,"
        sql_temp_sgin = "`%s` enum('0','1') DEFAULT '0',"
        sql = str()
        for item in lst:
            # 生成新的資料表時 可根據item中的欄位名稱 來決定資料庫中欄位的型別
            if "time" in item:
                sql += sql_temp_time % item
            elif "content" in item:
                sql += sql_temp_content % item
            elif "sgin" in item:
                sql += sql_temp_sgin % item
            else:
                sql += sql_temp % (item)

        sql = sql_begin + sql + sql_end
        return sql

??好了,這次就寫到這里吧,如果之后對這個模塊做大的更新或調整再說吧, 如果對以上代碼有不懂之處,可以發送至郵件 xiang_long_liu@163.com,大家共同探討吧,
結尾處付全部代碼:

import requests, winreg, pymysql, re, json
from lxml import etree
from threading import Thread
import settings  # 將服務器資料庫等鏈接方式寫入windows注冊表中,然后再在該程式中讀取出來


def read_setttings_zhuce(file, winn_c_u=winreg.HKEY_CURRENT_USER):
    """
        讀取注冊表中的設定
    """
    parentkey = winreg.OpenKey(winn_c_u, file)
    # 獲取該鍵的所有鍵值,因為沒有方法可以獲取鍵值的個數,所以只能用這種方法進行遍歷
    item = dict()
    try:
        i = 0
        while True:
            # EnumValue方法用來列舉鍵值,EnumKey用來列舉子鍵
            name, value, type = winreg.EnumValue(parentkey, i)
            # print(name, value)
            item[name] = value
            i += 1
    except Exception as e:
        pass
    return item


class ALi_Main(Thread):

    def read_setttings_zhuce(self, file, winn_c_u=winreg.HKEY_CURRENT_USER):
        """
            讀取注冊表中的設定
        """
        parentkey = winreg.OpenKey(winn_c_u, file)
        # 獲取該鍵的所有鍵值,因為沒有方法可以獲取鍵值的個數,所以只能用這種方法進行遍歷
        item = dict()
        try:
            i = 0
            while True:
                # EnumValue方法用來列舉鍵值,EnumKey用來列舉子鍵
                name, value, type = winreg.EnumValue(parentkey, i)
                item[name] = value
                i += 1
        except Exception as e:
            pass
        return item

    def __init__(self, start_p):
        # 注意,super().__init__() 一定要寫
        # 而且要寫在最前面,否則會報錯,
        super().__init__()
        self.item_fwq = self.read_setttings_zhuce("Software\lxl\lxl_program")
        # 鏈接資料庫
        self.conn = pymysql.connect(
            user=self.item_fwq["user"], password=self.item_fwq["password"], host=self.item_fwq["host"], port=int(self.item_fwq["port"]),
            database=self.item_fwq["database"], use_unicode=True,
            charset="utf8")
        self.start_p = start_p
        print("資料庫開啟中......")
        # 獲取游標
        self.cursor = self.conn.cursor()

    def main(self, url="https://www.baidu.com/", formdata={}, meta={}):
        """
            開關
        """
        response = self.url_f_requests(url, formdata)
        if response != "無結果":
            # 對回傳的結果解碼
            response = self.response_decode(response)
            print(response)
            response, fangshi = self.t_f_response_json_html(response)
            if fangshi is "json":
                self.response_json(response, meta)
            elif fangshi is "html":
                self.response_html(response, meta)
            else:
                print(fangshi)
                print("回傳的頁面資料有誤請檢查")
        else:
            print("資料無結果,未獲取到")
            
    def url_f_requests(self, url, formdata):
        """
            get / post 請求發送
        """
        if formdata == {}:
            response = self.requests_url(url)
            print("{INFO}:url以 get 方式請求")
            # print(response)
        else:
            response = self.requests_url_post(url, formdata)
            print("{INFO}:url以 post 方式請求")
            # print(response)
        return response
            
    def t_f_response_json_html(self, response):
        """
            判斷回傳的結果
        """
        try:
            response = json.loads(response)
            print("{INFO}:資料以json格式回傳")
            return response, "json"
        except Exception as f:
            try:
                response = etree.HTML(response)
                print("{INFO}:資料以html格式回傳")
                return response, "html"
            except Exception as f:
                response = response
                return response, "None"
        
    def response_decode(self, response):
        """
            對回傳的結果解碼
        """
        try:
            response = response.decode()
            print("{INFO}:資料以utf-8解碼")
        except Exception as f:
            try:
                response = response.decode("GBK")
                print("{INFO}:資料以 GBK 解碼")
            except Exception as f:
                print("{INFO}:資料以未指定解碼方式回傳")
                response = response
        return response
        
    def response_json(self, response, meta={}):
        """
            json 格式決議
        """
        list_data = response['result']['data']
        for ds in list_data:
            item = dict()
            """
                此處可以對資料進行處理,若不需特殊處理的 則直接合并到item字典中,保存入資料庫
                列: item["pid] = ds['id']
            """
            item = {**item, **meta}
            where_list = ["pid"]  # 此處添加mysql保存判斷條件中查詢的欄位 可寫多個欄位
            table_name = 'your_databases_tablename'  # 此處添加你需要保存的資料表名稱 注: 若沒有新建資料表, 代碼可自動建立新的資料表
            self.mysql_f_item(item, table_name=table_name, where_list=where_list)
    
    def response_html(self, response, meta={}):
        """
            html 格式決議
        """
        list_response = response.xpath('//div[@class="name"]')
        for resp in list_response:
            item = dict()
            """
                此處可以對資料進行xpath決議處理,保存入資料庫
                列: item["pid] = resp.xpath('./a/@href')[0]
            """
            print(item)
            item = {**item, **meta}
            where_list = ["pid"]  # 此處添加mysql保存判斷條件中查詢的欄位 可寫多個欄位
            table_name = "your_databases_tablename" # 此處添加你需要保存的資料表名稱 注: 若沒有新建資料表, 代碼可自動建立新的資料表
            self.mysql_f_item(item, table_name, where_list=where_list)
        
    def mysql_f_item(self, item, table_name="new_table_name", where_list=[]):
        """
            保存創建mysql資料庫
        """
        lst = item.keys()
        # print(lst)
        insert_sql = self.create_insert_sql_for_list(table_name=table_name, lst=lst)
        insert_sql = insert_sql.format(**item)
        # print(insert_sql)
        select_sql = self.create_select_sql(table_name=table_name, where_list=where_list)
        select_sql = select_sql.format(**item)
        # print(select_sql)
        self.insert_mysql(insert_sql=insert_sql, select_sql=select_sql, table_name=table_name, lst=lst)
        print("--------------------------------")

    def create_insert_sql_for_list(self, table_name, lst, list_flag=False):
        """
        動態生成sql文(單條)
        :param table_name:表名
        :param lst:插入的資料串列
        :param list_flag: true:代表lst欄位是 list嵌套list,   false:代表list嵌套dict
        :return:回傳單條插入的sql
        """
        sql = "insert into %s(" % table_name
        for item in lst:
            sql = sql + "`%s`," % item
        sql = sql.strip(',') + ") values ("
        if list_flag is False:
            for item in lst:
                sql = sql + "'{%s}'," % item
        else:
            for i in range(len(lst)):
                sql = sql + "'{0[%s]}'," % i
        sql = sql.strip(',') + ")"
        return sql

    def create_select_sql(self, table_name, where_list):
        """
            動態生成sql文
        """
        if where_list == []:
            return ""
        else:
            sql = 'select id from %s where' % table_name
            for i in range(len(where_list)):
                sql = sql + " `%s` = '{%s}' and " % (where_list[i], where_list[i])
            sql = sql.strip('and ')
            # print(sql)
            return sql

    def create_table(self, table_name, lst, engine='MyISAM', charset='utf8'):
        """
        生成建表sql
        :param table_name:表名
        :param lst:欄位串列
        :param engine:資料庫型別
        :param charset:字符集
        :return:sql
        """
        sql_begin = """CREATE TABLE `%s` (  `id` int(11) NOT NULL AUTO_INCREMENT,""" % table_name
        sql_end = """ PRIMARY KEY (`id`)
                    ) ENGINE=%s AUTO_INCREMENT=0 DEFAULT CHARSET=%s;""" % (engine, charset)
        sql_temp = " `%s` varchar(256) DEFAULT NULL,"
        sql_temp_time = "`%s` datetime DEFAULT NULL,"
        sql_temp_content = "`%s` text,"
        sql_temp_sgin = "`%s` enum('0','1') DEFAULT '0',"
        sql = str()
        for item in lst:
            # 生成新的資料表時 可根據item中的欄位名稱 來決定資料庫中欄位的型別
            if "time" in item:
                sql += sql_temp_time % item
            elif "content" in item:
                sql += sql_temp_content % item
            elif "sgin" in item:
                sql += sql_temp_sgin % item
            else:
                sql += sql_temp % (item)

        sql = sql_begin + sql + sql_end
        return sql

    def insert_mysql(self, insert_sql, select_sql='', update_sql='', table_name='', lst=()):
        """
            保存資料
        """
        while True:
            # 獲取游標
            self.conn.ping(reconnect=True)
            if select_sql:
                try:
                    self.cursor.execute(select_sql)
                    if self.cursor.fetchone() is None:
                        print(insert_sql)
                        try:
                            self.cursor.execute(insert_sql)
                            self.conn.commit()
                            print("資料保存中......")
                            if update_sql:
                                self.cursor.execute(update_sql)
                                self.conn.commit()
                                print("資料更新中......")
                            break
                        except Exception as f:
                            # print(insert_sql)
                            print(f)
                            print("資料保存失敗")
                            break
                    else:
                        print("資料已存在")
                    break
                except Exception as f:
                    print(f)
                    # 首次執行 創建一個新的資料表
                    if "Table" in str(f) and "doesn't exist" in str(f):
                        print("*" * 100)
                        print("創建資料庫中......")
                        sql = self.create_table(table_name=table_name, lst=lst)
                        self.cursor.execute(sql)
                        self.conn.commit()
                    else:
                        break
            else:
                try:
                    print(insert_sql)
                    print("資料保存中......")
                    self.cursor.execute(insert_sql)
                    self.conn.commit()
                    break
                except Exception as f:
                    print(f)
                    # 首次執行 創建一個新的資料表
                    if "Table" in str(f) and "doesn't exist" in str(f):
                        print("*" * 100)
                        print("創建資料庫中......")
                        sql = self.create_table(table_name=table_name, lst=lst)
                        self.cursor.execute(sql)
                        self.conn.commit()
                    else:
                        print("保存失敗")
                        break

    def getDropStr(self, l_strHtml):
        """清洗字串"""
        strList = re.findall(
            r'[\u4e00-\u9fa5a-zA-Z0-9,.;?!_\]\'\"\[{}+-\u2014\u2026\uff1b\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]',
            l_strHtml)
        return "".join(strList)

    def requests_url(self, url, data=None):
        """
            發送請求,回傳相應
        """
        item_fwq_ip = read_setttings_zhuce("Software\lxl\lxl_program")
        # 讀取實時寫入windows注冊表中的ip代理  本人喜歡使用無憂代理 不是打廣告,而是品質確實好
        proxies = {"http": "%s" % item_fwq_ip["ip"], "https": "%s" % item_fwq_ip["ip"]}
        headers = {
             "user-agent": item_fwq_ip['user_agent']
        }
        try:
            response = requests.get(url=url, headers=headers, timeout=20).content
            if response:
                return response
        except Exception as f:
            print("重新請求")
            i = 0
            while True:
                i += 1
                if i >= 5:
                    return "無結果"
                try:
                    response = requests.get(url=url, headers=headers, proxies=proxies, timeout=20).content
                    if response:
                        return response
                except Exception as f:
                    print("重新請求")
        
    def requests_url_post(self, url, data):
        """
            發送請求,回傳相應
        """
        item_fwq_ip = read_setttings_zhuce("Software\lxl\lxl_program")
        # 讀取實時寫入windows注冊表中的ip代理  本人喜歡使用無憂代理 不是打廣告,而是品質確實好
        proxies = {"http": "%s" % item_fwq_ip["ip"], "https": "%s" % item_fwq_ip["ip"]}
        headers = {
            "user-agent": item_fwq_ip['user_agent']
        }
        try:
            response = requests.post(url=url, headers=headers, data=data,timeout=20).content
            if response:
                return response
        except Exception as f:
            print("重新請求")
            i = 0
            while True:
                i += 1
                if i >= 5:
                    return "無結果"
                try:

                    response = requests.post(url=url, headers=headers, data=data, proxies=proxies, timeout=20).content
                    if response:
                        return response
                except Exception as f:
                    print("重新請求")
    
    def __del__(self):
        self.cursor.close()
        self.conn.close()
        print("資料庫關閉中......")


def main_thread(number_p):
    """
        多執行緒啟動
        若使用多執行緒爬取是 將 main 函式改為 run 函式 傳遞引數控制url使用個數從而決定多執行緒條數
    """
    print("多執行緒啟動程式")
    list_thread = list()
    for p in range(0, number_p+1000, 1000):
        thread = ALi_Main(p)
        list_thread.append(thread)
    
    for threads in list_thread:
        threads.start()
    
    for threads in list_thread:
        threads.join()


if __name__ == '__main__':
    # 初始化
    # settings.main()
    
    alm = ALi_Main(0)

    meta = dict()
    meta["key_name"] = "傳值"
    url = "https://search.sina.com.cn/?range=title&q=" + str(meta["key_name"]) + "&c=news&time=&ie=utf-8&col=&source=&from=&country=&size=&a=&page=1&pf=0&ps=0&dpc=1"
    print(url)
    alm.main(url=url, meta=meta)

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/183458.html

標籤:其他

上一篇:Python零基礎入門學習筆記(一)

下一篇:Python爬蟲:AcFun彈幕視頻網

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more