主頁 >  其他 > 0701-資料處理

0701-資料處理

2021-04-28 08:04:18 其他

0701-資料處理

目錄
  • 一、概述
  • 二、加載自定義資料集
  • 三、利用 torchvision 工具處理資料集
  • 四、ImageFolder 的使用——處理資料集
  • 五、DataLoader 的使用——批加載資料
  • 六、處理損壞圖片
  • 七、資料采樣

pytorch完整教程目錄:https://www.cnblogs.com/nickchen121/p/14662511.html

一、概述

在機器學習中,尤其是在深度學習中,需要耗費大量的精力去處理資料,并且資料的處理對訓練神經網路來說也是很重要的,良好的資料不僅會加速模型的訓練,也可以提高模型的效率,

為此,torch 提供了幾個高效便捷的工具,以便使用者更方便的對資料做處理,同時也可以并行化加速資料加載,

二、加載自定義資料集

在 torch 中,可以加載自定義資料集,在這個程序中,需要自定義資料集物件,資料集物件將被抽象為 Dataset 類,也就是說實作自定義的資料集需要繼承 Dataset,同時也需要實作兩個 Python 魔法方法:

  • __getiter__:回傳一條資料或一個樣本,obj[index] 等價于 obj.__getitem__(index)
  • __len__:回傳樣本的數量,len(obj) 等價于 obj.__len__()

在這里我們以 Kaggle 經典挑戰賽“Dogs vs. Cat”的資料為例,詳細講解如何處理資料,其中該資料是一個分類問題的資料,判斷一張圖片是狗還是貓,它的所有圖片都放在一個檔案夾下,并可以根據檔案名的前綴是狗還是貓,需要圖片資料的可以加我微信:chenyoudea

import os

imgs = os.listdir('./img/dogcat')  # 獲取./img/dogcat下的所有圖片檔案
for img in imgs:
    print(img)
dog.12497.jpg
cat.12484.jpg
cat.12485.jpg
dog.12496.jpg
cat.12487.jpg
cat.12486.jpg
dog.12498.jpg
dog.12499.jpg
import os
import torch as t
import numpy as np
from PIL import Image
from torch.utils import data


class DogCat(data.Dataset):
    def __init__(self, root):
        imgs = os.listdir(root)
        # 所有圖片的絕對路徑
        # 這里不實際加載圖片,只是指定路徑
        # 當呼叫__getitem__時才會真正讀圖片
        self.imgs = [os.path.join(root, img) for img in imgs]

    def __getitem__(self, index):
        img_path = self.imgs[index]
        # dog->1, cat->0
        label = 1 if 'dog' in img_path.split(
            '/')[-1] else 0  # 通過對圖片檔案名前綴的判斷給圖片增加標簽
        pil_img = Image.open(img_path)  # 打開圖片
        array = np.asarray(pil_img)  # 把圖片轉為 ndarray 資料
        data = https://www.cnblogs.com/nickchen121/archive/2021/04/27/t.from_numpy(array)  # 把圖片轉為 Tensor 資料
        return data, label


dataset = DogCat('./img/dogcat/')
# img, label = dataset[0]  # 相當于呼叫 dataset.__getitem__(0)
for img, label in dataset:
    print(img.size(), img.float().mean(), label)
torch.Size([375, 499, 3]) tensor(150.5080) 1
torch.Size([500, 497, 3]) tensor(106.4915) 0
torch.Size([499, 379, 3]) tensor(171.8085) 0
torch.Size([375, 499, 3]) tensor(116.8139) 1
torch.Size([374, 499, 3]) tensor(115.5177) 0
torch.Size([236, 289, 3]) tensor(130.3004) 0
torch.Size([377, 499, 3]) tensor(151.7174) 1
torch.Size([400, 300, 3]) tensor(128.1550) 1


/Applications/anaconda3/lib/python3.6/site-packages/ipykernel_launcher.py:23: UserWarning: The given NumPy array is not writeable, and PyTorch does not support non-writeable tensors. This means you can write to the underlying (supposedly non-writeable) NumPy array using the tensor. You may want to copy the array to protect its data or make it writeable before converting it to a tensor. This type of warning will be suppressed for the rest of this program. (Triggered internally at  ../torch/csrc/utils/tensor_numpy.cpp:143.)

上述所示的 /Applications/anaconda3/lib…… 的錯誤,是因為圖片是 git 上拿下來的,沒有修改權限,我懶得修改了,自己有空把它修改下,反正沒啥影響,

對于我們自定義的資料集,我們已經學會了如何通過代碼定義這樣的資料集,但是這樣的資料并不適合使用,因為它們有兩個這樣的問題:

  1. 每張圖片的大小不一樣,這對于需要取 batch 訓練的神經網路來說并不友好
  2. 回傳樣本的數值較大,沒有歸一化到 [-1,1]

三、利用 torchvision 工具處理資料集

為了解決上一節的遺留的問題,torch 提供了 torchvision,它是一個視覺工具包,提供了很多視覺影像處理的工具,其中 transform 模塊提供了對 PIL Image 物件和 Tensor 物件的常用操作,如果想更詳細的了解這個工具,可以去去查看官方檔案:https://github.com/pytorch/vision/

對 PIL Image 的常見操作如下:

  • Resize:調整圖片尺寸
  • CenterCrop、RandomCrop、RandomSizedCrop:裁剪圖片
  • Pad:填充
  • ToTensor:把 PIL Image 物件轉成 Tensor,會自動將 [0,255] 歸一化為 [0,1]

對 Tensor 的常見操作如下:

  • Normalize:標準化,即減均值,除以標準差
  • ToPILImage:將 Tensor 轉為 PIL Image 物件

如果需要對圖片進行多個操作,可以通過 Compose 把這些操作拼接起來,類似于 nn.Sequential,需要注意的是,這些操作定義后是以物件的形式存在,真正使用時需要呼叫它的 __call__ 方法,類似于 nn.Module

例如,如果要把圖片調整為 224*224,首先構建操作 trans = Scale((224,224)),然后呼叫 trans(img),接下來我們就用 transform 的這些操作來優化上面實作的 dataset,

import os
from PIL import Image
import numpy as np
from torchvision import transforms as T

transform = T.Compose([
    T.Resize(224),  # 縮放圖片,保持長寬比不變,最短邊為 224 像素
    T.CenterCrop(224),  # 從圖片中間切出 224*224 的圖片
    T.ToTensor(),  # 把圖片轉成 Tensor,歸一化至 [0,1]
    T.Normalize(mean=[.5, .5, .5], std=[.5, .5, .5])  # 標準化至 [-1,1]
])


class DogCat(data.Dataset):
    def __init__(self, root, transforms=None):
        imgs = os.listdir(root)
        self.imgs = [os.path.join(root, img) for img in imgs]  # 拼接圖片路徑
        self.transforms = transforms  # 作為圖片是否進行處理的標志

    def __getitem__(self, index):
        img_path = self.imgs[index]
        label = 0 if 'dog' in img_path.split('/')[-1] else 1
        data = https://www.cnblogs.com/nickchen121/archive/2021/04/27/Image.open(img_path)
        if self.transforms:  # 判斷圖片是否需要進行處理
            data = self.transforms(data)
        return data, label

    def __len__(self):
        return len(self.imgs)


dataset = DogCat('./img/dogcat/', transforms=transform)
img, label = dataset[0]
for img, label in dataset:
    print(img.size(), label)
torch.Size([3, 224, 224]) 0
torch.Size([3, 224, 224]) 1
torch.Size([3, 224, 224]) 1
torch.Size([3, 224, 224]) 0
torch.Size([3, 224, 224]) 1
torch.Size([3, 224, 224]) 1
torch.Size([3, 224, 224]) 0
torch.Size([3, 224, 224]) 0

從上述代碼可以看到 transforms 的強大,除了這些,transforms 還可以通過 Lambda 封裝自定義的轉換策略,

例如,如果相對 PIL Image 進行隨機旋轉,則可以寫成 trans = T.Lambda(lambda img: img.rotate(random()*360))

上面我們說到了如何加載自定義的資料集,對于很多研究者來說,只是想試驗自己的演算法有沒有問題,如果自己去獲取資料,再加上深度學習對資料量的要求,那是非常困難的,

為此 torchvision 預先實作了常用的 Dataset,包括 CIFAR-10、ImageNet、COCO、MNIST、LSUN 等資料集,可以通過呼叫 torchvision.datasets 下相應的物件來呼叫相關的資料集,具體的使用方法可以查看官方檔案:https://pytorch.org/vision/stable/datasets.html

四、ImageFolder 的使用——處理資料集

本節介紹一個我們經常會用到的一個 Dataset——ImageFolder,它的實作和上述 DogCat類 的功能類似,主要是對圖片進行處理,

ImageFoder 假設所有的檔案按檔案夾保存,每個檔案夾下存盤同一個類別的圖片,檔案夾名為類名,它的建構式如下所示:ImageFolder(root, transform=None, target_transform=None, loader=default_loader)

它主要有以下四個引數:

  • root:在 root 指定的路徑下尋找圖片
  • transform:對 PIL Image進行轉換操作,transform 的輸入是使用 loader 讀取圖片的回傳物件
  • target_transform:對 label 的轉換
  • loader:指定加載圖片的函式,默認操作是讀取為 PIL Image 物件

label 是按照檔案夾名字順序排序后存成字典的,即 {類名:類序號(從 0 開始)},一般來說最好直接將檔案命名為從 0 開始的數字,這樣回合 ImageFolder 實際的 label 一致,

from torchvision.datasets import ImageFolder

dataset = ImageFolder('./img/dogcat_2')

# cat 檔案夾的圖片對應 label 0,dog 對應 1
dataset.class_to_idx
{'cat': 0, 'dog': 1}
# 所有圖片的路徑和對應的 label
dataset.imgs
[('./img/dogcat_2/cat/cat.12484.jpg', 0),
 ('./img/dogcat_2/cat/cat.12485.jpg', 0),
 ('./img/dogcat_2/cat/cat.12486.jpg', 0),
 ('./img/dogcat_2/cat/cat.12487.jpg', 0),
 ('./img/dogcat_2/dog/dog.12496.jpg', 1),
 ('./img/dogcat_2/dog/dog.12497.jpg', 1),
 ('./img/dogcat_2/dog/dog.12498.jpg', 1),
 ('./img/dogcat_2/dog/dog.12499.jpg', 1)]
dataset[0][1]  # 第一維是第幾張圖,第二維為 1 回傳 label
0
# 沒有任何的 transform,多以回傳的還是 PIL Image 物件
dataset[0][0]  # 為 0 回傳圖片資料,回傳的 Image 物件如下圖所示

# 加上 transform
normalize = T.Normalize(mean=[0.4, 0.4, 0.4], std=[0.2, 0.2, 0.2])
transform = T.Compose([
    T.RandomResizedCrop(224),
    T.RandomHorizontalFlip(),
    T.ToTensor(),
    normalize,
])
dataset = ImageFolder('img/dogcat_2', transform=transform)
dataset[0][0].size()  # 深度學習圖片資料一般保存成 C*H*W,即 通道數*圖片高*圖片寬
torch.Size([3, 224, 224])
to_img = T.ToPILImage()
# 0.2 和 0.4 是標準差和均值的近似
to_img(dataset[0][0]*0.2+0.4) # 程式輸出如下圖所示

五、DataLoader 的使用——批加載資料

Dataset 只負責抽象資料,并且一次呼叫 __getitem__ 只回傳一個樣本,

在訓練神經網路的時候,是對一個 batch 的資料進行操作,同時還需要對資料進行 shuffle 和并行加速等,為此,torch 提供了 DataLoader 去實作這些功能,

DataLoader 的函式定義如下:

DataLoader(dataset,
           batch_size=1,
           shuffle=False,
           sampler=None,
           num_workers=0,
           collate_fn=default_collate,
           pin_memory=False,
           drop_last=False)
  • dataset:加載的資料集(Dataset 物件)
  • batch_size:batch size(批大小)
  • shuffle:是否把資料打亂
  • sampler:樣本抽樣,后面會詳細解釋
  • num_workers:使用多行程加載的行程數,0 表示不使用多行程
  • collate_fn:如何把多個資料拼接成一個 batch,一般使用默認的方式就可以了
  • pin_memory:是否將資料保存在 pin memory 區,pin memory 中的資料轉到 GPU 中速度會快一些
  • drop_last:dataset 中的資料個數可能不是 batch_size 的整數倍,drop_last 為 True,會把多出來不足一個 Batch 的資料丟棄
from torch.utils.data import DataLoader

dataloader = DataLoader(dataset,
                        batch_size=3,
                        shuffle=True,
                        num_workers=0,
                        drop_last=False)

dataiter = iter(dataloader)  # dataloader是一個可迭代物件,通過 iter 把 dataloader 變成一個迭代器
imgs, labels = next(dataiter)
imgs.size()  # batch_size,channel,height,weight
torch.Size([3, 3, 224, 224])

dataloader 是一個可迭代的物件,因此可以像使用迭代器一樣使用它,迭代器如果你忘記了是啥,可以看這篇文章:迭代器

# 迭代器的兩種使用方法
# 第一種直接獲取所有資料,資料量大不建議使用
for batch_datas, batch_labels in dataloader:
    train()

# 第二種只生成一個迭代器,用一個取一個資料
dataiter = iter(dataloader)
imgs, labels = next(dataiter)

六、處理損壞圖片

class NewDogCat(DogCat):
    def __getitem__(self, index):
        try:
            # 呼叫父類的獲取函式,相當于 DogCat.__getitem__(self,index)
            return super(NewDogCat, self).__getitem__(index)
        except:
            return None, None  # 獲取例外的物件回傳 None


from torch.utils.data.dataloader import default_collate  # 匯入默認的拼接方式


def my_collate_fn(batch):
    """
    batch 中每個元素形如(data,label)
    """
    batch = list(filter(lambda x: x[0] is not None, batch))  # 過濾為 None 的資料
    return default_collate(batch)  # 用默認方式拼接過濾后的 batch 資料


dataset = NewDogCat('img/dogcat_wrong/', transforms=transform)
dataset[6]
(None, None)
dataloader = DataLoader(dataset, 2, collate_fn=my_collate_fn, num_workers=0)
for batch_datas, batch_labels in dataloader:
    print(batch_datas.size(), batch_labels.size())
torch.Size([2, 3, 224, 224]) torch.Size([2])
torch.Size([2, 3, 224, 224]) torch.Size([2])
torch.Size([2, 3, 224, 224]) torch.Size([2])
torch.Size([1, 3, 224, 224]) torch.Size([1])
torch.Size([1, 3, 224, 224]) torch.Size([1])

通過查看上面的列印結果,可以看到第 4 個 batch_size 為 1,這是因為其中有一張圖片損壞,而最后一個 batch_size 也是 1,是因為總共有 9 張圖片,無法整除 2,因此最后一個 batch 的資料會少于 batch_size,可以通過指定 drop_last=True 丟棄最后一個樣本數目不足 batch_size 的 batch,

除了上述所說的方法,對于損壞或資料集加載例外等情況,還可以通過其他方法解決,例如遇到例外圖片,就可以隨機選擇另外一張圖片代替,則 batch_size 就不會小于規定的 batch_size,

class NewDogCat(DogCat):
    def __getitem__(self, index):
        try:
            return super(NewDogCat, self).__getitem__(index)
        except:
            new_index = random.randint(0, len(self) - 1)
            return self[new_index]

上述所說的方法看起來很好,但是如果我們換個角度去想,我為什么要讓檔案夾里面有一張例外的圖片呢?因此為了防止圖片例外,更應該對資料進行徹底清洗,

DataLoader 為了實作多行程加速,它封裝了 Python 的標準庫 multiprocessing,因此在 Dataset 和 DataLoader 使用時有以下兩個建議:

  1. 高負載的操作放在 __getitem__中,如加載圖片等
  2. dataset 中應該盡量只包含只讀物件,避免修改任何可變物件

第一點是因為多行程會并行地呼叫 __getitem__ 函式,把負載高的放在 __getitem__ 函式中能夠實作并行加速,

第二點是因為 dataloader 使用多行程加載,如果在 Dataset 中使用了可變物件,可能會有意想不到的沖突,在多執行緒/多行程中,修改一個可變物件需要加鎖,但是 dataloader 的設計讓它很難加鎖,因此最好避免在 dataset 中修改可變物件,

下面就是一個不好的例子,在多行程中處理的 self.num 可能和預期不符,這種問題不會報錯,所以很難發現,如果真的一定要修改可變物件,可以使用 Python 標準庫 Queue 中的相關資料結構,

class BadDataset(data.Dataset):
    def __init__(self):
        self.datas = range(10)
        self.num = 0  # 取資料的次數

    def __getitem__(self, index):
        self.num += 1
        return self.datas[index]

使用 Python 的 multiprocessing 庫的另一個問題就是,在使用多行程時,如果主程式例外終止,相應的資料加載行程可能無法正常退出,這個時候你可能會發現程式已經退出了,但是 GPU 顯存和記憶體仍然被占用著,這個時候就需要手動強行終止行程,

七、資料采樣

torch 中還單獨提供了一個 sampler 模塊,用來進行資料采樣,常用的有隨機采樣器 RandomSampler,當 dataloader 的 shuffle 引數為 True 時,系統就會自動呼叫這個采樣器,進而打亂資料,

默認的采樣器是 SequentialSampler,它會按順序一個一個進行采樣,

在這里介紹另外一個很有用的采樣方法 WeightedRandomSampler,它會根據每個樣本的權重選取資料,在樣本比例不均衡的問題中,可以用它進行重采樣,

構建 WeightedRandomSampler 時需要提供3個引數:

  • 每個樣本的權重weights
  • 共選取的樣本總數 num_samples
  • 可選引數 replacement,指定是否可以重復選取一個樣本,默認為 True,也就是說允許一個 epoch 中重復采樣一個資料,如果設定為 False,則當某一類樣本被全部選取結束后,它的樣本還沒有達到 num_samples 時,sampler 將不會再從該類中選擇資料,此時可能會導致 weights 引數失效

注:權重越大的樣本被選中的概率越大,待選取的樣本數目一般小于全部的樣本數目,

dataset = DogCat('./img/dogcat/', transforms=transform)
# 狗的圖片被取出的概率是貓的概率的兩倍
# 兩類圖片被取出的概率和 weights 的絕對大小無關,只和比值有關,例如這里的比值為 2:1
weights = [2 if label == 1 else 1 for data, label in dataset]
weights
[1, 2, 2, 1, 2, 2, 1, 1]
from torch.utils.data.sampler import WeightedRandomSampler

sampler = WeightedRandomSampler(weights, num_samples=9, replacement=True)
dataloader = DataLoader(dataset, batch_size=3, sampler=sampler)

for datas, labels in dataloader:
    print(labels.tolist())
[1, 1, 1]
[1, 0, 0]
[1, 0, 1]

從上面可以看到貓狗樣本的比例約為 1:2,另外一共只有 8 個樣本,卻回傳了 9 個,說明有樣本被重復回傳,這就是 replacement 引數的左右,下面我們把 replacement 設為 False,

# 如果 weights 設定為 100:1,則 貓 的被選中的概率幾乎為 0
weights = [100 if label == 1 else 1 for data, label in dataset]

sampler = WeightedRandomSampler(weights, num_samples=9, replacement=True)
dataloader = DataLoader(dataset, batch_size=3, sampler=sampler)

for datas, labels in dataloader:
    print(labels.tolist())
[1, 1, 1]
[1, 1, 1]
[1, 1, 1]
sampler = WeightedRandomSampler(weights, 8, replacement=False)
dataloader = DataLoader(dataset, batch_size=4, sampler=sampler)
for datas, labels in dataloader:
    print(labels.tolist())
[1, 1, 1, 1]
[0, 0, 0, 0]

從上面的代碼可以看到,num_samples 等于 dataset 的樣本總數,為了不重復選取,sampler 會把每個樣本都回傳,這樣就失去了 weight 引數的意義,

從上面的例子可以看出 sampler 在樣本采樣中的作用:如果指定了 sampler,shuffle 將不會再生效,并且 sampler.num_samples 會覆寫 dataset 的實際大小,也就是一個 epoch 回傳的圖片總數取決于 sampler.num_samples,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/280890.html

標籤:其他

上一篇:0101-數學優化

下一篇:如何通過SSH將TortoiseGit小烏龜關聯GitLab

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more