Pytorch - torchvision計算機視覺工具庫-有解無憂

簡介

torchvision是Pytorch的計算機視覺工具庫，是Pytorch專門用于處理影像的庫，

torchvision.models中包含了許多已經訓練好的模型，可以通過models直接呼叫，
模型

torchvision.datasets中，包含了許多已經被處理過的圖片資料集，可以通過datasets直接呼叫，
資料集

transforms模塊提供了一般的影像預處理方法，例如

裁剪	作用
CenterCrop	從影像中心裁剪影像
RandomCrop	從圖片中隨即裁剪出給定尺寸的圖片（可填充）
ResizedCrop	隨即大小，長寬比剪裁圖片
FiveCrop	在圖片的四個角和中心各截取一幅尺寸為size的圖片
TenCrop	在FiveCrop的基礎上進行水平和垂直翻轉，默認為水平翻轉

影像處理	作用
Pad	對圖片邊緣進行填充
Resize	修改影像解析度
ColorJitter	調整亮度，對比度，飽和度和色相
Grayscale	轉換為灰度
RandomGrayscale	依概率轉換為灰度圖片
RandomAffine	對影像進行仿射變換（二維的線性變換），即旋轉、平移、縮放、錯切和翻轉
RandomErasing	對影像進行隨機遮擋
Normalize	逐channel的對影像進行標準化， output = (input - mean) / std
Lanbda	用戶自定義Lambda方法
Totensor	轉化為張量
LinearTransformation	對矩陣做線性變換，可以用于白化處理
ToPILImage	將ndarray或者張良轉化為PIL Image型別資料

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/41717.html

標籤：其他