multiprocessing.pool無法在tf.data中加速-有解無憂

我想用multiprocessing.poolintf.data來加速我的增強功能。但是結果比正常的for回圈慢。

multiprocessing.pool 花費大約：72s

正常for回圈花費大約：57s

我的環境：python3.6，tensorflow-gpu2.4.0，Ubuntu20.04

下面是我的代碼，我做錯了什么？

先決條件謝謝！

import numpy as np
import tensorflow as tf
from functools import partial
import multiprocessing

INPUT_SHAPE = (2000,6)
OUTPUT_SHAPE = (200,6)


def resizing(i ,data, enable, choice):
    if i==0:
        overlap=0
    else:
        overlap= 5 if enable >= 0.5 else 0
    if choice == 0:
        return [np.mean(data[i-overlap: i 10 overlap,0]),
                np.mean(data[i-overlap: i 10 overlap,1]),
                np.mean(data[i-overlap: i 10 overlap,2]),
                np.mean(data[i-overlap: i 10 overlap,3]),
                np.mean(data[i-overlap: i 10 overlap,4]),
                np.mean(data[i-overlap: i 10 overlap,5])]
    elif choice == 1:
        return [np.std(data[i-overlap: i 10 overlap,0]),
                np.std(data[i-overlap: i 10 overlap,1]),
                np.std(data[i-overlap: i 10 overlap,2]),
                np.std(data[i-overlap: i 10 overlap,3]),
                np.std(data[i-overlap: i 10 overlap,4]),
                np.std(data[i-overlap: i 10 overlap,5])]
    elif choice == 2:
        return [np.max(data[i-overlap: i 10 overlap,0]),
                np.max(data[i-overlap: i 10 overlap,1]),
                np.max(data[i-overlap: i 10 overlap,2]),
                np.max(data[i-overlap: i 10 overlap,3]),
                np.max(data[i-overlap: i 10 overlap,4]),
                np.max(data[i-overlap: i 10 overlap,5])]
    elif choice == 3:
        return [np.min(data[i-overlap: i 10 overlap,0]),
                np.min(data[i-overlap: i 10 overlap,1]),
                np.min(data[i-overlap: i 10 overlap,2]),
                np.min(data[i-overlap: i 10 overlap,3]),
                np.min(data[i-overlap: i 10 overlap,4]),
                np.min(data[i-overlap: i 10 overlap,5])]

def resize_data(data, pool_obj):

    choice = tf.random.uniform(shape=(), minval=0,maxval=4,dtype=tf.int64).numpy()
    enable = tf.random.uniform(shape=(), minval=0,maxval=1,dtype=tf.float64).numpy()
    new_data = pool_obj.map(partial(resizing, 
                                    data=data,
                                    enable=enable, 
                                    choice=choice), 
                            range(0,2000,10))
  # new_data = []
  # for i in range(0,2000,10):
  #     new_data.append(resizing(i ,data, enable, choice))
    
    return np.array(new_data)


def augmentation(data, labels, pool_obj):
    def aug(data):
        data = data.numpy()
        
        ...      

        # 2000 resize to 200
        data = resize_data(data, pool_obj)
        
        ...
        
        return tf.convert_to_tensor(data, tf.float64)

    data = tf.py_function(aug, [data], [tf.float64])[0]
    data.set_shape(OUTPUT_SHAPE)
    return data, labels

def test(trainDS):
    for d in trainDS:
        X, y = d
        print(i, X.shape, y.shape)
        

if __name__ == '__main__':
    pool_obj = multiprocessing.Pool()
    trainDS = tf.data.Dataset.from_tensor_slices(getDataSet_Path())
    trainDS = (
        trainDS
        .map(load_data, num_parallel_calls=tf.data.AUTOTUNE)
        .cache()
        .shuffle(300, reshuffle_each_iteration=False)
        .map(partial(augmentation, pool_obj=pool_obj), num_parallel_calls=tf.data.AUTOTUNE)
        .batch(128, drop_remainder=True)
        .prefetch(tf.data.AUTOTUNE)
    )
    
    test(trainDS)

uj5u.com熱心網友回復：

TensorFlow Dataset API 已經配備了內置的多處理功能。只需使用num_parallel_calls引數 inmap和prefetch功能，無需任何 pythonic 多處理工具。此外，僅將 TensorFlow 風格的函式傳遞給map可以轉換為圖形的函式。特別是，應避免使用Python的if塊，嘗試tf.cond，tf.where等來代替。也不推薦使用 Numpy 例程，類似地使用 TensorFlow。按照像導游這樣。

轉載請註明出處，本文鏈接：https://www.uj5u.com/qiye/406131.html

標籤：

上一篇：稀疏分類交叉熵導致NAN丟失

下一篇：張量板損失函式中y軸的單位是什么？