主頁 >  其他 > Dive into TensorFlow系列(2)- 決議TF核心抽象op算子

Dive into TensorFlow系列(2)- 決議TF核心抽象op算子

2022-11-19 07:21:03 其他

本文作者:李杰

TF計算圖從邏輯層來講,由op與tensor構成,op是項點代表計算單元,tensor是邊代表op之間流動的資料內容,兩者配合以資料流圖的形式來表達計算圖,那么op對應的物理層實作是什么?TF中有哪些op,以及各自的適用場景是什么?op到底是如何運行的?接下來讓我們一起探索和回答這些問題,

一、初識op

1.1 op定義

op代表計算圖中的節點,是tf.Operation物件,代表一個計算單元,用戶在創建模型和訓練代碼時,會創建一系列op及其依賴關系,并將這些op和依賴添加到tf.Graph物件中(一般為默認圖),比如:tf.matmul()就是一個op,它有兩個輸入tensor和一個輸出tensor,

1.2 op分類

op的分類一般有多個視角,比如按是否內置劃分、按作業型別劃分,

按是否內置劃分,一般分為:內置op和自定義op(見“二、自定義op”部分介紹),

按作業型別劃分,一般分為:常見數學op、陣列op、矩陣op、有狀態op、神經網路op、檢查點op、佇列與同步op、控制流op,TF白皮書對內置op的分類總結如下:


 

1.3 op與kernel

op一般都有名稱且代表一個抽象的計算程序,op可以設定若干屬性,但這些屬性必須在編譯期提供或推理得到,因為它們用來實體化一個節點物件從而執行真正的計算,屬性的經典用法就是拿來支持型別多型,比如兩個浮點張量的矩陣乘法與兩個整型張量的矩陣乘法,

kernel是op在指定設備型別(CPU/GPU)上的具體實作,TF二進制庫通過注冊機制定義了一系列op及對應的kernel實作,用戶可以提供額外的op定義與kernel實作進行擴充,一般來說,一個op對應多個kernel實作,

接下來讓我們一起用矩陣乘法MatMul算子的相關代碼來理解op與kernel的關系(此處不必糾結代碼細節,只需體會op與kernel關系即可):

// 首先給出op注冊的定義,其中輸入輸出支持泛型,其合法型別在Attr中進行列舉,
// 代碼位置 tensorflow1.15.5\tensorflow\core\ops\math_ops.cc
REGISTER_OP("MatMul")
    .Input("a: T")
    .Input("b: T")
    .Output("product: T")
    .Attr("transpose_a: bool = false")
    .Attr("transpose_b: bool = false")
    .Attr(
        "T: {bfloat16, half, float, double, int32, int64, complex64, "
        "complex128}")
    .SetShapeFn(shape_inference::MatMulShape);
    
// MatMul的實作,采用類模板機制
// 代碼位置 tensorflow1.15.5\tensorflow\core\kernels\matmul_op.cc
template <typename Device, typename T, bool USE_CUBLAS>
class MatMulOp : public OpKernel {
  public:
    explicit MatMulOp(OpKernelConstruction* ctx)
      : OpKernel(ctx), algorithms_set_already_(false) {
      OP_REQUIRES_OK(ctx, ctx->GetAttr("transpose_a", &transpose_a_));
      OP_REQUIRES_OK(ctx, ctx->GetAttr("transpose_b", &transpose_b_));

      LaunchMatMul<Device, T, USE_CUBLAS>::GetBlasGemmAlgorithm(
        ctx, &algorithms_, &algorithms_set_already_);
      use_autotune_ = MatmulAutotuneEnable();
    }
  // 省略了很多代碼...  
  private:
    std::vector<int64> algorithms_;
    bool algorithms_set_already_;
    bool use_autotune_;
    bool transpose_a_;
    bool transpose_b_;
};

// MatMul的op定義與kernel實作系結處理
// 代碼位置 tensorflow1.15.5\tensorflow\core\kernels\matmul_op.cc
#define REGISTER_CPU_EIGEN(T)  /*cpu與eigen組合對應實作*/                       \
  REGISTER_KERNEL_BUILDER(                                                     \
      Name("MatMul").Device(DEVICE_CPU).TypeConstraint<T>("T").Label("eigen"), \
      MatMulOp<CPUDevice, T, false /* cublas, ignored for CPU */>);

#define REGISTER_CPU(T)      /*cpu對應實作(eigen與非eigen)*/         \
  REGISTER_KERNEL_BUILDER(                                          \
      Name("MatMul").Device(DEVICE_CPU).TypeConstraint<T>("T"),     \
      MatMulOp<CPUDevice, T, false /* cublas, ignored for CPU */>); \
  REGISTER_CPU_EIGEN(T);

#define REGISTER_GPU(T)     /*gpu對應實作(cublas與非cublas)*/       \
  REGISTER_KERNEL_BUILDER(                                         \
      Name("MatMul").Device(DEVICE_GPU).TypeConstraint<T>("T"),    \
      MatMulOp<GPUDevice, T, true /* cublas, true by default */>); \
  REGISTER_KERNEL_BUILDER(Name("MatMul")                           \
                              .Device(DEVICE_GPU)                  \
                              .TypeConstraint<T>("T")              \
                              .Label("cublas"),                    \
                          MatMulOp<GPUDevice, T, true /* cublas */>)

 

 

二、自定義op

用戶撰寫的模型訓練代碼一般由TF原生的op算子及其依賴關系組成,但有時候我們定義的計算邏輯在TF中沒有相應的op實作,根據TensorFlow官網的建議,我們應當先組合python op算子或python函式進行嘗試,完成嘗試之后再決定要不要自定義op,

2.1 自定義op場景

一般來說,需要自定義op的場景有如下3個:

?用TF原生op組合來表達新計算邏輯的程序比較復雜或不可能 ?用TF原生op組合來表達新計算邏輯,其計算性能較低 ?在新版編譯器中也較難實作op融合的計算邏輯需要我們手動實作融合

在此舉個例子方便大家理解,假如我們要實作一個新計算實邏:中位數池化(median pooling),程序中要在滑動視窗不斷求得中位數,檢索TF檔案沒有發現對應op,因此我們先考慮用TF python op組合來實作它,果然通過ExtractImagePatches and TopK就可以實作這個功能,經測驗前述組合方案并不是計算和存盤高效的,因此我們就有必要將median pooling在一個op中進行高效實作,

2.2 自定義op流程

自定義op一般遵循5個基本步驟:

1.注冊op,具體包括:指定名稱、輸入/輸出宣告、形狀函式, 2.定義kernel(即op的實作)并與op系結,一個op有多個kernel實作,具體由輸入輸出型別、硬體(CPU、GPU)決定, 3.創建python包裝器,一般由op注冊機制自動完成, 4.撰寫op的梯度計算函式(可選項), 5.測驗op,通過python測驗較為方便,當然也可通過C++進行測驗,

接下來我們就以官網最簡單的ZeroOut同步式自定義op(繼承OpKernel)為例,結合代碼來講述上述5個步驟,下面先給出步驟1和步驟2用C++實作的代碼(官方推薦用bazel編譯so檔案):

// 步驟1:注冊op
REGISTER_OP("ZeroOut")
.Input("to_zero: int32")
.Output("zeroed: int32")
.SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
    c->set_output(0, c->input(0));    //c's input and output type is std::vector<ShapeHandle>
    return Status::OK();
    });

// 步驟2:定義kernel(常規CPU設備),并把kernel與op系結
class ZeroOutOp : public OpKernel {
public:
    explicit ZeroOutOp(OpKernelConstruction* context) : OpKernel(context) {}

    void Compute(OpKernelContext* context) override {
        // Grab the input tensor from OpKernelContext instance
        const Tensor& input_tensor = context->input(0); 
        auto input = input_tensor.flat<int32>();

        // Create an output tensor
        Tensor* output_tensor = NULL;
        OP_REQUIRES_OK(context, context->allocate_output(0, input_tensor.shape(),
            &output_tensor));    // OP_REQUIRES_OK第二個引數一般為方法呼叫,此處為輸出張量分配記憶體空間
        auto output_flat = output_tensor->flat<int32>();

        // Set all but the first element of the output tensor to 0.
        const int N = input.size();
        for (int i = 1; i < N; i++) {
            output_flat(i) = 0;
        }

        // Preserve the first input value if possible.
        if (N > 0) output_flat(0) = input(0);
    }
};

REGISTER_KERNEL_BUILDER(Name("ZeroOut").Device(DEVICE_CPU), ZeroOutOp);

步驟3加載上述so檔案(自動完成前后端op映射);步驟4是可選項,此處不需要;步驟5基于python api測驗op功能,相應代碼如下:

import tensorflow as tf
zero_out_module = tf.load_op_library('./zero_out.so')    # 加載so檔案生成python module
with tf.Session(''):
  zero_out_module.zero_out([[1, 2], [3, 4]]).eval()

# Prints
array([[1, 0], [0, 0]], dtype=int32)

2.3 高級話題

關于op的技識訓題還有很多,我們在此簡述一些要點:

1.如果實作了一個多執行緒CPU kernel,則可以利用work_sharder.h中的Shard函式, 2.大多數op以同步方式作業,只需繼承OpKernel改寫Compute()方法,且此方法必須執行緒安全, 3.如果一個op因為其它op的運行而阻塞,則這個op可以采用異步方式作業,繼承AsyncOpKernel改寫ComputeAsync()方法,且此方法必須執行緒安全,異步op最經典的例子就是跨設備通信send/recv pair中的RecvOp, 4.如果要為op配置一些靜態屬性,可使用Attr,它有一套特有的支持型別,典型應用是支持泛型, 5.實作GPU kernel有兩部分內容:OpKernel和CUDA kernel,相應的加載代碼, 6.編譯自定義op,首先要配置頭檔案搜索路徑與庫檔案搜索路徑,接著指定編譯和鏈接選項,最后還要確保ABI兼容性, 7.Resource(資源)代表相同設備上op共享的內容,比如:張量值、kv存盤表、佇列、讀取器、網路連接等,代表資源的類必須繼承ResourceBase,然后注冊ResourceHandleOp生成資源句柄,普通op以resouce型別的Input進行引入,

三、op作業原理

3.1 op運行框架

整體來看,op與kernel都有其結構描述與統一的注冊管理中心,而OpDefBuilder有兩個包裝類OpDefBuilderWrapper和OpDefBuilderReceiver,前者支持op構建的鏈式語法,后者接受op構建結果并進行注冊,眾所周知,op是編譯期概念,而kernel是運行期概念,在AI編譯器的后端處理流程中會進行op的算子選擇,此程序會基于一系列策略為op匹配最合適的kernel實作,


 

3.2 若干技術細節

首先,我們來看一下大家在使用TensorFlow程序中經常碰到的libtensorflow_framework.so,按照tf1.15.5/tensorflow/BUILD中的描述,libtensorflow_framework.so定義了op和kernel的注冊機制而不涉及具體實作,

// rootdir=tensorflow1.15.5
// ${rootdir}/tensorflow/BUILD
/*
# A shared object which includes registration mechanisms for ops and
# kernels. Does not include the implementations of any ops or kernels. Instead,
# the library which loads libtensorflow_framework.so
# (e.g. _pywrap_tensorflow_internal.so for Python, libtensorflow.so for the C
# API) is responsible for registering ops with libtensorflow_framework.so. In
# addition to this core set of ops, user libraries which are loaded (via
# TF_LoadLibrary/tf.load_op_library) register their ops and kernels with this
# shared object directly.
*/
tf_cc_shared_object(
    name = "tensorflow_framework",
    framework_so = [],
    linkopts = select({
        "//tensorflow:macos": [],
        "//tensorflow:windows": [],
        "//tensorflow:freebsd": [
            "-Wl,--version-script,$(location //tensorflow:tf_framework_version_script.lds)",
            "-lexecinfo",
        ],
        "//conditions:default": [
            "-Wl,--version-script,$(location //tensorflow:tf_framework_version_script.lds)",
        ],
    }),
    linkstatic = 1,
    per_os_targets = True,
    soversion = VERSION,
    visibility = ["//visibility:public"],
    deps = [
        "//tensorflow/cc/saved_model:loader_lite_impl",
        "//tensorflow/core:core_cpu_impl",
        "//tensorflow/core:framework_internal_impl",    /* 展開此target進行查看 */
        "//tensorflow/core:gpu_runtime_impl",
        "//tensorflow/core/grappler/optimizers:custom_graph_optimizer_registry_impl",
        "//tensorflow/core:lib_internal_impl",
        "//tensorflow/stream_executor:stream_executor_impl",
        "//tensorflow:tf_framework_version_script.lds",
    ] + tf_additional_binary_deps(),
)

// ${rootdir}/tensorflow/core/BUILD
tf_cuda_library(
    name = "framework_internal_impl",
    srcs = FRAMEWORK_INTERNAL_PRIVATE_HEADERS + glob(   // 可以查看FRAMEWORK_INTERNAL_PRIVATE_HEADERS內容
        [
            "example/**/*.cc",
            "framework/**/*.cc",
            "util/**/*.cc",
            "graph/edgeset.cc",
            "graph/graph.cc",
            "graph/graph_def_builder.cc",
            "graph/node_builder.cc",
            "graph/tensor_id.cc",
            "graph/while_context.h",
            "graph/while_context.cc",
        ],
    // 省略了諸多代碼
)

// FRAMEWORK_INTERNAL_PRIVATE_HEADERS的內容
FRAMEWORK_INTERNAL_PRIVATE_HEADERS =  [
    "graph/edgeset.h",
    "graph/graph.h",
    "graph/graph_def_builder.h",
    "graph/node_builder.h",
    "graph/tensor_id.h",
] + glob(
    [
        "example/**/*.h",
        "framework/**/*.h",   // 這里就是重點,查看${rootdir}/tensorflow/core/framework/op.h和opkernel.h
        "util/**/*.h",
    ]
) 

// 先來看op.h
#define REGISTER_OP(name) REGISTER_OP_UNIQ_HELPER(__COUNTER__, name)
#define REGISTER_OP_UNIQ_HELPER(ctr, name) REGISTER_OP_UNIQ(ctr, name)
#define REGISTER_OP_UNIQ(ctr, name)                                          \
  static ::tensorflow::register_op::OpDefBuilderReceiver register_op##ctr    \
      TF_ATTRIBUTE_UNUSED =                                                  \
          ::tensorflow::register_op::OpDefBuilderWrapper<SHOULD_REGISTER_OP( \
              name)>(name)
              
// 再來看看opkernel.h
#define REGISTER_KERNEL_BUILDER(kernel_builder, ...) \
  REGISTER_KERNEL_BUILDER_UNIQ_HELPER(__COUNTER__, kernel_builder, __VA_ARGS__)

#define REGISTER_KERNEL_BUILDER_UNIQ_HELPER(ctr, kernel_builder, ...) \
  REGISTER_KERNEL_BUILDER_UNIQ(ctr, kernel_builder, __VA_ARGS__)

#define REGISTER_KERNEL_BUILDER_UNIQ(ctr, kernel_builder, ...)        \
  constexpr bool should_register_##ctr##__flag =                      \
      SHOULD_REGISTER_OP_KERNEL(#__VA_ARGS__);                        \
  static ::tensorflow::kernel_factory::OpKernelRegistrar              \
      registrar__body__##ctr##__object(                               \
          should_register_##ctr##__flag                               \
              ? ::tensorflow::register_kernel::kernel_builder.Build() \
              : nullptr,                                              \
          #__VA_ARGS__,                                               \
          [](::tensorflow::OpKernelConstruction* context)             \
              -> ::tensorflow::OpKernel* {                            \
            return new __VA_ARGS__(context);                          \
          });
參照上述同樣的流程,我們可以發現libtensorflow.so中涉及op與kernel的具體實作,同時也包括Session的具體實作,

最后,我們再來講講REGISTER_OP宏背后的具體原理,我們在上面已經給出了此宏的定義,此處針對它的實作展開談談:

// 先來看op.h
#define REGISTER_OP(name) REGISTER_OP_UNIQ_HELPER(__COUNTER__, name)
#define REGISTER_OP_UNIQ_HELPER(ctr, name) REGISTER_OP_UNIQ(ctr, name)
#define REGISTER_OP_UNIQ(ctr, name)                                          \
  static ::tensorflow::register_op::OpDefBuilderReceiver register_op##ctr    \
      TF_ATTRIBUTE_UNUSED =                                                  \
          ::tensorflow::register_op::OpDefBuilderWrapper<SHOULD_REGISTER_OP( \
              name)>(name)

// REGISTER_OP的一般用法如下
REGISTER_OP("ZeroOut")
    .Input("to_zero: int32")
    .Output("zeroed: int32")
    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {
      c->set_output(0, c->input(0));
      return Status::OK();
    });

// op定義的鏈式規則是通過OpDefBuilderWrapper類實作的
class OpDefBuilderWrapper<true> {
 public:
  explicit OpDefBuilderWrapper(const char name[]) : builder_(name) {}

  OpDefBuilderWrapper<true>& Input(string spec) {
    builder_.Input(std::move(spec));
    return *this;                        // 顯而易見,呼叫Input仍然回傳OpDefBuilderWrapper<true>本身
  }
  OpDefBuilderWrapper<true>& Output(string spec) {
    builder_.Output(std::move(spec));
    return *this;
  }

  OpDefBuilderWrapper<true>& SetShapeFn(
      Status (*fn)(shape_inference::InferenceContext*)) {
    builder_.SetShapeFn(fn);
    return *this;
  }
  const ::tensorflow::OpDefBuilder& builder() const { return builder_; }

 private:
  mutable ::tensorflow::OpDefBuilder builder_;
};

// 當通過鏈式規劃構建好op后,再通過OpDefBuilderReceiver完成op的注冊
// op.h
struct OpDefBuilderReceiver {
  // To call OpRegistry::Global()->Register(...), used by the
  // REGISTER_OP macro below.
  // Note: These are implicitly converting constructors.
  OpDefBuilderReceiver(
      const OpDefBuilderWrapper<true>& wrapper);  // NOLINT(runtime/explicit)
  constexpr OpDefBuilderReceiver(const OpDefBuilderWrapper<false>&) {
  }  // NOLINT(runtime/explicit)
};

// op.cc,然后在OpDefBuilderReceiver建構式內部完成OpDefBuilderWrapper的全域注冊
OpDefBuilderReceiver::OpDefBuilderReceiver(
    const OpDefBuilderWrapper<true>& wrapper) {
  OpRegistry::Global()->Register(
      [wrapper](OpRegistrationData* op_reg_data) -> Status {
        return wrapper.builder().Finalize(op_reg_data);
      });
}

四、總結

本文為大家系統講解了TensorFlow的核心抽象op及其kernel實作,需要自定義op的具體場景,以及op的運行框架及若干技術細節,讀罷此文,讀者應該有如下幾點識訓:

?TensorFlow中op是編譯期概念,kernel是運行期概念,兩者各自的定義與注冊方式,以及相應的映射邏輯, ?掌握TensorFlow的高階玩法:自定義op,這將使你之前作業的不可能變為可能,由低效轉化為高效, ?掌握op與kernel注冊的宏定義來自何方,以及宏定義背后具體的運行框架,

參考資料

1.《TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems》: https://arxiv.org/abs/1603.04467

2.Graphs and Sessions: https://github.com/tensorflow/docs/blob/master/site/en/r1/guide/graphs.md

3.Adding a New Op: https://github.com/tensorflow/docs/blob/master/site/en/r1/guide/extend/op.md

4.跨設備通信send/recv: https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/sendrecv_ops.h

5.OpKernel definition: https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/framework/op_kernel.h

6.tensorflow原始碼決議之framework-resource: https://www.cnblogs.com/jicanghai/p/9535504.html

7.tensorflow原始碼決議之framework-op: https://www.cnblogs.com/jicanghai/p/9539513.html

**本文作者:李杰**
TF計算圖從邏輯層來講,由op與tensor構成,op是項點代表計算單元,tensor是邊代表op之間流動的資料內容,兩者配合以資料流圖的形式來表達計算圖,那么op對應的物理層實作是什么?TF中有哪些op,以及各自的適用場景是什么?op到底是如何運行的?接下來讓我們一起探索和回答這些問題,
## 一、初識op
### 1.1 op定義
op代表計算圖中的節點,是tf.Operation物件,代表一個計算單元,用戶在創建模型和訓練代碼時,會創建一系列op及其依賴關系,并將這些op和依賴添加到tf.Graph物件中(一般為默認圖),比如:tf.matmul()就是一個op,它有兩個輸入tensor和一個輸出tensor,
### 1.2 op分類
op的分類一般有多個視角,比如按是否內置劃分、按作業型別劃分,
按是否內置劃分,一般分為:內置op和自定義op(見“二、自定義op”部分介紹),
按作業型別劃分,一般分為:常見數學op、陣列op、矩陣op、有狀態op、神經網路op、檢查點op、佇列與同步op、控制流op,TF白皮書對內置op的分類總結如下:

![](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2ba4e499f2ec4c869067ccf14cfc41c7~tplv-k3u1fbpfcp-zoom-1.image)
  

### 1.3 op與kernel
op一般都有名稱且代表一個抽象的計算程序,op可以設定若干屬性,但這些屬性必須在編譯期提供或推理得到,因為它們用來實體化一個節點物件從而執行真正的計算,屬性的經典用法就是拿來支持型別多型,比如兩個浮點張量的矩陣乘法與兩個整型張量的矩陣乘法,
kernel是op在指定設備型別(CPU/GPU)上的具體實作,TF二進制庫通過注冊機制定義了一系列op及對應的kernel實作,用戶可以提供額外的op定義與kernel實作進行擴充,一般來說,一個op對應多個kernel實作,
接下來讓我們一起用矩陣乘法MatMul算子的相關代碼來理解op與kernel的關系(此處不必糾結代碼細節,只需體會op與kernel關系即可):
```// 首先給出op注冊的定義,其中輸入輸出支持泛型,其合法型別在Attr中進行列舉,// 代碼位置 tensorflow1.15.5\tensorflow\core\ops\math_ops.ccREGISTER_OP("MatMul")    .Input("a: T")    .Input("b: T")    .Output("product: T")    .Attr("transpose_a: bool = false")    .Attr("transpose_b: bool = false")    .Attr(        "T: {bfloat16, half, float, double, int32, int64, complex64, "        "complex128}")    .SetShapeFn(shape_inference::MatMulShape);    // MatMul的實作,采用類模板機制// 代碼位置 tensorflow1.15.5\tensorflow\core\kernels\matmul_op.cctemplate <typename Device, typename T, bool USE_CUBLAS>class MatMulOp : public OpKernel {  public:    explicit MatMulOp(OpKernelConstruction* ctx)      : OpKernel(ctx), algorithms_set_already_(false) {      OP_REQUIRES_OK(ctx, ctx->GetAttr("transpose_a", &transpose_a_));      OP_REQUIRES_OK(ctx, ctx->GetAttr("transpose_b", &transpose_b_));
      LaunchMatMul<Device, T, USE_CUBLAS>::GetBlasGemmAlgorithm(        ctx, &algorithms_, &algorithms_set_already_);      use_autotune_ = MatmulAutotuneEnable();    }  // 省略了很多代碼...    private:    std::vector<int64> algorithms_;    bool algorithms_set_already_;    bool use_autotune_;    bool transpose_a_;    bool transpose_b_;};
// MatMul的op定義與kernel實作系結處理// 代碼位置 tensorflow1.15.5\tensorflow\core\kernels\matmul_op.cc#define REGISTER_CPU_EIGEN(T)  /*cpu與eigen組合對應實作*/                       \  REGISTER_KERNEL_BUILDER(                                                     \      Name("MatMul").Device(DEVICE_CPU).TypeConstraint<T>("T").Label("eigen"), \      MatMulOp<CPUDevice, T, false /* cublas, ignored for CPU */>);
#define REGISTER_CPU(T)      /*cpu對應實作(eigen與非eigen)*/         \  REGISTER_KERNEL_BUILDER(                                          \      Name("MatMul").Device(DEVICE_CPU).TypeConstraint<T>("T"),     \      MatMulOp<CPUDevice, T, false /* cublas, ignored for CPU */>); \  REGISTER_CPU_EIGEN(T);
#define REGISTER_GPU(T)     /*gpu對應實作(cublas與非cublas)*/       \  REGISTER_KERNEL_BUILDER(                                         \      Name("MatMul").Device(DEVICE_GPU).TypeConstraint<T>("T"),    \      MatMulOp<GPUDevice, T, true /* cublas, true by default */>); \  REGISTER_KERNEL_BUILDER(Name("MatMul")                           \                              .Device(DEVICE_GPU)                  \                              .TypeConstraint<T>("T")              \                              .Label("cublas"),                    \                          MatMulOp<GPUDevice, T, true /* cublas */>)```
## 二、自定義op
用戶撰寫的模型訓練代碼一般由TF原生的op算子及其依賴關系組成,但有時候我們定義的計算邏輯在TF中沒有相應的op實作,根據TensorFlow官網的建議,我們應當先組合python op算子或python函式進行嘗試,完成嘗試之后再決定要不要自定義op,
### 2.1 自定義op場景
一般來說,需要自定義op的場景有如下3個:
?用TF原生op組合來表達新計算邏輯的程序比較復雜或不可能
?用TF原生op組合來表達新計算邏輯,其計算性能較低
?在新版編譯器中也較難實作op融合的計算邏輯需要我們手動實作融合
在此舉個例子方便大家理解,假如我們要實作一個新計算實邏:中位數池化(median pooling),程序中要在滑動視窗不斷求得中位數,檢索TF檔案沒有發現對應op,因此我們先考慮用TF python op組合來實作它,果然通過**ExtractImagePatches** and **TopK**就可以實作這個功能,經測驗前述組合方案并不是計算和存盤高效的,因此我們就有必要將median pooling在一個op中進行高效實作,
### 2.2 自定義op流程
自定義op一般遵循5個基本步驟:
1.注冊op,具體包括:指定名稱、輸入/輸出宣告、形狀函式,
2.定義kernel(即op的實作)并與op系結,一個op有多個kernel實作,具體由輸入輸出型別、硬體(CPU、GPU)決定,
3.創建python包裝器,一般由op注冊機制自動完成,
4.撰寫op的梯度計算函式(可選項),
5.測驗op,通過python測驗較為方便,當然也可通過C++進行測驗,
接下來我們就以官網最簡單的ZeroOut同步式自定義op(繼承OpKernel)為例,結合代碼來講述上述5個步驟,下面先給出步驟1和步驟2用C++實作的代碼(官方推薦用bazel編譯so檔案):
```// 步驟1:注冊opREGISTER_OP("ZeroOut").Input("to_zero: int32").Output("zeroed: int32").SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {    c->set_output(0, c->input(0));    //c's input and output type is std::vector<ShapeHandle>    return Status::OK();    });
// 步驟2:定義kernel(常規CPU設備),并把kernel與op系結class ZeroOutOp : public OpKernel {public:    explicit ZeroOutOp(OpKernelConstruction* context) : OpKernel(context) {}
    void Compute(OpKernelContext* context) override {        // Grab the input tensor from OpKernelContext instance        const Tensor& input_tensor = context->input(0);         auto input = input_tensor.flat<int32>();
        // Create an output tensor        Tensor* output_tensor = NULL;        OP_REQUIRES_OK(context, context->allocate_output(0, input_tensor.shape(),            &output_tensor));    // OP_REQUIRES_OK第二個引數一般為方法呼叫,此處為輸出張量分配記憶體空間        auto output_flat = output_tensor->flat<int32>();
        // Set all but the first element of the output tensor to 0.        const int N = input.size();        for (int i = 1; i < N; i++) {            output_flat(i) = 0;        }
        // Preserve the first input value if possible.        if (N > 0) output_flat(0) = input(0);    }};
REGISTER_KERNEL_BUILDER(Name("ZeroOut").Device(DEVICE_CPU), ZeroOutOp);```
步驟3加載上述so檔案(自動完成前后端op映射);步驟4是可選項,此處不需要;步驟5基于python api測驗op功能,相應代碼如下:
```import tensorflow as tfzero_out_module = tf.load_op_library('./zero_out.so')    # 加載so檔案生成python modulewith tf.Session(''):  zero_out_module.zero_out([[1, 2], [3, 4]]).eval()
# Printsarray([[1, 0], [0, 0]], dtype=int32)```
### 2.3 高級話題
關于op的技識訓題還有很多,我們在此簡述一些要點:
1.如果實作了一個多執行緒CPU kernel,則可以利用work_sharder.h中的Shard函式,
2.大多數op以同步方式作業,只需繼承OpKernel改寫Compute()方法,且此方法必須執行緒安全,
3.如果一個op因為其它op的運行而阻塞,則這個op可以采用異步方式作業,繼承AsyncOpKernel改寫ComputeAsync()方法,且此方法必須執行緒安全,異步op最經典的例子就是跨設備通信send/recv pair中的RecvOp,
4.如果要為op配置一些靜態屬性,可使用Attr,它有一套特有的支持型別,典型應用是支持泛型,
5.實作GPU kernel有兩部分內容:OpKernel和CUDA kernel,相應的加載代碼,
6.編譯自定義op,首先要配置頭檔案搜索路徑與庫檔案搜索路徑,接著指定編譯和鏈接選項,最后還要確保ABI兼容性,
7.Resource(資源)代表相同設備上op共享的內容,比如:張量值、kv存盤表、佇列、讀取器、網路連接等,代表資源的類必須繼承ResourceBase,然后注冊ResourceHandleOp生成資源句柄,普通op以resouce型別的Input進行引入,
## 三、op作業原理
### 3.1 op運行框架
整體來看,op與kernel都有其結構描述與統一的注冊管理中心,而OpDefBuilder有兩個包裝類OpDefBuilderWrapper和OpDefBuilderReceiver,前者支持op構建的鏈式語法,后者接受op構建結果并進行注冊,眾所周知,op是編譯期概念,而kernel是運行期概念,在AI編譯器的后端處理流程中會進行op的算子選擇,此程序會基于一系列策略為op匹配最合適的kernel實作,

![](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/419cd70db0da46b090f740d7245ee836~tplv-k3u1fbpfcp-zoom-1.image)
  

### 3.2 若干技術細節
首先,我們來看一下大家在使用TensorFlow程序中經常碰到的libtensorflow_framework.so,按照tf1.15.5/tensorflow/BUILD中的描述,libtensorflow_framework.so定義了op和kernel的注冊機制而不涉及具體實作,
```// rootdir=tensorflow1.15.5// ${rootdir}/tensorflow/BUILD/*# A shared object which includes registration mechanisms for ops and# kernels. Does not include the implementations of any ops or kernels. Instead,# the library which loads libtensorflow_framework.so# (e.g. _pywrap_tensorflow_internal.so for Python, libtensorflow.so for the C# API) is responsible for registering ops with libtensorflow_framework.so. In# addition to this core set of ops, user libraries which are loaded (via# TF_LoadLibrary/tf.load_op_library) register their ops and kernels with this# shared object directly.*/tf_cc_shared_object(    name = "tensorflow_framework",    framework_so = [],    linkopts = select({        "//tensorflow:macos": [],        "//tensorflow:windows": [],        "//tensorflow:freebsd": [            "-Wl,--version-script,$(location //tensorflow:tf_framework_version_script.lds)",            "-lexecinfo",        ],        "//conditions:default": [            "-Wl,--version-script,$(location //tensorflow:tf_framework_version_script.lds)",        ],    }),    linkstatic = 1,    per_os_targets = True,    soversion = VERSION,    visibility = ["//visibility:public"],    deps = [        "//tensorflow/cc/saved_model:loader_lite_impl",        "//tensorflow/core:core_cpu_impl",        "//tensorflow/core:framework_internal_impl",    /* 展開此target進行查看 */        "//tensorflow/core:gpu_runtime_impl",        "//tensorflow/core/grappler/optimizers:custom_graph_optimizer_registry_impl",        "//tensorflow/core:lib_internal_impl",        "//tensorflow/stream_executor:stream_executor_impl",        "//tensorflow:tf_framework_version_script.lds",    ] + tf_additional_binary_deps(),)
// ${rootdir}/tensorflow/core/BUILDtf_cuda_library(    name = "framework_internal_impl",    srcs = FRAMEWORK_INTERNAL_PRIVATE_HEADERS + glob(   // 可以查看FRAMEWORK_INTERNAL_PRIVATE_HEADERS內容        [            "example/**/*.cc",            "framework/**/*.cc",            "util/**/*.cc",            "graph/edgeset.cc",            "graph/graph.cc",            "graph/graph_def_builder.cc",            "graph/node_builder.cc",            "graph/tensor_id.cc",            "graph/while_context.h",            "graph/while_context.cc",        ],    // 省略了諸多代碼)
// FRAMEWORK_INTERNAL_PRIVATE_HEADERS的內容FRAMEWORK_INTERNAL_PRIVATE_HEADERS =  [    "graph/edgeset.h",    "graph/graph.h",    "graph/graph_def_builder.h",    "graph/node_builder.h",    "graph/tensor_id.h",] + glob(    [        "example/**/*.h",        "framework/**/*.h",   // 這里就是重點,查看${rootdir}/tensorflow/core/framework/op.h和opkernel.h        "util/**/*.h",    ]) 
// 先來看op.h#define REGISTER_OP(name) REGISTER_OP_UNIQ_HELPER(__COUNTER__, name)#define REGISTER_OP_UNIQ_HELPER(ctr, name) REGISTER_OP_UNIQ(ctr, name)#define REGISTER_OP_UNIQ(ctr, name)                                          \  static ::tensorflow::register_op::OpDefBuilderReceiver register_op##ctr    \      TF_ATTRIBUTE_UNUSED =                                                  \          ::tensorflow::register_op::OpDefBuilderWrapper<SHOULD_REGISTER_OP( \              name)>(name)              // 再來看看opkernel.h#define REGISTER_KERNEL_BUILDER(kernel_builder, ...) \  REGISTER_KERNEL_BUILDER_UNIQ_HELPER(__COUNTER__, kernel_builder, __VA_ARGS__)
#define REGISTER_KERNEL_BUILDER_UNIQ_HELPER(ctr, kernel_builder, ...) \  REGISTER_KERNEL_BUILDER_UNIQ(ctr, kernel_builder, __VA_ARGS__)
#define REGISTER_KERNEL_BUILDER_UNIQ(ctr, kernel_builder, ...)        \  constexpr bool should_register_##ctr##__flag =                      \      SHOULD_REGISTER_OP_KERNEL(#__VA_ARGS__);                        \  static ::tensorflow::kernel_factory::OpKernelRegistrar              \      registrar__body__##ctr##__object(                               \          should_register_##ctr##__flag                               \              ? ::tensorflow::register_kernel::kernel_builder.Build() \              : nullptr,                                              \          #__VA_ARGS__,                                               \          [](::tensorflow::OpKernelConstruction* context)             \              -> ::tensorflow::OpKernel* {                            \            return new __VA_ARGS__(context);                          \          });```
參照上述同樣的流程,我們可以發現libtensorflow.so中涉及op與kernel的具體實作,同時也包括Session的具體實作,
最后,我們再來講講REGISTER_OP宏背后的具體原理,我們在上面已經給出了此宏的定義,此處針對它的實作展開談談:
```// 先來看op.h#define REGISTER_OP(name) REGISTER_OP_UNIQ_HELPER(__COUNTER__, name)#define REGISTER_OP_UNIQ_HELPER(ctr, name) REGISTER_OP_UNIQ(ctr, name)#define REGISTER_OP_UNIQ(ctr, name)                                          \  static ::tensorflow::register_op::OpDefBuilderReceiver register_op##ctr    \      TF_ATTRIBUTE_UNUSED =                                                  \          ::tensorflow::register_op::OpDefBuilderWrapper<SHOULD_REGISTER_OP( \              name)>(name)
// REGISTER_OP的一般用法如下REGISTER_OP("ZeroOut")    .Input("to_zero: int32")    .Output("zeroed: int32")    .SetShapeFn([](::tensorflow::shape_inference::InferenceContext* c) {      c->set_output(0, c->input(0));      return Status::OK();    });
// op定義的鏈式規則是通過OpDefBuilderWrapper類實作的class OpDefBuilderWrapper<true> { public:  explicit OpDefBuilderWrapper(const char name[]) : builder_(name) {}
  OpDefBuilderWrapper<true>& Input(string spec) {    builder_.Input(std::move(spec));    return *this;                        // 顯而易見,呼叫Input仍然回傳OpDefBuilderWrapper<true>本身  }  OpDefBuilderWrapper<true>& Output(string spec) {    builder_.Output(std::move(spec));    return *this;  }
  OpDefBuilderWrapper<true>& SetShapeFn(      Status (*fn)(shape_inference::InferenceContext*)) {    builder_.SetShapeFn(fn);    return *this;  }  const ::tensorflow::OpDefBuilder& builder() const { return builder_; }
 private:  mutable ::tensorflow::OpDefBuilder builder_;};
// 當通過鏈式規劃構建好op后,再通過OpDefBuilderReceiver完成op的注冊// op.hstruct OpDefBuilderReceiver {  // To call OpRegistry::Global()->Register(...), used by the  // REGISTER_OP macro below.  // Note: These are implicitly converting constructors.  OpDefBuilderReceiver(      const OpDefBuilderWrapper<true>& wrapper);  // NOLINT(runtime/explicit)  constexpr OpDefBuilderReceiver(const OpDefBuilderWrapper<false>&) {  }  // NOLINT(runtime/explicit)};
// op.cc,然后在OpDefBuilderReceiver建構式內部完成OpDefBuilderWrapper的全域注冊OpDefBuilderReceiver::OpDefBuilderReceiver(    const OpDefBuilderWrapper<true>& wrapper) {  OpRegistry::Global()->Register(      [wrapper](OpRegistrationData* op_reg_data) -> Status {        return wrapper.builder().Finalize(op_reg_data);      });}```
## 四、總結
本文為大家系統講解了TensorFlow的核心抽象op及其kernel實作,需要自定義op的具體場景,以及op的運行框架及若干技術細節,讀罷此文,讀者應該有如下幾點識訓:
?TensorFlow中op是編譯期概念,kernel是運行期概念,兩者各自的定義與注冊方式,以及相應的映射邏輯,
?掌握TensorFlow的高階玩法:自定義op,這將使你之前作業的不可能變為可能,由低效轉化為高效,
?掌握op與kernel注冊的宏定義來自何方,以及宏定義背后具體的運行框架,
## 參考資料
1.《TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems》: <https://arxiv.org/abs/1603.04467>
2.Graphs and Sessions: <https://github.com/tensorflow/docs/blob/master/site/en/r1/guide/graphs.md>
3.Adding a New Op: <https://github.com/tensorflow/docs/blob/master/site/en/r1/guide/extend/op.md>
4.跨設備通信send/recv: <https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/kernels/sendrecv_ops.h>
5.OpKernel definition: <https://github.com/tensorflow/tensorflow/blob/master/tensorflow/core/framework/op_kernel.h>
6.tensorflow原始碼決議之framework-resource: <https://www.cnblogs.com/jicanghai/p/9535504.html>
7.tensorflow原始碼決議之framework-op: <https://www.cnblogs.com/jicanghai/p/9539513.html>

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/536128.html

標籤:其他

上一篇:IoT物聯網無線通信模塊該如何選擇?

下一篇:Kubernetes安裝GitLab

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more