import tensorflow as tf
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris#匯入資料集合
x_data=https://bbs.csdn.net/topics/load_iris().data#匯入特征資料集合
y_data=https://bbs.csdn.net/topics/load_iris().target#匯入標簽資料集合
x_train=x_data[:-30]#特征資料資料訓練集
x_test=x_data[-30:]#特征資料資料測驗集
y_train=y_data[:-30]#標簽資料訓練集
y_test=y_data[-30:]#標簽資料測驗集
np.random.seed(1)#隨機種子,保持看亂序一致
np.random.shuffle(x_train)#亂序
np.random.seed(1)
np.random.shuffle(y_train)#亂序
tf.random.set_seed(111)
train_db=tf.data.Dataset.from_tensor_slices((x_train,y_train)).batch(32)#資料切割把陣列切位單獨張量后,對資料打包
# for i in train_db:
# print(i)
w=tf.Variable(tf.random.truncated_normal([4,3],seed=1))#初始化引數,并設定為可訓練變數
b=tf.Variable(tf.random.truncated_normal([3],seed=1))#初始化引數,并設定為可訓練變數
epoch=100
loss_all=0
train_loss_result=[]
test_acc=[]
lr=0.2
# for i in epoch
for step,(x,y) in enumerate(train_db):
with tf.GradientTape() as tape:
x=tf.cast(x,dtype="float64")
# print(x)
w=tf.cast(w,dtype="float64")
# print(w)
b=tf.cast(b,dtype="float64")
y_train=tf.one_hot(tf.cast(y,dtype="int32"),depth=3)
y_test=tf.one_hot(tf.cast(y_test,dtype="int32"),depth=3)
y_pred=tf.matmul(x,w)+b
loss=tf.nn.softmax_cross_entropy_with_logits(y_train,y_pred)
loss_mean=tf.reduce_mean(loss)
# print(loss_mean)
grad=tape.gradient(loss_mean,[w,b])
# w=w-lr*grad[0]
# b=b-lr*grad[1]
print(type(grad[0]))
if step==1:
break
# # loss_all+=loss_mean
運行結果:
<class 'tensorflow.python.framework.ops.EagerTensor'> <class 'NoneType'>
上面代碼,在進行回圈是,第一次step回圈,在計算w,b 梯度是,有值,進入第二次回圈是,報出空值,感謝大神求解問題在哪?
uj5u.com熱心網友回復:
哪位大神給予解答uj5u.com熱心網友回復:
今天檢查了一下,知道原因了,因為在更改資料為float64時,把b,w 的viriable 型別改為了tensor型別,因此導致資料無法在求梯度的時候,無法更新引數轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/282948.html
