當內核中有多個值等于最大值時該怎么辦?例如,對于這些值:
array([[0., 0.],
[0., 0.]])
最大值只是 0。最大值索引應該是什么樣的?對于所有出現的最大值,它是否應該是 True :
array([[ True, True],
[ True, True]])
或者第一次出現最大值:
array([[ True, False],
[False, False]])
Pytorch 使用第一次出現的最大值,而某些源使用另一個(他使用pos = np.where(result == view, 1, 0),它基本上記錄了所有出現的最大值)。
編輯:對于前向 prop 沒有關系,但在反向傳播期間,例如,如果上游梯度為[[1,1],[1,1]],則當前節點的梯度將不同:([[1,1],[1,1]]所有出現)vs [[1,0],[0,0]](第一次出現)
uj5u.com熱心網友回復:
即使在一次反向傳播之后,內核值也不太可能保持相等。所以這應該不是一個真正的問題,不是嗎?
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/311557.html
