我正在使用 LSTM 進行二元分類,并最初嘗試在輸出(密集)層中使用 1 個單元的模型,并將 sigmoid 作為激活函式。但是,它表現不佳,我看到一些筆記本在輸出層(LSTM 之后的層)中使用了 2 個單元,并使用 softmax 作為激活函式。使用 2 個輸出層并使用 softmax 而不是單個單元和 sigmoid(出于二元分類的目的)有什么優勢嗎?我使用 binary_crossentropy 作為損失函式
uj5u.com熱心網友回復:
Softmax 應該比 sigmoid 更好,因為 sigmoid 的導數的斜率幾乎接近 1(梯度消失問題),這使得分類變得困難。這可能是 softmax 比 sigmoid 表現更好的原因
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/323913.html
