資料集是bank marketing,自變數里有很多型別變數,比如作業、受教育程度、婚姻狀況,同時也有連續型變數比如年齡等……y也是0/1變數,預測客戶是否會訂閱定期存款(變數y)
求問這樣的資料集可以使用貝葉斯分類嗎? 初步想法是把所有型別變數通過get.dummy都變成0/1變數,但是高斯貝葉斯方法GaussianNB的假設是資料符合正態分布……所以這個方法還可以繼續下去嗎?還是思路有什么問題?
思路有問題的話有沒有人能告訴我這個例子怎么用貝葉斯分類!!!
所以個人不是很懂,有點犯迷糊.有懂得大神求救!!!




資料集鏈接在此http://archive.ics.uci.edu/ml/datasets/Bank%20Marketing


轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/150076.html
標籤:數據結構與算法
上一篇:Python實作掃碼工具
