賽道 A:二手車估價問題
隨著我國的機動車數量不斷增長,人均保有量也隨之增加,機動 車以“二手車”形式在流通環節,包括二手車收車、二手車拍賣、二手 車零售、二手車置換等環節的流通需求越來越大,二手車作為一種特 殊的“電商商品”,因為其“一車一況”的特性比一般電商商品的交易要 復雜得多,究其原因是二手車價格難于準確估計和設定,不但受到車 本身基礎配置,如品牌、車系、動力等的影響,還受到車況如行駛里 程、車身受損和維修情況等的影響,甚至新車價格的變化也會對二手 車價格帶來作用,目前國家并沒有出臺一個評判二手車資產價值的標 準,一些二手車交易平臺和二手車第三方估價平臺都從自身的角度建 立了一系列估價方法用于評估二手車資產的價值,
在一個典型的二手車零售場景,二手車一般通過互聯網等線上渠 道獲取用戶線索,線下物體門店對外展銷和售賣,俗稱 O2O 門店模式,門店通過“買手”從個人或其他渠道收購二手車,然后由門店定價 師定價銷售,二手車商品和其他商品一樣,如果定價太高滯銷也會打 折促銷,甚至直接以較低的價格打包批發,直至商品最終賣出,
基于以上背景,請你們團隊根據附件給出的資料,通過資料分析 與建模的方法幫助二手車交易平臺解決下面的問題:
初賽問題
問題 1:基于給定的二手車交易樣本資料(附件 1:估價訓練資料),選用合適的估價方法,構建模型,預測二手車的零售交易價格, 資料中會對 id 類,主要特征類等資訊進行脫敏,主要資料包括車輛基礎資訊、交易時間資訊、價格資訊等,包含 36 列變數資訊,其中
15 列為匿名變數,欄位如下:
| 序號 | Features | Description |
| 1 | carid | 車輛 id |
| 2 | tradeTime | 展銷時間 |
| 3 | brand | 品牌 id |
| 4 | serial | 車系 id |
| 5 | model | 車型 id |
| 6 | mileage | 里程 |
| 7 | color | 車輛顏色 |
| 8 | cityId | 車輛所在城市 id |
| 9 | carCode | 國標碼 |
| 10 | transferCount | 過戶次數 |
| 11 | seatings | 載客人數 |
| 12 | registerDate | 注冊日期 |
| 13 | licenseDate | 上牌日期 |
| 14 | country | 國別 |
| 15 | maketype | 廠商型別 |
| 16 | modelyear | 年款 |
| 17 | displacement | 排量 |
| 18 | gearbox | 變速箱 |
| 19 | oiltype | 燃油型別 |
| 20 | newprice | 新車價 |
| 21 | anonymousFeature | 15 個匿名特征 |
| 22 | price | 二手車交易價格(預測目標) |
請采用附件 1 中的“估價訓練資料”(帶標簽)訓練模型和測驗模
型,自行設定測驗集,使用訓練完成后的模型對附件 2 中的“估價驗證資料”(不帶標簽)進行預測,并將預測結果保存在附件 3“估價模型結果”檔案中,注意不要修改格式,單獨上傳到競賽平臺,其中附件 1“估價訓練資料”和附件 2“估價驗證資料”只相差最后1 列資料(二手車交易價格(預測目標)),附件 3“估價模型結果”檔案欄位如下:

問題 2:在門店模式中,車輛在被“買手”收車以后,會進入門店進行售賣,車輛能否成功交易,除了取決于銷售的談判技巧,更重要 的是車輛本身是否受消費者青睞,價格是否公道,假設你們是門店的 定價師,請你們結合附件 4“門店交易訓練資料”對車輛的成交周期(從車輛上架到成交的時間長度,單位:天)進行分析,挖掘影響車輛成 交周期的關鍵因素,假如需要加快門店在庫車輛的銷售速度,你們可 以結合這些關鍵因素采取哪些行之有效的手段,并進一步說明這些手 段的適用條件和預期效果,
附件 4“門店交易訓練資料”包括 6 個欄位,如下表所示,其中所有 carid 等相關資訊包含在附件 1“估價訓練資料”中,各欄位間采用“\t”分隔符分割,不包含表頭,

問題 3:依據給出的樣本資料集,你們覺得還有哪些問題值得研究,并給出你們的思路?
將問題 1、2、3 的解決程序寫成一篇論文,明確你們的思路、模型、方法和結果,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/390601.html
標籤:其他
