一、背景與挖掘目標
經常聽到這么一句話“坐擁百萬大學生,武漢卻留不住人,”,在人才競爭的大背景下,武漢出臺了一系列包括“人才租房、購房8折優惠”等政策,“將武漢打造成大學生最友好城市”“5年內留住100萬大學生”,
作為武漢百萬大學生之一的你,是否考慮未來在武漢買房呢?
那么武漢的二手房市場又是怎樣的呢?我們用Python來分析下武漢的二手房資料,
PS:如有需要Python學習資料的小伙伴可以加下方的群去找免費管理員領取
可以免費領取原始碼、專案實戰視頻、PDF檔案等
二、采集器獲取資料
這次小編沒有用python爬蟲代碼來爬取資料,用后羿采集器來爬取武漢二手房網上的資料,共獲取5015條記錄,
資料讀入
先匯入要使用的資料處理包pandas,可視化工具pyecharts、stylecloud,
匯入CSV檔案,預覽資料,
從獲取的資料來看,需要對資料進行預處理,缺失值和例外值檢測,洗掉無用的列,進行資料型別的轉換,提取關鍵字等操作,
資料整理
此處我們主要對以上獲取的資料集進行部分清洗作業以方便后續的處理:
title:作詞云圖
list-info:地區、室、廳、面積、方位、樓層
tag_info:提取是否靠近地鐵
total_price:提取房屋總價
unitPrice:房屋單價
picNum、jjrinfo、jjrname-outer、
icon-anxuan-img:無用值無需分析,刪去
提取關鍵資料:
資料型別轉換:
處理后資料:
資料可視化
資料可視化部分主要對以下的資料進行匯總分析,分析維度以及代碼如下:
- 武漢不同區域的二手房房源數量
- 武漢不同區域二手房平均價格
- 武漢二手房都處在什么價位
- 是否靠近地鐵和房屋單價的關系
- 不同朝向的房屋數量分布
- 房屋面積和房屋價格的關系
- 臥室數量和房屋價格的關系
- 客廳數量和房屋價格的關系
- 二手房資訊詞云圖
武漢不同區域的二手房房源數量
武漢不同區域二手房平均價格
武漢二手房都處在什么價位
是否靠近地鐵和房屋單價的關系
不同朝向的房屋數量分布
房屋面積和房屋價格的關系
客廳數量和房屋價格的關系
二手房資訊詞云圖
三、可視化分析
1. 武漢不同區域的二手房房源數量
那么武漢各個區域的二手房源分布如何呢?
獲取的5014條資料中,經過統計可以看到,江夏區的二手房數量遙遙領先,達到997,其次是洪山區,共870,之后黃陂、漢陽、東西湖
2. 武漢不同區域二手房平均價格
不同區域的二手房價又是怎樣的呢?
武昌區一馬當先,以25518.24元每平米的價格領跑武漢的二手房市場,其次,江岸區以23190.4每平米排在第二位,江漢區以22921.04每平米的價格排在第三位,
3. 武漢二手房都處在什么價位
那么在武漢買一套二手房到底要花多少錢?
接著我們分析了二手房的價位,從圖中可以看到總價在100-300萬內的最多,占比達到76.44%,100萬的占比18.23%,300萬-500萬的占比4.14%
4.是否靠近地鐵和房屋單價的關系
一般來說,靠近地鐵越近的房子房價越高,從分布的箱線圖可以看出,以中位數來看,靠近地鐵的房子單價比不靠近地鐵的房子每平米高4254元,
5.不同朝向的房屋數量分布
房屋朝向方面,朝南北的自然是最多的,占比達到79.88%,其次是朝南的,占比15.33%,
6.房屋面積和房屋價格的關系
從散點圖可以看出,房屋的面積和房屋價格呈現正相關,計算皮爾遜相關系數的值為0.67,為強相關,
7.客廳/臥室數量和房屋價格的關系
從分布的箱線圖可以看出,臥室數量越多,面積越大,則房屋總價越高,房價呈現右偏分布,且離群值較多,客廳和臥室一樣反映在房屋的面積上,客廳數越多,則房屋總價越高,
8.二手房資訊詞云圖
簡略的分析就到這里了,武漢最近幾年的飛速發展,城市環境和交通都有質的飛躍,在武漢買
本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理,
作者:Nothing to lose921
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/56989.html
標籤:Python
