本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理,
以下文章來源于CSDN ,作者Gordon,Alice
Python 資料分析實戰講解案例
https://www.bilibili.com/video/BV1954y1r7pi/
前言
現在越來越多年輕人手里的那一杯快樂肥宅水,從可樂換成了奶茶,上世紀80年的奶茶并不像現在的奶茶口味繁多,配料多樣,而大部分80、90后童年的奶茶只有一個名字,那就是“臺灣珍珠奶茶”,只需要一間幾平方米的小店,一臺手動封杯口機器,幾罐不同口味的奶茶粉末,就可以開一家奶茶店,
奶茶起源于中國北方游牧民族,知名于中國臺灣,早期的臺灣奶茶品牌,如CoCo、50嵐、老虎茶等等,前兩家CoCo和50嵐(現在的1點點)都已經成為中國大陸大型的連鎖奶茶店,隨著奶茶越來越受大眾喜愛,涌現出更多的本土奶茶品牌,如蜜雪冰城、益禾堂,再到如今的網紅時代,由于不同奶茶品牌的口味差異不大,如何更好地營銷自己的奶茶品牌,讓消費者能從眾多奶茶中翻到自己的牌子,變得更加重要,例如奈雪的茶主打高端路線,奶茶均價在40元左右;喜茶主打品牌差異化,注重茶飲口感的同時營造店面排長龍的“時尚文化”,
資料獲取
本文資料來源于美團網,抓取了12個熱門城市的奶茶店名單,城市包括:北京、上海、廣州、深圳、天津、西安、重慶、杭州、南京、武漢、成都和長沙,共計68614家奶茶店,3萬多個奶茶品牌,在構建抓取URL時,需要注意將城市的維度具體到城市商圈,因為每個URL最多只顯示32頁內容,保證抓取每個城市時的資料量是準確的,
資料清洗
資料清洗部分,主要清洗了奶茶店鋪名稱,雖然資料均來源于美團網,但是同一個奶茶品牌會有多種格式,如1點點和1點點,大卡司和大卡司DAKASI,由于奶茶品牌數量眾多,并且真偽難辨,所以只能進行針對性清洗,對部分名氣高的奶茶品牌名稱要保證其統一,
# 清洗欄位 def clean(x): title = re.sub(u"(.*?)", "", x['title']) title = title.replace('點點','點點').replace('(','').replace(')','') title = title.replace('一點點','1點點') if '一杯會說話的茶' in title: title = '1314一杯會說話的茶' elif '大卡司' in title: title = '大卡司DAKASI' elif '1點點' in title: title = '1點點' elif '都可' in title: title = 'CoCo都可' elif '書亦燒仙草' in title: title = '書亦燒仙草' elif '蜜雪冰城' in title: title = '蜜雪冰城' elif 'royal' in title or 'Royal' in title or 'ROYAL' in title: title = 'Royaltea皇茶' elif 'ALS' in title: title = 'ALS GONG CHA貢茶' elif 'GONG' in title: title = '貢茶' elif '茶百道' in title: title = '茶百道' elif '吾飲良品' in title: title = '吾飲良品' elif '悸動燒仙草' in title: title = '悸動燒仙草' elif '滬上阿姨' in title: title = '滬上阿姨' elif '7分甜' in title: title = '7分甜' elif '古茗' in title: title = '古茗' elif '奈雪' in title: title = '奈雪の茶' elif '悅色' in title: title = '茶顏悅色' else: pass return title df['title'] = df.apply(clean, axis=1)
資料可視化
當筆者在制作可視化圖表的時候,會發現有些奶茶品牌的名稱極為相似,讓人有一種傻傻分不清楚的感覺,
類似的奶茶品牌名稱
例如喜茶的前身“Royaltea皇茶”,因為皇茶這個商標無法注冊著作權,只能加前綴或后綴,所以就出現了“世代皇茶”,“雅島英皇茶”等等的同胞“兄弟”,正是飽受這種侵權而不能訴諸法律的情況,聶云宸才會想到直接棄了皇茶這個品牌,改名為喜茶,無獨有偶,“貢茶”這個牌子也被各種盜版,而且部分盜版牌子居然還有主頁官網,讓你很難區分哪家才是正品,這也足以顯示奶茶行業品牌競爭的激烈情況,
熱門城市奶茶店鋪數量情況
從全國12個熱門城市來看奶茶店鋪數量分布情況,廣州的店鋪數量是最多的,擁有11419家,之后是深圳(9367家)、上海(7940家)、成都(7361家),4個一線城市中,北京的奶茶店只有4643家,筆者猜測因為北京位于北方,并不像南方一年四季幾乎都是熱天,而奶茶主要是作為冷飲,尤其現在最流行的奶蓋茶,只適用于冷飲,過熱的水溫會導致奶蓋融化,還有一點原因是,由于茶樹的生長發育需要大量水分,對空氣濕度和降水量均有比較高的要求,所以國內茶葉的產地主要集中在南方,相應的運輸成本也有價格優勢,因此相較于南方的熱門城市,北京、天津奶茶店鋪的數量相對較少,
奶茶品牌店鋪數量 TOP15
在這12個熱門城市中,總共有3萬多個奶茶品牌,最為消費者所熟悉的奶茶品牌有1點點和CoCo,它們都擁有超過1500家門店,并且都是存活了10多年的老品牌,此外,書亦燒仙草、蜜雪冰城和貢茶這些也都是有上千家門店的奶茶品牌,它們的門店都喜歡開在一起,類似于麥當勞和肯德基,一旦你在某個城市商圈看到其中一家奶茶店,在幾百米的距離內肯定能找到上述的某幾家奶茶店,
特色奶茶分布情況
有些奶茶店很有自己的地域特色,如果你想品嘗它們的原版奶茶,就可能需要跑到別的城市才能喝到,因為它們大部分分店都只開在本土城市,例如“吾飲良品(I Drink)”大部分分店開設在武漢,“茶顏悅色”的店面93.57%在長沙,“滬上阿姨”雖然生在上海,卻火在天津,分店總數有208家,而上海只有6家分店,“古茗”的分店主要集中在杭州和重慶,“茗”象征著茶,因為這2個城市是盛產茶葉的地方,如果大家到了這些城市,記得打卡喝一杯原汁原味的奶茶,
大眾奶茶分布情況
接下來介紹一下大眾奶茶中的1點點,CoCo,書亦燒仙草和益禾堂的熱門城市分布情況,因為筆者在廣州經常能看到這幾家店,而且店面都是挨得很近,1點點和CoCo在上海的分店數量都是最多的,而書亦燒仙草在成都和長沙比較普遍,益禾堂則是在廣州和深圳,這4家奶茶品牌在廣州分店數量均有上百家,也難怪走到哪都能看到這幾家奶茶店,
奶茶品牌均價情況
“奈雪の茶”和“喜茶”作為近期最火的新式網紅茶飲,前者人均消費39元,后者約31元,而大部分奶茶品牌的均價在10-17元,之所以這兩家奶茶品牌均價會這么高,原因在于它們采用了“茶飲+”的營銷方式,除了近30元一杯的奶茶外,還有吐司,甜品和咖啡等搭配產品,而其它品牌只是單純銷售各式各樣的奶茶,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/236362.html
標籤:Python
