一、標簽簡介
標簽概念
標簽,最初用來對實物進行分類和標記,例如標明物品的品名、重量、體積、用途等簡要資訊,后來逐漸流行到資料行業,用來標記資料,對資料快速分類獲取和分析,
標簽特點
精確描述定位和搜索,具有生命周期的特性,可以計算,配置和規則化處理,可以用標簽來描述各種結構和非結構化[檔案、圖片、視頻等]的資料,從而使這些內容被高效的管理,
- 描述特征:標簽[手機顏色],特征[紅色,白色];
- 描述規則:標簽[活躍用戶],規則[每日登陸,產生交易];
標簽價值
- 精細運營的基礎,有效提高流量精準和效率,
- 幫助產品快速定位需求資料,進行精準分析;
- 能幫助客戶更快切入到市場周期中;
- 深入的預測分析資料并作出及時反應;
- 基于標簽的開發智能推薦系統;
- 基于某類下的資料分析,洞察行業特征;
標簽的核心價值,或者說最常用的場景:實時智能推薦,精準化數字營銷,
二、標簽定義

屬性標簽
屬性標簽是描述基本特征,不需要行為產生,也不是基于規則引擎分析,例如基于用戶實名認證資訊,獲取:性別,生日,出生日期等特征,變動頻率極小,且精準性較高,
行為標簽
通過不同業務渠道埋點,捕捉用戶的行為資料,基于這些資料分析,形成結果描述的標簽,例如:分析用戶「網購平臺」,得到的結果拼多多,淘寶,京東,天貓等,這些都是需要通過行為資料來判斷的標簽,
規則標簽
規則下分析出來的標簽,更多是基于產品或者運營角度來看,例如電商平臺需要對會員等級超過5級,且近7天活躍的會員發一次福利,這里就涉及兩個標簽應用:1.「會員等級」基于什么規則判斷;2.「近7天活躍」如何判斷,是基于登錄,還是產生交易行為,這些都要可以動態配置,然后基于規則引擎把結果生成,基于動態的規則配置,經過計算和分析,生成描述的標簽,也就是規則標簽,
擬合標簽
擬合類標簽極具復雜性,通過對多種標簽智能組合分析,給出預測描述,或者直接給出進階定義,例如所謂的讀心術,即通過多個特征,眼神資訊,判斷人的心理活動,在機器學習中有一句話:通過長期對用戶行為的判斷和學習,機器可能比用戶還了解用戶,
三、標簽管理體系
層級分類
標簽管理的基本手段,通常以行業來分:金融,教育,娛樂等;通過多級分類細化管理,
基礎標簽
即資料的關鍵標簽,特點精確扁平,不可再細分,用來精確的描述資料,類似元資料,當使用多個標簽組合描述資料特征,就會形成結構化的表管理,
標簽值型別
值型別:數字,字典,布爾,日期,文本框,自定義等,是對標簽具體值的管理,例如標簽「性別」,標簽值「男.女.未知」,這種典型通過羅列字典來描述的場景,
四、標簽生產流程
1、基礎流程

資料采集
資料采集的渠道相對較多,比如同一APP內的各種業務線:購物、支付、理財、外賣、資訊瀏覽等等,通過資料通道傳輸到統一的資料聚合平臺,有了這些海量日志資料的支撐,才具有資料分析的基礎條件,不管是資料智能,深度學習,演算法等都是建立在海量資料的基礎條件上,這樣才能獲取具有價值的分析結果,
資料加工
結合如上業務,通過對海量資料的加工,分析和提取,獲取相對精準的用戶標簽,這里還有關鍵的一步,就是對已有的用戶標簽進行不斷的驗證和修復,尤其是規則類和擬合類的相關標簽,
標簽庫
通過標簽庫,管理復雜的標簽結果,除了復雜的標簽,和基于時間線的標簽變,標簽資料到這里,已經具有相當大的價值,可以圍繞標簽庫開放一些收費服務,例如常見的,用戶在某電商APP瀏覽某些商品,可以在某資訊流平臺看到商品推薦,大資料時代就是這么令人感覺智能和窒息,
標簽業務
資料走了一大圈轉換成標簽,自然還是要回歸到業務層面,通過對標簽資料的用戶的分析,可以進行精準營銷,和智能推薦等相關操作,電商應用中可以提高成交量,資訊流中可以更好的吸參考戶,
應用層
把上述業務開發成服務,集成到具有的應用層面,不斷提升應用服務的質量,不斷的吸參考戶,提供服務,當然用戶的資料不斷在應用層面產生,在轉到資料采集服務中,最終形成完整的倍訓流程,
2、資料聚合池
- 基于IDmapping技術,置換唯一標識[uid];
- 基于uid關聯標簽,放入計算池;
- 相同的uid攜帶的標簽會以貪吃蛇的方式運行;
- 不斷豐富該uid下攜帶的標簽內容;
以此方式豐富標簽的場景,產生更大的資料價值;
五、源代碼地址
GitHub·地址
https://github.com/cicadasmile
GitEE·地址
https://gitee.com/cicadasmile
資料洞察系列文章
| 序號 | 標題 |
|---|---|
| 01 | 資料分析:基于智能標簽,精準管理資料 |
| 02 | 資料分析:資料可視化圖表,BI工具構建邏輯 |
| 03 | 資料分析:復雜業務場景下,量化評估流程 |
推薦閱讀:編程體系整理
| 序號 | 專案名稱 | GitHub地址 | GitEE地址 | 推薦指數 |
|---|---|---|---|---|
| 01 | Java描述設計模式,演算法,資料結構 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆☆ |
| 02 | Java基礎、并發、面向物件、Web開發 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆ |
| 03 | SpringCloud微服務基礎組件案例詳解 | GitHub·點這里 | GitEE·點這里 | ☆☆☆ |
| 04 | SpringCloud微服務架構實戰綜合案例 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆☆ |
| 05 | SpringBoot框架基礎應用入門到進階 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆ |
| 06 | SpringBoot框架整合開發常用中間件 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆☆ |
| 07 | 資料管理、分布式、架構設計基礎案例 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆☆ |
| 08 | 大資料系列、存盤、組件、計算等框架 | GitHub·點這里 | GitEE·點這里 | ☆☆☆☆☆ |
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/242783.html
標籤:大數據
上一篇:抖音資料采集API
下一篇:Mysql簡要概述
