Z 您現(xiàn)在的位置:首頁>產(chǎn)業(yè)專欄>國內(nèi)資訊> 騰訊信鴿大數(shù)據(jù):移動游戲流失用戶預測

騰訊信鴿大數(shù)據(jù):移動游戲流失用戶預測

2015-06-12 17:57:19來源:優(yōu)游網(wǎng)發(fā)布:優(yōu)游網(wǎng)

隨著游戲市場競爭的日趨激烈,越來越多的游戲運營服務選擇借助大數(shù)據(jù)挖掘出更多更細的用戶群來進行精細化,個性化運營,從而更好的抓住用戶,獲得更大的收益。在游戲運營中,無論是流失挽留,還是拉新,以及付費用戶預測都是游戲運營的重要內(nèi)容。

本文將著重介紹手游用戶的流失預測。對于游戲運營者,如果能夠盡早的發(fā)現(xiàn)可能流失的用戶,盡早的有針對性的對這些用戶進行適當?shù)母深A,從而最大限度的延長用戶在游戲中的停留時間,使得游戲運營者獲得更大的收益。

本文中介紹的手游流失預測主要依托于騰訊信鴿這個平臺,為這個平臺提供精準定位即將流失用戶的功能。騰訊信鴿是專業(yè)的移動應用推送平臺,支持百億級的通知/消息秒級觸達移動用戶。開發(fā)者可以方便地通過嵌入SDK,通過API調(diào)用或者Web端可視化操作,實現(xiàn)對特定用戶發(fā)送通知/消息,提升用戶活躍度,挽回潛在流失用戶,并實時查看推送效果。我們在這三面都有深入研究,取得了不錯的效果。

需求的挑戰(zhàn)

1.海量的用戶行為

目前該套流失預測系統(tǒng),每天最高時承接著480億條上報的用戶行為記錄。

2.海量的用戶

在已經(jīng)接入的游戲中,每天活躍著一億左右的用戶。

3.模型的通用性

流失預測的實際應用中,不僅僅包含了公司內(nèi)的游戲,還有公司外的游戲,以及各種各樣的應用。每個應用上報的自定義事件更是各不相同,但算法還要統(tǒng)一接入。

4.應用接入壓力

目前實際已經(jīng)介入100多款公司內(nèi)游戲應用,幾乎囊括了公司內(nèi)大部分主力手機游戲,包括《天天炫斗》,《天天德州》等。

鑒于上述的挑戰(zhàn)性,結(jié)合了騰訊大數(shù)據(jù)精準推薦平臺以“數(shù)據(jù)+算法+系統(tǒng)”的3方面打法,我們針對手游也總結(jié)了一套通用的業(yè)務流失預測模型。

騰訊信鴿大數(shù)據(jù):移動游戲流失用戶預測

系統(tǒng)–TRC平臺

TRC的全稱是Tencent Real-time Computing,是大數(shù)據(jù)精準推薦平臺專為海量數(shù)據(jù)實時處理而構(gòu)建的提供基礎計算能力的服務平臺,從全流程的實時計算體系的角度看,整個TRC由核心的平臺支撐層和擴展的平臺應用層構(gòu)成。

平臺支撐層主要包括實時數(shù)據(jù)接入、實時數(shù)據(jù)處理、實時數(shù)據(jù)存儲;平臺應用層主要包括實時算法預測,實時模型訓練,實時效果統(tǒng)計,實時系統(tǒng)監(jiān)控實時數(shù)據(jù)展示。總體結(jié)構(gòu)如所示:

騰訊信鴿大數(shù)據(jù):移動游戲流失用戶預測

TRC平臺經(jīng)過兩年多的現(xiàn)網(wǎng)運營,已經(jīng)逐步成熟穩(wěn)定,該平臺每天支撐公司2,000多億實時數(shù)據(jù)接入,每天26,000多億次實時計算,每天5,000多億次數(shù)據(jù)訪問,已經(jīng)在廣點通廣告推薦,電商物品推薦,視頻推薦,新聞推薦,微信業(yè)務性能監(jiān)控并實時統(tǒng)計等產(chǎn)品中大規(guī)模使用。

數(shù)據(jù)

在機器學習,算法建模中,數(shù)據(jù)是輸入,也是起點。數(shù)據(jù)的質(zhì)量的高低,優(yōu)劣,將直接影響著最終的算法效果。對于數(shù)據(jù)的研究和分析,往往耗費了研究者大量的時間和精力。

在流失預測模型運用到的數(shù)據(jù)中,存在著優(yōu)勢和劣勢。

優(yōu)勢是數(shù)據(jù)量大,每天高達百億級別的用戶行為記錄,日活躍一億左右用戶。并且有著豐富的用戶行為。比如,登錄,打怪,升級,加血,得分,領取金幣等,還有著更為豐富的各個游戲,應用的自定義事件。

劣勢也非常明顯。雖然行為豐富,但是每個應用上報的具體數(shù)據(jù)內(nèi)容無法規(guī)范統(tǒng)一,特別是自定義事件更無法控制,同時,還要達到無論是公司內(nèi)部手游,外部手游,還是各類應用都要模型通用,只能從這眾多豐富的數(shù)據(jù)中抽取它們共性的且有效的特征。

在本算法中,考慮到,通用性,有效性,并且易拓展性,具體抽取的特征有:登錄天數(shù),登錄頻次,最后登錄時間,登錄時長,等級等特征。

算法

在本次流失預測的建模中,采用了LR模型。在這里簡單介紹一下LR模型。Logisticregression(邏輯回歸)是當前業(yè)界比較常用的機器學習方法,用于估計某種事物的可能性。比如某用戶購買某商品的可能性,某病人患有某種疾病的可能性,以及某廣告被用戶點擊的可能性等。

Logistic回歸為概率型回歸模型,是研究分類觀察結(jié)果y與一些影響因素x(單變量,多變量都可以)之間關系的一種分析方法。

在流失預測模型中,具體輸入的用戶特征為登錄天數(shù),登錄頻次,最后登錄時間,登錄時長,目前等級等特征,輸出為用戶的流失可能性。同時,通過算法的結(jié)果的準確率,和召回率來評價算法效果。

流失預測的整體流程如所示,從公司內(nèi)外部游戲以及各類應用中抽取各類用戶,日常的登錄天數(shù),登錄頻次,最后登錄時間等特征,以及最后的流失狀況,來訓練LR模型。然后根據(jù)每天用戶相應特征,使用訓練好的模型來進行預測,得到最可能流失的用戶。

騰訊信鴿大數(shù)據(jù):移動游戲流失用戶預測

算法效果

基于玩家的在線時長,使用頻率等特征,建立流失用戶預測模型,精準預測潛在流失用戶。在公司外游戲《美人國》的ABTest中,預測覆蓋率超過85%,準確率超過91%。利用信鴿對該用戶群推送針對性的營銷活動,回流率比隨機推送提升120%。

在騰訊內(nèi)部XX游戲的ABTest中,我們的算法的預測覆蓋率達到79.847%,準確率達到85.646%。利用信鴿對該用戶群推送針對性的營銷活動,回流率比隨機推送提升326%。通過實踐證明:充分利用大數(shù)據(jù)的優(yōu)勢,幫助游戲大幅提升玩家留存率,同時減少對玩家的騷擾,保障用戶體驗。

游戲市場的競爭日趨激烈,新游戲產(chǎn)品增速逐漸放緩,越來越多的游戲運營開始借助于大數(shù)據(jù),機器學習,來挖掘出更多更細的用戶群,從而更有針對性的進行運營活動,能夠幫助游戲大幅提升玩家留存率,減少對玩家的騷擾,保障良好的用戶體驗。

最新禮包
熱門手游榜
1 王者榮耀
王者榮耀

手機網(wǎng)游

下載

2 陰陽師
陰陽師

角色養(yǎng)成

下載

5 一起來捉妖
一起來捉妖

角色養(yǎng)成

下載

8 奇跡暖暖
奇跡暖暖

角色養(yǎng)成

下載

9 少年歌行
少年歌行

角色養(yǎng)成

下載

優(yōu)游網(wǎng)訂閱號