【行銷資料科學】電商站內分群解析

追客 Fredrick Hong
7 min readJan 14, 2024

--

隔了一年多沒有發表文章,主要原因是自己的惰性,加上工作中對深度學習模型的需求已經趨近於零,也少了去年很想挖掘神經網路知識的慾望。

取而代之的,是更多對於面向電商行銷端的思考,例如:除了模型預測找到高價值的用戶外,回歸到 rule-based 要怎麼有效將這群人區隔出來?又或者這幾年面對第三方數據即將消失的情況,越來越被重視的廣告歸因的議題…等等。

因此這篇是紀錄平時工作中的想法,也希望可以和更多人交流。

這次想討論的是,很多 CDP、CRM 系統都會有的 用戶分群 的功能,但什麼方式才是比較好區分用戶的規則呢?

前情提要

對於「用什麼規則將用戶分群」才是比較好的方式,在討論這個問題之前,想先說明這篇不會涵蓋怎麼驗證的問題,並且假設我們手上握有的資料,是單一網站的會員資料。

既有常見的規則

NAPL 與 DCIU

上個月公司內部分享了一篇 91App 的文章:NAPL x DCIU :會員模型的交乘應用,也是看了這篇文章後,我才開始認真思考用戶分群的問題。

NAPL 是根據用戶的生命週期來區分的規則(以下說明取自這裡

  • N (New) 首購:最近三個月有第一次購物的會員。
  • A (Active) 活躍:最近三個月內有購物的「非首購」會員。
  • P (Potential)潛在:超過三個月「沒有」購物的「非首購」會員,也就 A 標籤的人,超過三個月沒有再回購,就會從 A 變成 P。
  • L (Lost) 流失:超過三個月沒有回購的首購會員。也就是買過一次之後,本來是 N,但後來就沒有再買第二次了,超過三個月沒有回購,變成L。

DCIU 是根據用戶的購買意願來區分的規則(以下說明取自這裡

  • D (Deciding) 最高購買意圖:官網互動行為非常多,近期頻率高,且有大量加入購物車、編輯購物車等等的趨近最後購買旅程的行為。
  • C (Considering) 高購買意圖:官網互動行為多,但近期頻率不高,有加入購物車行為等。
  • I (Interesting) 低購買意圖:官網隨意瀏覽者。
  • U (Un-interesting) 無購買意圖:沒有任何官網互動行為的會員。

NAPL 和 DCIU 的規則,其實各領域都可以自己重新設計,甚至上述 DCIU 所提到的官網互動行為,每個電商握有的使用者的互動事件可能就不太相同,只要透過合理的假設定義出規則,再上線比較各種組合後,相信可以找到一組最適合自己品牌的模式。

再退一部思考,DCIU 的概念,其實很像透過模型去預測用戶,在接下來的一段期間內是否會有購買行為的任務(Binary Classification),輸出是 0~1 之間的數值,這樣一來 DCIU 可以嘗試的組合又更多了。

NAPL x DCIU 的交乘應用

一般的行銷方式,都是某一個套規則將用戶分群後,直接做後續的應用,但如果把兩套規則所區分出來的各4組用戶交乘後,其實可以看到16種組合的應用,就能做到更細緻的受眾區隔,這件事情也是在上述 91App 的文章提到的。

購買意願 VS 興趣傾向

在做行銷時,大部分的人都理解,如果要長期提升品牌收益,除了找到最近對於有意願購買商品的人之外,長期經營對品牌有興趣的人(品牌忠誠度高),也是同樣重要的一件事情。

而上述的 NAPL x DCIU 就是屬於近期找到購買意願高的人,因此我認為我們還需要另一組能夠區隔出長期對品牌有興趣的規則,而當時的想法是將很有名的 RFM 再加上兩個指標,變成 RFM + S 來捕捉使用者對於品牌長期感興趣的程度。

傳統 RFM

傳統 RFM 的指標各自代表的意義

  • Recency:最近一次購買日期 與 當天日期 的差距
  • Frequency:時間內購買事件次數
  • Monetory:時間內購買總金額

自定義指標權重

我們可以根據每個使用者的 RFM 三個指標,彈性地給予三個指標不同的權重,藉此來計算出每位使用者的最終指標。

假設我們比較在意使用者近期的活躍程度,則可以將 Recency 的權重調高。

最終指標 = 0.6* Recency + 0.2*Frequency + 0.2*Monetory

假設我們比較在意使用者消費跟購買頻率的金額,則可以將 Frequency 跟 Monetory 的權重調高。

最終指標 = 0.2* Recency + 0.4*Frequency + 0.4*Monetory

藉由計算出最終指標,我們可以了解到在會員名單 或 進站過的使用者中,哪些人是我們優先需要留住的客戶。

分群

除了可以自定義三個指標的權重外,我們可以直接將三個指標作為 feature,讓分群模型(最常見的 Kmeans)替我們分群。

例如我們讓模型將使用者區分成5群人,再分別將這5群人的三個指標的統計分佈拉出來觀察,可能會發現某一群的平均購買金額、平均購買次數最高、但最近一次購買時間離今天的日期比較遠。

這樣的數據代表這群人是很喜歡品牌商品,並且消費力比較大,但可能購買週期還沒到,又或者這群人的平均 Recency ,已經品牌的平均回購時間,則代表有其他因素影響這群人的購買意願,例如原本喜歡買的商品下架、商品價格調漲、折扣消失等等。

透過模型分群,我們不需要自定義三個指標的權重,但在各群使用者行為的解釋上,就需要事後觀察後才能解釋。

RFM + S

之前應該也有人也將 S 這個指標到 RFM 中,而我是想找到一套識別使用者長期價值的規則,因此將它加入到 RFM 中,並且在規則也有一些調整。

我的想法是,要了解一個人對於品牌的長期價值,會不會穩定地回購 是一項重要的指標。

因為 Frequency 評估的是使用者在時間區間內的購買次數,一個人可能在短期間內買了好幾次,但這時他可能剛開始認識這個品牌,忠臣度還不高,買了幾次之後,可能發現自己不是那麼喜歡,就轉向去購買其他品牌的商品。

為了避免上述情況,去評估關於「購買間隔天數」相關的指標就變得很重要。

  • Staybility:平均購買間隔天數 / 購買間隔天數標準差

我們可以透過每位使用者 平均購買的間隔天數 所有人購買間隔天數的標準差,來了解這位使用者的回購穩定度。

RFM + S 的流程如下

可以看到我把原本的 RFM 變成 FMS,將 Recency 當成前面的篩選條件,原因是我認為在判斷長期價值時,只要 Recency 還落在正常範圍內,Recency 的大小不應該影響到使用者長期價值,畢竟我們只要知道他一定會回購就足夠了。

因此我覺得只要設定一個門檻,這邊是選擇寬鬆一點的門檻,2.5*標準差 + 平均值,將已經沈睡的使用者排除掉。

接著再將以長期來看,仍然活躍的使用者,透過 Frequency、Monetory、Staybility 三個指標計算出長期價值(可以自定義指標權重 或 用分群模型來區隔受眾)。

如此一來,RFM + S 的規則比起原本的 RFM 規則,就不會發生因為回購週期還沒到(Recency 很低),但 Monetory 和 Frequency 都很高的用戶,最終指標被低估的情況。並且也透過 Stability 來評估用戶回購的穩定度。

結論

透過 NAPL x DCIU 找到短期對品牌有購買意圖的使用者,透過 RFM + S 找到長期對品牌有忠臣度的使用者,藉此可以根據這兩種規則找到的區隔受眾,變化出更多符合該群使用者需求的優惠、推播訊息、或是廣告。

以上就是前陣子對於用戶分群的一些想法,關於用戶分群的主題網路上有非常多討論,也很歡迎有人可以一起聊聊!如果喜歡我的分享,歡迎給個clap或留下留言!

--

--

追客 Fredrick Hong

畢業後就到在數位廣告業打滾,之前是廣告優化師,目前則是在數據團隊任職。