【行銷資料科學】電商站內分群解析

7 min readJan 14, 2024

隔了一年多沒有發表文章，主要原因是自己的惰性，加上工作中對深度學習模型的需求已經趨近於零，也少了去年很想挖掘神經網路知識的慾望。
取而代之的，是更多對於面向電商行銷端的思考，例如：除了模型預測找到高價值的用戶外，回歸到 rule-based 要怎麼有效將這群人區隔出來？又或者這幾年面對第三方數據即將消失的情況，越來越被重視的廣告歸因的議題…等等。
因此這篇是紀錄平時工作中的想法，也希望可以和更多人交流。
這次想討論的是，很多 CDP、CRM 系統都會有的 用戶分群 的功能，但什麼方式才是比較好區分用戶的規則呢？

前情提要

對於「用什麼規則將用戶分群」才是比較好的方式，在討論這個問題之前，想先說明這篇不會涵蓋怎麼驗證的問題，並且假設我們手上握有的資料，是單一網站的會員資料。

既有常見的規則

NAPL 與 DCIU

上個月公司內部分享了一篇 91App 的文章：NAPL x DCIU ：會員模型的交乘應用，也是看了這篇文章後，我才開始認真思考用戶分群的問題。

NAPL 是根據用戶的生命週期來區分的規則（以下說明取自這裡）

N (New) 首購：最近三個月有第一次購物的會員。
A (Active) 活躍：最近三個月內有購物的「非首購」會員。
P (Potential）潛在：超過三個月「沒有」購物的「非首購」會員，也就 A 標籤的人，超過三個月沒有再回購，就會從 A 變成 P。
L (Lost) 流失：超過三個月沒有回購的首購會員。也就是買過一次之後，本來是 N，但後來就沒有再買第二次了，超過三個月沒有回購，變成Ｌ。

DCIU 是根據用戶的購買意願來區分的規則（以下說明取自這裡）

D (Deciding) 最高購買意圖：官網互動行為非常多，近期頻率高，且有大量加入購物車、編輯購物車等等的趨近最後購買旅程的行為。
C (Considering) 高購買意圖：官網互動行為多，但近期頻率不高，有加入購物車行為等。
I (Interesting) 低購買意圖：官網隨意瀏覽者。
U (Un-interesting) 無購買意圖：沒有任何官網互動行為的會員。

NAPL 和 DCIU 的規則，其實各領域都可以自己重新設計，甚至上述 DCIU 所提到的官網互動行為，每個電商握有的使用者的互動事件可能就不太相同，只要透過合理的假設定義出規則，再上線比較各種組合後，相信可以找到一組最適合自己品牌的模式。

再退一部思考，DCIU 的概念，其實很像透過模型去預測用戶，在接下來的一段期間內是否會有購買行為的任務（Binary Classification），輸出是 0~1 之間的數值，這樣一來 DCIU 可以嘗試的組合又更多了。

NAPL x DCIU 的交乘應用

一般的行銷方式，都是某一個套規則將用戶分群後，直接做後續的應用，但如果把兩套規則所區分出來的各4組用戶交乘後，其實可以看到16種組合的應用，就能做到更細緻的受眾區隔，這件事情也是在上述 91App 的文章提到的。

購買意願 VS 興趣傾向

在做行銷時，大部分的人都理解，如果要長期提升品牌收益，除了找到最近對於有意願購買商品的人之外，長期經營對品牌有興趣的人（品牌忠誠度高），也是同樣重要的一件事情。

而上述的 NAPL x DCIU 就是屬於近期找到購買意願高的人，因此我認為我們還需要另一組能夠區隔出長期對品牌有興趣的規則，而當時的想法是將很有名的 RFM 再加上兩個指標，變成 RFM + S 來捕捉使用者對於品牌長期感興趣的程度。

傳統 RFM

傳統 RFM 的指標各自代表的意義

Recency：最近一次購買日期與 當天日期 的差距
Frequency：時間內購買事件次數
Monetory：時間內購買總金額

自定義指標權重

我們可以根據每個使用者的 RFM 三個指標，彈性地給予三個指標不同的權重，藉此來計算出每位使用者的最終指標。

假設我們比較在意使用者近期的活躍程度，則可以將 Recency 的權重調高。

最終指標 = 0.6* Recency + 0.2*Frequency + 0.2*Monetory

假設我們比較在意使用者消費跟購買頻率的金額，則可以將 Frequency 跟 Monetory 的權重調高。

最終指標 = 0.2* Recency + 0.4*Frequency + 0.4*Monetory

藉由計算出最終指標，我們可以了解到在會員名單或進站過的使用者中，哪些人是我們優先需要留住的客戶。

分群

除了可以自定義三個指標的權重外，我們可以直接將三個指標作為 feature，讓分群模型（最常見的 Kmeans）替我們分群。

例如我們讓模型將使用者區分成5群人，再分別將這5群人的三個指標的統計分佈拉出來觀察，可能會發現某一群的平均購買金額、平均購買次數最高、但最近一次購買時間離今天的日期比較遠。

這樣的數據代表這群人是很喜歡品牌商品，並且消費力比較大，但可能購買週期還沒到，又或者這群人的平均 Recency ，已經品牌的平均回購時間，則代表有其他因素影響這群人的購買意願，例如原本喜歡買的商品下架、商品價格調漲、折扣消失等等。

透過模型分群，我們不需要自定義三個指標的權重，但在各群使用者行為的解釋上，就需要事後觀察後才能解釋。

RFM + S

之前應該也有人也將 S 這個指標到 RFM 中，而我是想找到一套識別使用者長期價值的規則，因此將它加入到 RFM 中，並且在規則也有一些調整。

我的想法是，要了解一個人對於品牌的長期價值，會不會穩定地回購 是一項重要的指標。

因為 Frequency 評估的是使用者在時間區間內的購買次數，一個人可能在短期間內買了好幾次，但這時他可能剛開始認識這個品牌，忠臣度還不高，買了幾次之後，可能發現自己不是那麼喜歡，就轉向去購買其他品牌的商品。

為了避免上述情況，去評估關於「購買間隔天數」相關的指標就變得很重要。

Staybility：平均購買間隔天數 / 購買間隔天數標準差

我們可以透過每位使用者 平均購買的間隔天數 跟 所有人購買間隔天數的標準差，來了解這位使用者的回購穩定度。

RFM + S 的流程如下

可以看到我把原本的 RFM 變成 FMS，將 Recency 當成前面的篩選條件，原因是我認為在判斷長期價值時，只要 Recency 還落在正常範圍內，Recency 的大小不應該影響到使用者長期價值，畢竟我們只要知道他一定會回購就足夠了。

因此我覺得只要設定一個門檻，這邊是選擇寬鬆一點的門檻，2.5*標準差 + 平均值，將已經沈睡的使用者排除掉。

接著再將以長期來看，仍然活躍的使用者，透過 Frequency、Monetory、Staybility 三個指標計算出長期價值（可以自定義指標權重或用分群模型來區隔受眾）。

如此一來，RFM + S 的規則比起原本的 RFM 規則，就不會發生因為回購週期還沒到（Recency 很低），但 Monetory 和 Frequency 都很高的用戶，最終指標被低估的情況。並且也透過 Stability 來評估用戶回購的穩定度。

結論

透過 NAPL x DCIU 找到短期對品牌有購買意圖的使用者，透過 RFM + S 找到長期對品牌有忠臣度的使用者，藉此可以根據這兩種規則找到的區隔受眾，變化出更多符合該群使用者需求的優惠、推播訊息、或是廣告。

以上就是前陣子對於用戶分群的一些想法，關於用戶分群的主題網路上有非常多討論，也很歡迎有人可以一起聊聊！如果喜歡我的分享，歡迎給個clap或留下留言！