K-Means 聚类:客户价值分析

时间:2021-11-21 07:11:01
1 背景与挖掘目标
1.1 背景
1、航空公司业务竞争激烈,企业营销焦点从产品中心转为客户中心;
2、针对不同类型客户,进行精准营销,实现利润最大化;
3、建立合理的客户价值评估模型,进行客户分类,是解决问题的关键。
1.2 挖掘目标
1、借助航空公司客户数据,对客户进行分类;
2、对不同的客户类别进行特征分析,比较不同类客户的客户价值;
3、对不同价值的客户类别提供个性化服务,制定相应的营销策略。

2 分析方法与过程
2.1 分析方法
1、首先,明确目标是客户价值识别;
2、识别客户价值,应用最广泛的客户细分模型是通过三个指标:最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary);
3、以上模型简称 RFM 模型,作用是:识别出高价值的客户。
  • 消费金额,一般表示一段时间内,消费的总额。但是,因为航空票价收到距离和舱位等级多种因素的影响,同样消费金额的旅客对航空公司价值不同。
  • 因此,需要修改指标。选定变量,舱位因素=舱位所对应的折扣系数的平均值=C,距离因素=一定时间内累积的飞行里程=M。
  • 再考虑到,航空公司的会员系统,用户的入会时间长短能在一定程度上影响客户价值,所以增加指标L=入会时间长度=客户关系长度
  • 总共确定了五个指标,最近消费时间间隔R,消费频率F,飞行里程 M和折扣系数的平均值C,客户关系长度L
  • 以上指标,作为航空公司识别客户价值指标,记为LRFMC模型
4、若采用传统RFM模型分析的属性分箱方法,如下图,它是依据,各属性的平均值进行划分。缺点是:细分客户群太多,精准营销成本太高。

K-Means 聚类:客户价值分析

5、综上,本案例以 LRFMC 五个指标为基础,采用聚类(K-Means)的方法,识别客户价值。
6、本案例,总体流程如下图:
K-Means 聚类:客户价值分析
2.2 挖掘步骤
1、从数据源进行数据抽取,选择性抽取与新增数据抽取,形成历史数据和增量数据;
2、对步骤1的两个数据,进行数据探索性分析和预处理,主要有缺失值与异常值的分析处理,数据的属性规约、清洗和变换;
3、利用步骤2处理后的数据作为建模数据,基于旅客价值的LRFMC模型进行客户分群,对各个客户群再进行特征分析,识别有价值客户;
4、针对模型结果得到不同价值的客户,采用不同的营销手段,提供定制化的营销服务,或者针对性的优惠与关怀。(重点维护老客户)。
2.3 数据抽取
1、以2014-03-31为结束时间,选取宽度为两年的时间段(2012-4-1至2014-3-31),作为观测窗口,抽取观测窗口内所有客户的详细数据,形成历史数据;
2、对于后续新增的客户信息,以新增数据中最新的时间点作为结束时间,形成新增数据。
2.4 探索性分析
1、探索性分析,主要对数据进行缺失值和异常值分析。
2、发现,存在票价为空值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。票价为空值,可能是不存在乘机记录。其他数据可能是,飞机票为0折扣或来自于积分兑换等;
3、查找每列属性观测值中空值的个数、最大值、最小值,结果如下。
K-Means 聚类:客户价值分析K-Means 聚类:客户价值分析
2.5 数据预处理
1、数据清洗
  • 丢弃票价为空的记录;
  • 丢弃票价为0、平均折扣率不为0、总飞行公里数大于0的记录。

K-Means 聚类:客户价值分析K-Means 聚类:客户价值分析

2、属性规约
  • 原始数据中属性太多,根据航空公司客户价值LRFMC模型,选择与模型相关的六个属性。
  • 删除不相关、弱相关或冗余属性,如会员卡号、性别等。
  • 与模型相关的六个属性分别是:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、SEG_KM_SUM、LAST_TO_END、avg_discount
K-Means 聚类:客户价值分析
3、数据变换
  • 数据变换就是将数据转换成“适当”的格式,以适应挖掘任务及算法的需要;
  • 本例主要采用的数据变换方法是:属性构造和数据标准化;
  • LRFMC 5个指标需要通过原始数进行提取,计算方式如下:
L = LOAD_TIME - FFP_DATE
R = LAST_TO_END
F = FLIGHT_COUNT
M = SEG_KM_SUM
C = avg_discount
K-Means 聚类:客户价值分析
  • 5个指标的取值范围差异较大,需进行标准化处理,消除数量级的影响;
K-Means 聚类:客户价值分析
2.6 模型构建
模型的构建主要包括两部分:1、根据指标数据,对客户作聚类分群;2、结合业务对每个客户群进行特征分析,分析其客户价值,并对每个客户群进行排名。

1、客户聚类
采用K-Means算法对客户数据进行客户分群,聚成五类(需结合业务的理解与分析来确定客户的类别数量)
K-Means 聚类:客户价值分析K-Means 聚类:客户价值分析
绘制客户群特征雷达图:

K-Means 聚类:客户价值分析
K-Means 聚类:客户价值分析
2、客户价值分析
针对“客户群特征分析图”所示的聚类结果,结合业务进行特征分析。 我们重点关注的是L(户关系长度 、F(消费频率)、M(飞行里程)三个指标:
  • 客户群1(Customers 1)在C属性上最大,可定义为重要挽留客户;
  • 客户群2(Customers 2)在R属性上最大,在F、M属性上最小,可定义为低价值客户;
  • 客户群3(Customers 3)在F、M属性上最大,在R属性上最小,可定义为重要保持客户;
  • 客户群4(Customers 4)在L、C属性上最小,可定义为一般客户;
  • 客户群5(Customers 5)在L属性上最大,可定义为重要发展客户;
每种客户类别的特征如下:
  • 重要保持客户:C(平均折扣率较高、仓位等级较高)、F(乘坐次数)、M(里程)较高,R(最近乘坐航班)低。应将资源优先投放到这类客户身上,进行差异化管理,提高客户的忠诚度和满意度。
  • 重要发展客户:C较高,R、F、M较低。这类客户入会时长(L)短、当前价值低、发展潜力大,应促使客户增加在本公司和合作伙伴处的消费。
  • 重要挽留客户:C、F 或 M 较高,R较高 或 L变小,客户价值变化的不确定性高。应掌握客户最新信息、维持与客户的互动。
  • 一般和低价值客户:C、F、M、L低、R较高。这类客户可能在打折促销时才会选择消费。
K-Means 聚类:客户价值分析
3 模型应用
1)会员升级与保级(积分削减等)
在会员升级或保级评价的时间点前,对接近但尚未达到要求的较高消费客户进行提醒或促销活动,提高客户满意度。
2)首次兑换
对接近但尚未达到标准的会员进行提醒或促销活动,提高客户满意度。
3)交叉销售
通过与非航空类企业的合作,使客户在其他消费过程中获得本公司积分,增强与公司联系,提高忠诚度。
4 小结
  • 获取新客成本远大于维持老客,应努力维系客户关系水平,保持优质客户。
  • 差异化管理、精准营销,提高客户忠诚度、满意度,延长客户高水平消费。