权重是什么意思|权重基本原理( 五 )


某个产品月销5000件,这是销量高的产品吗?看同行,同行是最低1万件起步还是最高月销1000件 。
数学语文英语三科都是96,这是尖子生吗?看同学,同学是双百分起步还是90分就算最高分 。
所有的数据指标优秀与否,并没有一组固定不变的参考值,比如是500或是10000 。在淘宝平台内,作为比较系,是取同行业的平均值作为参考值,每个细分行业都会有不同行业的特点,每个行业的标准也都来自这个行业的整体表现,因此相对公正、客观 。淘宝的数据参考值有两个,一个是行业同层平均,另一个是行业同层优秀 。同层优秀是指行业top 10%的平均值,假设如果总共有100人的话,就是前10名成绩的平均值;同层平均是指行业top 40%的平均值,假设如果总共有100人的话,就是指前40名成绩的平均值 。
权重是什么意思|权重基本原理



同层级是指平台根据店铺的销售额体量,划分了1-7共7个层级,跟打游戏一样划定青铜、黄金等段位,青铜对青铜、黄金对黄金,我们匹配的都是相近销售额体量,相同层级的竞争对手 。无论行业大盘如何波动,同层级的商家都是相似的起点,就看同样环境下谁跑的更快、谁跑的更稳 。
产品也好,店铺也好,是往上走还是往下走,对比两条参考线即可一目了然 。比如,虽然产品数据每日飙升,但飙升速度小于行业均值速度,那么逆水行舟不进则退,当以行业均值作为水平线时,上升速度b就是在走下坡路了,如下图 。
权重是什么意思|权重基本原理



算法的目的就是为了排出高低 。好与不好,数据说了算,数据是增还是减,买家说了算 。数据其实是千万个买家共同决策的结果,而数据的高低又决定了排名的先后 。
差距是如何产生的
拿淘宝平台来说,竞争从展现之初就开始了,我们以200个展现为例,模拟一下产品是如何一步步拉开差距的 。
| 展现(曝光量):在统计时间内,商品在搜索被展现的次数 。
这里模拟搜索结果页中的前40个产品,假设买家搜索关键词后都会展现在买家面前,而买家最终选择其中一个进行点击 。200个展现换句话说就是有200个买家同时到达这个页面,这40个产品都被看到,但只有一个产品被点击,下面模拟200个买家到达搜索结果页后选择不同产品的结果 。
权重是什么意思|权重基本原理



我们可以发现,同样是第1页的位置,在同样是200个买家到达这个页面后,每个产品都拿到了200个展现量这个数据(40个产品都被看到了),强势的产品拿走了大量的点击量(如图最高20个),弱势的产品甚至一个展现量都没有,一些富得流油,一些饿得半死 。40个产品同时到达了第1页的位置,但不同的数据表现将决定着他们下一次的排名位置 。这40个产品中top3点击量分别是1号产品20个、5号产品18个、2号产品16个,对应的点击率为1号产品:10%、2号产品9%、3号产品8% 。
经过这200个展现的周期后,按照点击率的降序排列,得到了新的排序,此时各个产品获取点击量的能力高下立见,同时也决定着这些产品今后的命运:把这40个产品的成绩放到全年级进行排名:尖子生被分到加强班冲击清华北大,优秀学生好好培养一下冲击一本线、普通学生加把劲争取考上二本、成绩差一点的学生考个好一点的专科,重点是别捣乱就行 。如此循环往复清华北大的学霸和专科生的学渣就是这样拉开差距的,与其说是高考成绩区分了学霸和学渣,不如说日常的表现才是决定学霸与学渣的根本原因 。
权重算法的回归
数据通过买家的比较产生,平台依据业务逻辑设计加权算法,最终通过产品的数据表现反过来概括产品的竞争能力 。就好像年级总成绩排名并不是只求分数的高低,分数是一个学生学习能力的部分体现,最终是想用分数排名来实现对学生学习能力强弱的排名,最终的排序,实际上是综合竞争能力强弱的排序 。
所有加权算法的原材料都是体现买家真实意愿的基础数据,比如点击量、支付人数等 。数据通过比较产生,权重再依据数据概括竞争能力的强弱,加权算法的目的是通过数据勾勒出产品竞争能力轮廓,并以此作为决策依据,将竞争力强的产品排在前列 。
得到好的排名并不是终极目标,拥有好的排名只完成了一半,另一半更重要的是证明自己配得上现在的排名,并且值得拥有更好的排名,值得到达更高的地方,这是一个不断自我证明的动态的过程 。