揭秘电商评分系统的核心原理：如何让评分更可信？-白红宇

揭秘电商评分系统的核心原理：如何让评分更可信？

阅读量：2088 次

发布时间：2019-04-29

本文共 2164 字，大约阅读时间需要 7 分钟。

640?wx_fmt=jpeg

全文共2040字，预计学习时长4分钟

你是否总在网上购买产品前查看相关评论和评论数？在浏览电商网站或其他类似的产品门户时，很多消费者都非常依赖评分，下单之前总是通过这种方式评估产品。

而且，这些评分并不只限于电商门户，全网各渠道都有它们的身影，比如说：博客、新闻网站、酒店评分、美食评分、电影评分等等。

640?wx_fmt=png

那么，这些评分系统是如何运作的？这究竟是个简单的平均数计算，还是涉及到了更复杂的数据科学问题？让我们一起来揭秘吧！

640?wx_fmt=jpeg

建立评分系统的问题陈述

假设一个博主想要把自己最棒的三篇博文按照人气排序，并展示在主页的醒目位置。这位博主想要依照读者的点赞数和转发数来给博文排序。考虑到一些新博文才刚刚达到足够的阅读量，他想知道是否应该用简单平均数来解决这个问题。

实际上，很多网站都面临着同样的问题，只不过问题范围更大。恰当的排序对于博主自身的品牌打造和读者群体同样重要。

640?wx_fmt=jpeg

社交影响无处不在

在线社交网络并不限于少数专门供用户创造和分享内容的软件或应用，而是遍及全网。这些虚拟共享社区以社交影响的形式，展示人们对彼此的劝导作用。这种影响以多种形式呈现，在从众、顺从、同辈压力、说服、销售和营销中都能看到。

在线顾客评分评价，就是属于对相似商品或服务感兴趣的群体的社交网络。

640?wx_fmt=png

在网上，产品或服务的终端用户通过“评星”或是“点赞”，有时是文字评论来交流。

毫无疑问，这与我们能想到的其他任何网络一样可行，甚至更好。

对于任何评分系统或是信誉系统，“人”既是核心，也是用户，无论整个平台的功能是怎样的。这个平台可以是简单的点评论坛 (Yelp, IMDb或者Beer Advocate) 、共享经济（比如爱彼迎或优步）、市场（亚马逊，Flipkart或是Swiggy），甚至是中国正在完善的社会信用体系。

640?wx_fmt=jpeg

相信星级评分

评分是如此符合消费者的心理，以至于人们毫无芥蒂地“信任”它。人们潜意识里相信评分，依赖评分做购买决策，让评分代替他们个人做出选择。

640?wx_fmt=png

那么，为什么评分对人们的选择那么重要呢？为什么人们相信评分，并为此付出时间、金钱和感情呢？可以说，这些评分让人们觉得决策更加透明，能验证他们的决定，并且任何时候都可以简单高效地用一个分值做出决策。

将来自不同用户社区的上百个评分集合为唯一的评分值，集中体现多样性的本质，这既属于艺术的领域，也属于科学的领域。有些企业这已经掌握并且有效地应用了这一技术。

对于这些企业来说，这是一个秘密武器，能够减少及消除人们尝试改变现有评分却不给出真实观点所带来的影响。

640?wx_fmt=jpeg

用贝叶斯评分修正给星级评分排序

对于亚马逊这样的市场，相同品类的竞品排序原则就是让排序显得自然；为了实现这一点，排序标准（即每个商品的等级评分值）应与产品相对于整个品类的评论量挂钩。

因此，要从用户对这一品类的整体评分开始。然后把策略由“简单平均评分”调整为“贝叶斯评分修正”，这样做是为了在产品排序中体现出评论数的不同。

转变为贝叶斯的方法有一个好处，那就是即使观测量比较少，结果也能保持稳定。因为这样就能减少极端值的出现概率了。

比如说，我们想要从同一品类的三个产品中选出最好的一个。手动计算过程如下：

最终，新用户在意的是排序能否直观地反映出他们能观察到的东西，即同一品类中每个商品的评分和评论数量；既然用户能看到具体数据，如果他们认为最好的商品质量差的可能性最小，那么他们就会更加信任网站。

正是贝叶斯评分修正带来了这种直观性。

回到博文排序的例子，在这个例子中评分来自于阅读量、点赞数和转发数的结合，可以发现这个简单的排序看重点赞和转发的比率。

为了方便感兴趣的读者，我们用平均点赞数、转发量、和阅读量给文章评分加权。

此时，评分的计算公式为：

640?wx_fmt=png

我们不会深入计算细节，因为本文的目的是介绍贝叶斯评分修正的概念。如果读者对其背后的计算过程感兴趣，可以上网查找相关资源（有很多可获得的资源）。

在这里，我们直接跳到评分系统中核心的贝叶斯修正模型：

640?wx_fmt=png

我们可以用贝叶斯评分修正来计算新的排序。相比于简单平均评分，这种方法能提供更直观的文章排序。

在这里，建议你用一个小的数据集来检验这一概念。学习数据科学理念很棒，但是，在没有看到它的实际操作之前，你无法真正地领会它的价值。

640?wx_fmt=jpeg

总结

那么，简短地概括一下本文内容。

我们关注的问题是什么？如何将一个或多个评分很少的产品与评分更确定的产品相比较？如何解决这个问题？

我们已经知道，如果某些产品比其他产品评论和评分更多，这样的产品可以看作标尺。如果一个产品评论很多，它的平均分就是可信的；但如果一个产品的评分与其他产品相比太少，可以假设这个产品在整个品类中处于平均水平。

这就是贝叶斯评分修正的作用。它根据人们对产品本身评分的信任程度，将评分定位到产品自身平均评分和品类总体平均分之间的某一点上。

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组：蔡思齐、翁梦徽