如何定价|数据应该如何定价( 四 )


总而言之 , 在数据的交易过程中 , 数据价格的生成机制应该根据其交易模式来设计 。对于供需双方数量都较多 , 交易比较频繁的交易 , 可以更多地放任市场供求自行确定价格 。而当供求中的至少某一方数量相对较少 , 在容易出现因供求双边垄断而导致交易无法进行的情况下 , 则应该引导数据供给者先披露其保留价格 , 然后根据交易数据的特征 , 设计一定的交易机制来促进数据竞争的效率 。通过这些设计 , 数据价值就能更好地被发掘 , 数据资源本身也能够得到更有效率的配置 。
无交易场景下的数据资产估值问题
到目前为止 , 我们对于数据价格的讨论依然集中在交易的场景之下 。但还有很多时候 , 我们需要在交易本身并不能发生的前提下去为数据估价 。
一种场景是数据驱动的并购案件 。在这些案件中 , 被并购的公司所拥有的实物资产可能很少 , 就只有几台电脑 , 但它们却通过自己的技术 , 掌握了一些独一无二的数据 。在这个时候 , 如何给这些数据估价就成了一个难题 。一个现实的案例是2016年时 , 谷歌对职业社交网络公司领英(LinkedIn)的收购 。当时 , 谷歌开出的高于领英市值50%的高溢价让整个市场都震惊不已 , 谷歌对此给出的一个重要理由是 , 领英拥有独一无二的数据 , 这些数据能够在未来为谷歌带来丰厚的回报 。不过 , 谷歌这笔钱究竟掏得值不值 , 到目前为止依然有很大的争议 。
另一个场景是涉及数据侵权的案件 。举例来说 , 这几年涉及网络爬虫的案件非常多 。一些数据公司为了获取数据 , 经常编写各种爬虫程序 , 去企业的网站上爬取数据 , 这很可能对这些公司造成侵权 。当这类案件发生时 , 应该如何评估这些被爬取的数据的价值 , 又应该如何计算相应的损害赔偿 , 都会成为很大的问题 。
对于以上这些场景 , 数据本身并没有发生交易 , 甚至没有发生交易的机会 。那么 , 在这些情况下 , 又应该如何对数据来进行估价呢?在我看来 , 面对类似的情况 , 我们不妨将数据视为一种广义上的资产 , 然后根据通用的资产价值评估来设定数据的价格 。
在资产评估中 , 常用的估值思路有两大类:直接法和比较法 。其中 , 直接法是试图从资产本身入手 , 去进行估价;而比较法则是与已有的类似交易对比 , 在类似交易所产生的价格基础之上进行修订来确定资产的价格 。这两种思路 , 都可以被借鉴到数据资产的估价当中来 。
先看直接法 。在资产估值中 , 直接法可以分为不同的角度 。例如 , 我们可以从成本的角度来看资产 , 在成本加成的基础上确定一个价值 。这种思路 , 其实就像是前面所提到的数据供给者对保留价格的确定 , 只不过在这儿 , 估价会是由一个独立的第三方给出的 。与成本相对的 , 我们也可以从收益的角度来看资产 。具体来说 , 无论是对于数据 , 还是其他的什么资产 , 但凡是一种资产 , 其价值的最终决定因素就是其未来收益流的贴现 。对于评估机构 , 它们可以借助定量的方法 , 测算出数据可能为潜在者在未来各期带来的现金流改变 , 然后将这些现金流用一个比较公允的贴现值贴现到现在 , 就可以得到数据资产的价值 。
在现实当中 , 数据究竟能给使用者带来怎样的回报 , 具有很强的不确定性 , 其实现会依赖很多因素 。为了综合考虑这种因素 , 我们可以考虑引入实物期权(realoption)的观点来对其进行评估 。在这种方法下 , 我们可以把数据分析工作视为一种风险投资 , 而购买的数据则可以被视为是在未来一段时期内从事或不从事这项活动的一种选择权(option , 在英文中 , 它和期权百思特网是同一单词 。也有些文献直接把期权译为选择权) 。
相比于直接评估数据本身带来的收益 , 评估数据分析活动本身可能产生的价值是要更为容易的 。一旦我们知道了数据分析活动可能的结果的概率分布 , 以及所有结果所对应的概率分布 , 我们就可以借用金融学中的期权定价方法来计算它 。如果这些收益是连续的 , 且被假设服从正态分布 , 那么我们可以使用布莱克-肖尔斯(Black-Scholes)公式来直接得出估值;而如果收益是离散的 , 我们也可以用二叉树分析或者其他的方法来获得结果 。或许有人会问 , 这种公式所计算出的价值靠谱吗?这取决于我们怎么定义“靠谱” 。事实上 , 即使在期权交易中 , 布莱克-肖尔斯所计算的期权价格也未必和真正的成交价符合 , 但重要的是 , 它可以提供一个认识的“聚点” , 在一定程度上消除人们对期权估值的分歧 。我想 , 在数据资产的估价问题中 , 实物期权的思路也可以扮演类似的角色 。