互联网公司的证券指数们自媒体

/ 魏武挥 / 2015-04-16 08:29
10年的时候,我曾经作为一个外部评委参加过一个运营商视频基地的内容采购评估。当时很多视频网站都前来应标。搜狐视频的应标者的话语给我留下了深刻的印象。他们宣称,他们...

4月头上,随着蚂蚁金服正式推出淘金100指数,BAT三家互联网巨头再一次在同一个领域里碰头:他们都开始做自己的股票指数。

如果算上新浪的i指数,迄今为止,已经有四家互联网公司编制股票指数。

对股票指数的投资,被视为一种被动型投资,它比较适合风险厌恶度高而且相对没有太多时间看盘的人。

我一向认为,在整个大势走好的情况下,投资指数,是一种不错的解决方案。算是顺势而为,又不用动什么脑子。

股票指数不是什么新鲜事,但互联网公司出手制作股票指数,是互联网金融大潮下的一桩新鲜事。

无一例外,他们都宣称自己:大数据。

下表可以比较直观地看一下这四个互联网公司做的股票指数的简单情况:

这个表能看到几个指数的表现情况,淘金100由于刚刚发布,不在统计之列:

2015年以来的表现:

四个指数,可以分成三类。

第一类,腾讯的腾安和新浪的i系列。这个属于“媒体指数”,不算什么太新鲜的事,赫赫有名的道琼斯指数、日经指数、金融时报指数都是媒体指数——由媒体发布指数。

腾安基本上没有提及如何利用腾讯的数据来制作指数——虽然我们都知道,腾讯拥有强大的社交大数据。腾安是发布最早的一个互联网公司指数,13年5月的时候,微信已经出发,但并没有像今天那样无孔不入。

从腾讯公司的发言人身份来看,它也的确是一个媒体指数。我查到当时的媒体通稿里都引述了马立的致辞,马立是腾讯网的副总编。

腾安强调了它的专家评审机制,有这样的话语:“腾安价值专家评审委员会阵容强大,由财经媒体、证券投资、资本运作、市值维护、行业研究、宏观经济以及金融工程等不同领域的专家组成,从不同的专业角度排除投资地雷。”

很奇怪,腾安指数不怎么提及腾讯自选股,后者是腾讯旗下在证券行当里非常重要的软件。腾讯自选股与腾讯网同属OMG部门。

新浪的i系列,号称与新浪财经大数据有关,“通过新浪财经大数据分析,找到一种有效的连接用户情绪与股价表现的关系,将符合这种关系的股票提取出来,是大数据因子的精髓,也是指数编制过程中最大的创新”——这个有效的连接用户情绪与股价表现的关系,十分让人不明觉厉。

新浪这样解释它的这个“有效关系”:用户在新浪财经对行情的访问热度、对股票的搜索热度;用户在新浪财经对股票新闻的浏览热度;股票相关微博的多空分析数据。

不过,新浪在互联网门户媒体里虽然很强,但不具有压倒性垄断优势。它的用户样本,是整个互联网财经领域中的重要组成部分,但要说能有效代表,比较牵强。微博倒是一个不错的数据源——因为新浪微博有压倒性垄断优势——但微博这个行当,本身在走下坡路。

我个人的看法是,新浪i指数,依然是一个媒体指数。

后面两个,才是真正意义上的大数据分析后的互联网公司指数。

百度的百发,可以视为基于搜索的指数。蚂蚁的淘金,可以视为基于流水的指数。这两种指数,在前互联网时代是不可想象的。也是前面提及的“道琼斯指数、日经指数、金融时报指数”完全做不出来的。

而且,它们与即时性有关,是真正的用“当下发生的”去预测未来。它们也和“全样本”有一定的关系,百度是中国最大的搜索引擎,阿里是中国最大的电商平台,在各自领域具有压倒性的垄断优势。虽然百度和阿里不等同于全部的搜索和电商,但要说它们能代表搜索和电商,应该没有太大的疑问。

搜索,反映着人们的兴趣(或者称之为意愿),某种意义上代表着“关注”。而且,人们在使用搜索的时候,是需要自己填入一个或者若干关键词的。搜索关键词理论上讲,可以找到人们在盘算这个议题时候的思考重点。

谷歌利用搜索,做了全美流感趋势判断,号称比医疗系统出来的数据还快还准,这是大数据领域中会被反复提及的经典案例。

淘金100则建立在阿里平台上的交易流水,根据电子商务的交易流水,阿里旗下的蚂蚁金服做了一个“维他命平台”,来判断行业景气度情况,然后根据这个行业景气度,筛选股票形成淘金100指数。

用电子商务交易流水来判断行业景气度,这个逻辑是可靠的。著名的巴菲特买可口可乐的故事也说明了这点:巴菲特看到很多人从超市里大量购买可口可乐从而决定入股巴菲特。这个故事可靠性有多高不得而知,但大致逻辑是可信的。

这两个指数,各有优劣。淘金100,在我个人看来,更能反映2C行业的景气度,而证券市场上,也存在大量2B业务的公司。2C的景气度能否推2B,理论上可以,但并不完全,模型建构更复杂。百发100,2B和2C都能覆盖,但从搜索意愿和兴趣到实际的公司基本面情况,中间链条比较长,而且数据清洗工作比淘金100更难。毕竟销售达成和消费意愿,有关联但还是不同。

但这两个指数所仰仗的数据源,是可以信任的。大数据的难点之首,就是数据采集。没数据,后面就啥都没有了。

这四个互联网公司指数如果做一个横向比较的话,我大致是这样一个结论:

腾安指数,腾讯网在中国互联网网站中流量排名第二(仅次于百度),数据比较大,有强大专家评审团。

新浪i系列,新浪微博是它的重要武器,在微博全盛期,覆盖量极大。微博现在已不如11年那般辉煌,但依然有庞大的数据量。至于新浪财经的数据,实话说一句,不代表什么。

百度百发,基于搜索的指数,数据源强大但过于碎片,数据清洗工作量大,不过能覆盖到几乎所有的行业。

蚂蚁淘金,基于流水的指数,数据源强大,而且可以横跨桌面和移动——这是前三个指数所不具备的——,数据清洗工作量相对小,但覆盖2B行业有点吃力。

作为一个证券投资者,可以购买腾安、百发和淘金的基金产品(淘金100的基金产品相信很快可以获批出炉),,亦可购买四个指数。从过去的收益率来看,似乎都还表现不错。

但要从互联网金融这个意义上讲,百发和淘金,更深入一些。

最后的一些个人脑洞大开的思考。

10年的时候,我曾经作为一个外部评委参加过一个运营商视频基地的内容采购评估。当时很多视频网站都前来应标。搜狐视频的应标者的话语给我留下了深刻的印象。他们宣称,他们知道中国最受欢迎的演艺人员都有些谁。

这是拜搜狗输入法所赐。搜狗输入法可以侦知人们经常用的词都有哪些。经常用的词,某种意义上自然代表了热度。

输入法是跨平台的,你可以在各种网站、软件、应用中使用到。而且输入法也是横跨桌面互联网和移动互联网的。搜狗输入法进入到iOS之后,更是全面覆盖到了苹果的硬件产品中。

所以,我个人觉得,下一个做基于互联网大数据的指数的,可能是搜狗,它具有一定的条件:数据源。

利益声明:作者在写作此文时,并不持有文中所涉及的任何一个基金,也未购买文中所涉及的任何一个指数。

—— 首发 上海观察 ——

说明:

1、本博客文字,除特别注明外,均为本人原创,可以自由转载,谢绝长微博形式转载;

2、转载时请注明本人大名,魏武挥,不是魏武辉,不要搞错。

3、转载时请保留此段:本文由扯氮集博主魏武挥原创撰写

4、本人不接受商业文章(俗称软文)撰写的合作,不要再询问我如何合作法。其它合作请点击本公号菜单关于里的合作需知



1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。


阅读延展

1
3
Baidu
map