Wind,估计我已经戒不掉了!

发布于: 雪球转发:9回复:20喜欢:44

@黑毛星星 问我关于数据库,我把2018年的一篇老文章翻出,大家随便看看


(一)数据中心:

在北京的上地有一个路透的数据中小据说有五六百人,数据中心这个名字多么高大上。这个数据中小招聘了很多日语、韩语、英语专业的大学毕业生,他们的工作就是将日本、韩国、澳大利亚上市公司财报中的数据录入到他们的数据库中。在起初,这个录入工作是纯手工的,例如要从财报中找到企业收入、企业盈利(税前、税后),后面变成人工校对了。这个工作看起来不怎么专业,但是如果你没有财务与外语方面的能力估计难以胜任。

(二)数据分析:


但凡干过数据分析这个活的人都知道,看似看做数据分析其实90%的时间都花在处理异常数据了,因为某些财务数据在录入的时候,被数据中心的人一不小心漏打了一个小数点,导致企业一年的盈利比市值还大,这些异常的数据导致分析结果严重失真。

笔者在2008年开始研究分级基金,也算是国内最早研究分级基金的人吧。起初Wind数据根本没有什么A类份额、B类份额、母基金份额、还有分级基金规模的合并计算什么的,因为一个分级基金的规模包含A份额、B份额

、母基金份额,问题A、B份额是场内的、母基金份额是场外的,但是最初Wind数据库都不分这个。

在2008年9-12月这个三个月中,几乎每天都会给Wind客服妹妹打电话说:你们哪个数据有错误,妹妹被我问烦了就把我介绍给程序员小哥哥,继续每天电话,自此之后Wind的才有了分级专属数据库表。

此外,如果你使用过Wind的数据库,你就知道人家表都是用数字命名的,需要一个表名与表内容的对照表才能Select出你所需要的数据库。在那个时代,Wind的专业客服还可以帮你写Select代码,你跟他说你想要什么数据,他之后一定会问题你:

你的数据库是Microsoft SQL Service的还是Oracle?

这个还用问吗,当然是便宜的那个!! 否则还是MySQL吗?

无论如何Wind是你可选数据库(除了蓬勃与路透,因为他们更贵,而且没有中文版)中最优秀的,如果那个时候有人给我推荐聚源,我一定有想干死他的心!

因为处理异常数据的时间要乘以N,之前三个月的电话要再来一边,问题电话那边的程序员更笨!


(三)数据质量是什么决定的?


如果谁给你说数据质量是技术决定的,那他一定没有做过数据分析,这个结论也是主观臆断的结果。

现在我告诉你数据质量取决于使用这个数据的用户人数。并不是投资几个亿就能搞一个好的数据的。尤其在金融数据这个行业,全球也就两个企业蓬勃与路透,路透卖点之一就是他们成立的比蓬勃早历史数据更长,仅此而已。

Wind数据的用户群体是其他金融数据的几倍,更进步说最优质的金融客户都使用的Wind,而且他们对于金融数据质量要求越高,给Wind的debug的次数也是最多的。换句话说,在过去十年有几万金融从业者给Wind的数据纠错,但是这个纠错过程,我们都不想再重来一边。

Wind又涨价了,可是我已经戒不掉了!因为对我而言,现在时间更宝贵!

@今日话题 @蛋卷基金

精彩讨论

全部讨论

2021-04-22 07:34

数据大神,膜拜下

2020-04-05 23:12

布隆伯格笑而不语

2021-04-22 14:17

最后一句话说到点子上了“在过去十年有几万金融从业者给Wind的数据纠错,但是这个纠错过程,我们都不想再重来一边”,同类竞品想要抢占wind市场,除了价格方面,数据质量也要提高啊

2021-04-22 14:11

每天都在用Wind的小香路过,万得确实好用

2021-04-22 08:34

每天看楼主的估值表,我省了万德税

2021-04-22 07:46

同花顺IFIND用户飘过

2021-04-21 22:48

每一个传统企业都有自己的积累优势。但是,这个企业会因为自己的优势永远存活吗?逻辑上不可能。那wind将来可能会死于什么因素呢?

2021-04-21 21:49

老文章.. 关于问数据库的可以看看

2020-04-05 23:25

万得税,不得不交。

2020-04-05 22:22

【数据质量是什么决定的?】
是使用数据的人数