舒明转身出门之后,朝林语眨了眨眼,留着门示意林语进去。林语有些迷茫地瞧了她一眼,赶紧敲了敲门,走了进去。
林语一进门,周诗亦便问:“开发环境的merge key坏了是吧?”
林语怔了怔,他这么快就知道了?
她红着脸承认:“是的。前天Q市几家新平台的数据进来,用户编号不规整。我们把新数据的首字母B去了,数据格式改成了整数,然后就直接归进了主数据库,漏了和原数据查重的步骤。”
客户的数据质量往往相当糟心。同一个用户编号,有些数据点是规整的B10,有些存成了B10.00,甚至还有奇怪的B0010。其实这三个指代的都是同一个用户——Q市红星星小学的一头十岁神兽,毛毛。
要把毛毛的数据归在一起,必须预处理用户编号。考虑到主数据库的用户编号本就都是整数,郑力便简单粗暴地去掉了字母B,然后将浮点型数据改成了整数型(把10.00、0010都变成10)。这样一来,那些B10的兄弟姐妹们,都会被转化为10这个整数。
林语主动把问题揭露出来:“但是这样处理后,新加进来的数据点和主数据库原有的数据相重了,所以merge key就坏了。完全是我们的失误。”
原先的主数据里,有另一头神兽——A市蓝星星小学的亮亮,编号10。如果毛毛的数据以“B10”为编号进入数据库,它和那几百万原有用户的数据都毫不相干。两头神兽自可相安无事。但现在这样,毛毛的编号就和亮亮重合了,他俩就被当成了同一个人。
Loading...
未加载完,尝试【刷新】or【关闭小说模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.po52.cc
(>人<;)