2021-11
25

数据表达

By xrspook @ 9:14:41 归类于: 烂日记

我觉得自己对数据和图表有一种痴狂,但我又不是那种很文艺的人,所以我希望图表是漂亮的,但我不会花很多精力去把图表搞得很花俏,哪怕那看上去会更漂亮。我是一个实用型的人,所以当我看到人家用一大段文字来描述数据的时候我会很自然翻一个白眼,显然那些东西最佳的表达方式是图表,哪怕你不能用图,用表也是很直观的,没有必要用一大段话把明明一目了然的东西搞得很复杂,而且一旦这样做,别人核对起来也非常麻烦,所以是什么样的脑洞才搞不出那样的东西呢?到底那么逆天的模板是谁创造出来的呢?真想把那个人揪出来打一顿,可能一顿还不解恨,要打几顿才能解决问题。创造那种表达方式的人已经够狠了,这样反人类的表达方式居然会被当作模板,一次又一次使用,那些使用的人为什么就不抗议呢?创造者的脑洞很奇葩,追随者根本就没有用大脑,没有用大脑的结果就是在套用的过程中根本不理解作者的意图,然后各种各样的错误就出现了。

数据的表达应该很舒服美观,当你把那些处理得当以后一切都是那么的舒服,但是用一种不恰当的方式强行表达,那不仅仅是影响美观,而且会让人觉得处处卡顿,有时甚至是看半天都不知道那到底是干嘛的,因为没有逻辑性可言,所以一些笔误的东西会层出不穷。最经典的笔误就是把数字倒过来写,比如15写成51。从输入者的角度考虑,这样的笔误很正常,但是从数据本身考虑,这根本是无法容忍的错误,因为一大堆数字的排列方式毫无逻辑性可言,所以出现了这些很明显的笔误,在核对的时候非常难找出原因,因为那不是重复计算或者缺少数字那么简单。核对汇总数的时候,你怎么都想不到那差值是怎么来的,唯有一个一个人肉对明细,最后发现原来是如此低级的错误。可以汇总的数据还可以快速对比出有差别,但是一些时间的数据,而且就只有一个时间的数据发生这种错误简直就在考验你的RP好不好,有没有那么好的运气能找出这样的毛病?

刚刚参加工作的时候,不知道为什么就被叫去做统计。有一次去找领导签名,那是一个很常规的报表签名,他突然问我某些数据,那时毫无准备的我根本回答不上来,然后他就来了一句,你对数字不敏感,不太适合做这个。做这个不是我主动选择,是你们安排的,如果你觉得我对数字不敏感,你完全可以找一个敏感的人去做。现在回想起来,即便突然有一天领导问我同样的问题,我依然会回答不上来。因为我的脑子就不是用来装那种数据的。我不能马上脱口回答那个问题,但是我却可以最快的速度反馈出最精准的答案,我的习惯是把数据抓在手里,而不是一直存放在脑子里。这些年下来,事实证明在这个单位我是干这个的最佳人选。如果是几年前。这个最佳人选是毋庸置疑的,而现在估计我得加上之一这两个字,但是如果综合考虑对全面性的把控,我依然是那个最佳的人选,没有之一。

正是因为我干的就是这个,所以当我看到别人在瞎整的时候,我会条件反射一脸嫌弃。

2020-03
6

找自己麻烦

By xrspook @ 9:51:44 归类于: 烂日记

本来打算只搞30分钟的东西,结果我搞了三个小时都不止。想想都觉得很疯狂,于是整个晚上就变成了加班。上班下班对我来说没有非常明确的界限。我确信我正在做的事情是工作的一部分,但是从来都没有人强迫要求我必须这么干。跟我去纠结电动牙刷的电池一样,我完全是出于我想知道,所以我去纠结。

没人在乎那一公斤的东西该如何分配,折腾了我一个晚上,但不是这一公斤我算错了,而是貌似我把有多少件物体加起来一公斤的物体的件数给搞混了。总件数没有问题,但细分下去就有毛病。之所以会发生这种事,是因为当时我制定那个校验规则的时候完全没有考虑过件数。数量是可以核对的,但是件数不行,纯粹靠我自己去把握。为什么总数没问题而分类会出现误差,这个问题我折腾了三个多小时,虽然没搞清楚,但可以明确的是,因为我在分类里又细分了太多东西。我不可以一步到位进行计算,我要经常进行各种排除。一共有4个大类件数,其中三个跟我之前的对不上。我个人觉得,这样实在太糟糕了,虽然每个分项之间只差一点点而已。为什么之前会搞错呢?怎么会搞错的呢?之前我到底是用什么方式把那个组合出来的呢?现在要搞清楚当时的思路实在太难了,因为那是一年多以前整的,我当时到底用了什么操作呢?现在我已经完全不记得了。因为是在晚上核对,而且连续干了三个多小时都未果,所以我确定继续下去我的脑子不会好使,与其继续纠结,不如回去睡觉。或许今天早上突然之间我就有灵感了,比如说前天我在改进明细数据的结构,根据某些报表的习惯,我把某些东西拼在一起,但后来经过深思熟虑以后觉得那是不可行的,因为某些数据按照某些规则,几乎可以这么说,可以无限拆分,但另外一些,我暂时觉得是没有拆分必要的,而且其拆分方式跟之前的那些不一样。之前的那些数据不进行变态拆分的时候,这两种数据是可以放在一起的,但是当前面的玩起了无限拆分,要把前面和后面的数据放在一张表里作为汇总表的明细数据显然不可行。昨天早上起床后上厕所的时候,我突然意识到这个问题,于是一上班我就开始着手把我前天硬是拼在一起的东西分开,把可以无限拆分的继续拆分。拆分出来的两种数据,我都可以轻易的通过我手头上的资料快速地把它们变形出来,而不需要像前天那样全部都人肉处理。

想得越多,写的分析越多,越会感觉到自己的基础数据不够仔细分类不够合理。从前觉得很靠谱的分类方式现在看来挺傻听天真。当时的目标导向性很强,但是可塑性不高,没办法把那些数据作进一步组合利用。这些年来跟数据打交道,让我明白到,只有把最基础的东西分类好,后面才可以玩得转。

数据处理和分析是一个持续改进的过程。

2020-01
3

碰撞中改进

By xrspook @ 10:29:43 归类于: 烂日记

有一句类似这样的话“数据汇总时流的汗就是数据录入时脑子里进的水”。跟别人对数这种事,通常来说都不会太顺利,反而我喜欢跟系统对数。因为系统都是按照一定的逻辑整出来的,而我也有我的逻辑,两个东西碰撞,很容易找出差异。但跟人对数就很不一样,尤其是跟不同的人对数,那就更加麻烦,不同的人有不同的手法。不同的汇总方法最终会让你无比纠结,有些数据没有算进去,有些数据直接漏掉了,还有些数据完全是手误。没有算进去的那些可能是故意为之,漏掉的那些有可能是一顿懒惰之后完全不知道还得有那个操作,还有那些手误简直就是一个未知的谜,你根本说不清到底会以什么形式出现。有可能多打一个数字,也有可能是数字颠倒,当你找出那个手误输入以后,你会马上明白到那是怎么一回事,但是要找出那个东西,又谈何容易。

为了保证我汇总的数据不会发生这些问题,所以除了明细数据我需要每天纠结以外,整体的数据我也必须每天核对。有些数据是没办法每天核对的,即便你每天都做明细。因为有些东西必须合并起来才有真正的意义,比如要算清楚每条船的数量,而那条船又卸了好多天。如何解决问这个问题,从前我也死过不少脑细胞。后来我创出了某个方法,但是还是会有点麻烦,最后我只能得出明细的数据做给一个表,汇总的数据做另外一个,然后定期核对,这样能稍微解决问题,而这一招是我昨天和别人核对过数据以后才最终决定的。

我不明白他们为什么要以那种方式汇总。做一个明细表格,掉头还加一行完全无所谓的标题,我个人觉得那是毫无意义的,毕竟那个表不是某个报表,需要打印出来。其次,单元格的合并也是多余。第三,入库跟出库分作两列,看上去没什么问题,但是如果我要一个汇总数呢?明明在其他类别里面已经说明白了,那是出的还是入的,是车的还是船的,也就没必要把数据分作多列,毕竟这不是要算一个库存数。只有出入库数量而没有初始库存以及损溢倒仓转入转出之类的东西,根本没办法算库存。数据分作两列,要做数据透视表还得费劲2合为1。高端一点的做法或许是将二维变成一维,低端一点的做法是直接加一列,把那两列的数据加起来,因为按照那个设计表格的人的思路。入库和出库的数据只填其中一格,所以只要加和两个单元格,最终得到的就是出库或者入库的数据。再来一个万能的数据透视表,需要汇总的数据就能轻易地分类开来。有一定的规律以后,自然可以和其它数据透视表汇总出来的数据做核对。但即便我这么干了,还是很难分得清某些特殊情况。比如某一条船来了很多次,每一次又花了好多天才完成。有些时候是一周来一次,但有些时候一周来两次。当你很久都不汇总一次数据,你怎么知道今天这条船的数据跟后天的要不要加和在一起呢?如果你每天都干,你肯定会知道这是一条船,只是中间有一天天气不好不能作业,但是今天和后天的数据加起来才是一轮操作。这种东西理论上逻辑很简单,但显然,我们那些破系统没有考虑到这种情况,所以得人肉关照。

软件是人设计出来的,但如果人没想到该用什么逻辑去处理的话,软件不可能超越人,让使用者觉得得心应手。

2017-09
25

人算不如天算

By xrspook @ 14:31:49 归类于: 烂日记

能昨天晚上搞定的数据,我已经尽量昨天晚上搞了。但是今天早上需要耗费的时间还是很多。这是因为,那些东西的条数实在太多了,而且是分布在几个完全不能合并的项目里。如果49条记录都只是一个仓里的话,很快就搞定了,但是,如果这些都分布在十个仓里面,那么我就会相当被动。这就等于所有东西都不能被汇总,只能分类计算。幸好现在数据透视表的基本功能我已经有点掌握,有了那个东西,就可以用拖拉鼠标轻易地变动出统计数据。否则的话我会死得更惨。但其实现在回想起来,让我痛苦的并不是汇总数据的过程,是原始数据的收集。本来原始数据对我来说就只需要在一个地方导出,但是现在需要在两个地方导出,原来那个地方导出的数据,我可以非常信任,但新的那个地方导出的数据,到底可信程度如何,能不能尽信还很难说。因为原来的那种导出数据完全是程序操作,自动录入自动输出,但新的那个原始数据是人从一个原始数据里汇总得出一个数然后再手动输入的。这样就相当被动,而且非常容易出错。如果一天只有那么一条数据,出错的概率还相对较低,但是,如果一天有超过十条都是这样的,就很麻烦了。前两天就发生过这么一件事,给我报数的人,漏报了一个仓的数据。其它仓的数据都没有错,但是,他在报的时候,彻底的地掉了那一个仓。之所以会这样出现这种漏洞,大概是因为他给我报数的时候没有核对总数。如果他数一下汇总的条目,就不会出错,或者他把汇总的数量,累加一下,也会发现有问题。这也是为什么我一直都推荐他们用自动的汇总。至于那个报送的模式,没必要一个一个数字敲键盘写出来,你可以给我来个截图。如果我把截图的数板字过纸错了,是我的问题,但起码,你报出数据的时候不会有错漏。其实这些流程的问题在经过一两天以后应该就可以上手,可以优化,但问题是过去的一个月,所有人都疲于奔命地完成每一天的工作。对他们来说根本来不及思考怎么才会能得更好。作为一个旁观者,我觉得越是这样他们越容易犯错。我自己是那种非常容易会把两个数字倒过来写的人,结果五个数字可能都是正确的那些,但是其中的有些顺序变了。要把这个检查出来不容易,所以我的解决办法是把所有数据都拿来加一下,如果结果等于正确的那个,基本可以证明我没有抄写错误。因为抄错一个人数的概率很高,但是多个都同时抄错的概率很低,而且抄错的还刚好互补那更加是微乎其微的可能性。即便工作的数量越来越多,我觉得也应该让人感觉工作越来越轻松,因为人是有主观能动性的,我们会改变我们这策略,利用不同的方式优化流程。如果任何操作都没办法改变这个事实的话,估计大概就是要彻底重新改造整个流程的时候到了。

今天Secret Superstar的第四首歌估计就要放出。我觉得最早会在下午,也可能会在晚上。这首歌将在发布会上发布的,所以发布会什么时候开就决定了什么时候能拿到这个资源。再过四周这部电影就要上映了。我个人感觉之前放出的预告片也好,歌曲也好,暂时还没有那种让人欲罢不能非常想看的号召力。

月底了,我莫名地感到有鸭梨。

2017-07
28

终于上路了

By xrspook @ 11:44:43 归类于: 烂日记

今天是我第三天报数,在理清思路以后,我只用了不到十分钟的时间就把基础的数据给梳理好了,余下来的事就只是核对数据跟实际单据是不是一致。如果可以的话,就可以用那些数据进行整理。基础数据这一块,第一天我就已经理得相当快,而现在已经到了第三天,自然是更加顺手。因为那些东西基本上现在已经不是人工去计算,一个数据透视表,选定区域,把4到5个,字段项拉进去,结果就出来了,为了好看一点,可能还得设置一下数据的显示格式。而之所以可以做到这样,我觉得最大的功劳是我的显示器换了。显示器是23寸宽屏的,所以在横向方面能显示更多。以前我一直都用17寸方屏,所以Excel的工具栏就只能显示那么点东西,因为我不想把工具栏分两行显示。但现在显示器换了,我直接把数据透视表也拉到工具栏里也一样毫无压力。工具栏决定了工作的速度,虽然其实数据透视表工具栏这种东西最终用到的可能只是那个刷新数据的叹号。其它操作基本上我都是通过右键来完成的了。重新设置数据透视表的源数据范围必须得用数据透视表的导向回去。

第一天我把数据导出以后还先删掉以前那些,表头表尾之类的东西。从昨天开始我觉得已经完全没有必要去理会那些东西,所以直接让它留在那里就可以。需要数据的时候,直接用数据透视表,选择源数据范围,然后几下拖拉就能出所有的汇总。这种操作绝对不会出现数据错误,除非我选择的源数据范围错了。数据透视表肯定不会出错,唯一出错的也就只能是我把数据透视表的数据抄在本子上,在抄的过程中抄错了。但这种事情是可以避免的,比如说,我把分类合计都全部加一下,得出这总数和系统一致,基本上抄错的概率就会大大降低。电脑上的数据处理是第一步,抄写是第二步,拿到原始单据以后,跟本子上的数据校对是第三步,这样下来其实就是完成了一个核对纸质单据和电脑数据的过程。我觉得把数据抄下来的这个过程不能省掉。虽然有点繁琐,但实际上在日积月累的过程之中,本子就会体现它的作用,毕竟,查具体的内容翻本子比翻电脑的数据要快。而且有些时候,在电脑的文件里写出某些说明可能如果你没翻到那个文件就没办法找得到,但是本子上的东西显然如果用其它颜色的笔标注出来就会好找很多。没有人要求我一定必须得这么干,但是我觉得这么干会保证我的工作更加顺利,不会出错。把握好原始数据是所有上层建筑的基础。如果原始数据都是乱七八糟的,上面的整理一律都是扯淡,完全是站不住脚的。比如某一天报送的数量本来是61,却变成了95,之所以会发生这种事,完全是因为报送的时候根本就没有去核对纸质单据,如果核对了就会发现,根本没有那么多车,之所以会发生这种事,是因为数据导出的时候筛选的日期错了,95包括了两天的数据。这种错误是低级到完全不能容忍的。虽然只要一查绝对能查的出来,但这种错误是完全可以避免的,只要把工作都做到位就可以了。

统计这个工作,我觉得主要分两方面,一个是你必须有高度的责任感,你必须所有步骤都按照流程去走,因为流程是保证,你不会其中错漏出岔子。在所有的基础都已经扎实到位之后,就应该开始大开脑洞去创新。用不同的方法和视角去理解预测数据。后一条是比较高层次的要求。如果某些人连最基础的都很浮夸,你怎么能奢望他能做到第二步呢?!人的懒到一定程度,也就算了,但真不要太过分。

工作越做越轻松就对了。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress