2021-04
13

新悟汇总

By xrspook @ 8:36:57 归类于: 烂日记

前段时间我看了几页POWER BI的教程,然后我就重新开始了之前我没有完成的事。因为我知道我肯定是要把那个东西搞定。虽然POWER BI的教程只看了几页,我已经对数据的理解有了一个确切的答案。如果可以的话,如果分析软件足够强大的话,又或者说个人电脑足够厉害,我们完全可以利用最基础的原始数据进行各种蹂躏,这样的话,颗粒度是最小的,也能够组合出最多的信息。但很多时候因为最原始的东西信息量实在太大了,有可能电脑吃不消。也有可能是别人问起来的时候还得各种加工处理,比较麻烦,所以就有了汇总数据这种东西。在汇总数据上面做汇总数据,的确能得到某些东西,但这样的话,显然就限制了想象力。因为一开始某些数据已经被汇总起来了,于是里面的某些细节再也不可能被打散。这样做不得不牺牲一些东西。可能那些东西暂时来说没什么必要,但说不准什么时候就会用到。所以可以的话,我还是比较喜欢对最初级的东西进行处理,而不是在汇总的基础上做汇总。在汇总的基础上做汇总,最终只能得出某些目标结果而不能天马行空,我觉得这样挺无聊的,但很多时候大家为了纯粹完成任务,不得不这么干。我觉得如果非得这么干的话,不如写个VBA脚本,全套自动运行没有烦恼。毕竟如果真这么干的话,做的纯粹是条件反射,循规蹈矩得出那些东西我觉得基本上不怎么需要动脑子。脑子应该用在制定程序上面而不是一次又一次重复某些步骤。在重复步骤这个能力上,人类远远比不上机器。我仅仅看了几页的POWER BI教程,已经给我明确了过去我一直都隐约觉得,但是却一直都没有总结出来的东西。现在我证实了我的直觉是正确的。

POWER BI之所以是POWER BI,因为它们可以处理Excel不能处理的东西,百万级的东西可以轻松搞定。从前那些不得不分几个Excel才能得出来的结果只要从那里导入,根本没有底线这个说法。我还记得新冠疫情某段时间英国说他们的统计数据出现的问题,有些数据被漏报了,原因是信息量超过了Excel最大的行数。这也实在太扯淡了吧!他们怎么会不用数据库呢?数据库的底线好像我还没听说过。如果Excel有底线的话,完全可以把数据分在几个Excel文件里,然后通过POWER BI把数据联合起来。所以他们给出那种完全不能让人接受的答案的时候,我在那里呵呵。那种数据级别居然还在用Excel,而没有没有专业的数据库去处理,这实在太让人震惊了,是因为他们只习惯于用Excel吗?大概是因为改数据的时候比较方便吧。毕竟进入数据库进入服务器的东西是会留痕的,但Excel可以随心所欲颠倒黑白,想怎么写就怎么写。

我不知道现在的世界到底有多么的水深火热,反正今年的股市就一直都很不咋地,我的基金被套住了,一开始只套一点,现在越套越多了,于是我也懒得去看到底是怎样。与其把人生耗费在钱生钱上面,不如干一些实实在在的东西。

2020-09
13

别人常踩的坑

By xrspook @ 20:09:06 归类于: 烂日记

怎么才可以让自己遇到更多的问题呢?我选择的是猫在某个论坛里,解决别人提出的问题。我仅仅猫了几天,就得出了某些结论。比如通常逼着大家提问的原因在哪里,针对那些东西,我应该如何在表格里避免。某些东西,我们一定会遇到,即便暂时没有,所以在那之前先掌握技能很有必要。如果等到像他们提问题那样才去被动去学习,就比较烦恼了。

第一个让他们在用数据透视表的时候得不出应有的结果的原因是他们的原始数据格式有问题。数据汇总时碰的壁绝大多数都是原始数据记录时挖的坑。最经典的坑莫过于合并单元格。所以,当我看到某个同事给我的表每一个数据框都至少合并了两行两列单元格的时候。我立马拍桌子发飙了,这是处理数据吗?!如果你嫌那个单元格宽度和高度不够,完全可以对单元格进行调整啊,为什么要合并?之所以做出这种低能的单元格合并,唯一的理由就是,她根本不知道那些东西的宽度和高度是可以调整的。对她来说,Excel的表格就像十字绣一样的固定洞洞,就像Photoshop里的网格线。但实际上,根本不这样。面对这种人,我是完全无语的,因为她完全不了解她正在使用的那个软件。这些人应该从头去开始学习Excel,从最基础的学起。只有让她明白Excel是做什么的,可以怎么用它,她才不会犯这种超级低级的错误。这种空前弱智的单元格合并通常不会发生,更加不会在某个表的任何一个数据框里面发生。某些人会把平时手工汇总的表格拿出来求做成数据透视。准确来说,那是一个明细表和汇总表的混血儿,在实际工作中我们经常会碰到。从展示表的角度考虑,这非常正常,尤其当数据完全由人手工填写的年代。但这不是Excel处理数据的习惯,明细是一回事,汇总是另外一回事。当某个大项里有N个分项,大家非常习惯,把大项横跨的几行合并为一个单元格,然后分项的总和也合并为一个总数。这是人的处理习惯,但Excel的处理习惯是大项为一行,分项为余下的行。当你不想看明细的时候,直接把它收起来。之所以会出现这种人的思维和机器思维不一致的东西,完全是因为大家没有读Excel,而只是把我们人肉做的事要Excel去模仿。这绝对是搞死人的!处理这种事,只能把大项的单元格合并取消,向下填充同一个名字,最后的汇总数据,全部打散为小项的数据。如果一个明细表里有很多这种情况,又有很多类似的明细表需要合并,那可是清晰数据整死人的节奏。

另外一些数据透视表的问题发生在多表合并的时候,有时可能还得对表格的汇总数据进行一些运算。通常,这需要用SQL查询,但我觉得在Excel里用SQL有点麻烦。那个东西不适用于文件移动,一旦文件发生移动。数据将来难以刷新,因为实际上进行了SQL查询以后,电脑的某个位置会形成一个数据库。当你移动文件到别的电脑,引用的原文件仍然只是旧的那个。通过在文件里加个VBA,能解决更换数据源的问题,但要这么复杂才能做到,证明了SQL在Excel里实际是有点水土不服的。这种玩法根本不适合分享文件。SQL语法虽然很简单,但是标点符号的错误,哪怕是多了一个空格,也会出状况。在没有语法检查的编辑器里写那些句子,简直就是撞墙。新版本的Excel里内置了Power Query和Power Pivot,如果用的好的话,SQL基本可以丢一边了。我感觉应该可以这样,虽然我对这两个Power工具还非常陌生。我觉得,也正是因为Excel里面用SQL不太顺,最终才会让这两个Power成为新版Excel的标配。

把别人的烦恼当作是自己的烦恼,是一个让自己进步的方式。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress