2022-10
11

填充单价

By xrspook @ 9:49:59 归类于: 烂日记

工作出现了些许空余的时光,于是我赶紧继续开始看我的《DAX权威指南》。筛选上下文、行上下文这种东西实在让人非常抓狂。有些时候我是完全理解那种关系到底是什么,但实际上当用起来的时候又好像各处碰钉子。

一步步的学习DAX这没有任何问题,但学着学着自然而然我就会往自己的问题上面靠,于是心就飞走了,然后虽然已经学了100多页,但是感觉我还是找不到思路。我不知道如何在Power Pivot里面把两个日期扩充为一个日期列表。于是我就折腾了一番,这个在Power Query里实现我100%肯定是轻而易举就能做到的。以前我好像做过。支持我使用的方法是修改人家的高级例子,从前只是一步一步按部就班来。以日期扩充之后的表为基础查询模型里的计算库存不是不可以,但是翻来覆去非常耗时间。从前在PQ里计算库存,在情况不那么复杂的情况下弯曲折叠各种填充已经很耗费人力物力,而这种库存的计算实际上在DAX里面是秒杀完成的。这也就是为什么当年我放弃了继续走PQ这条路计算库存以及库存费用。在PP里,计算库存其实我早就已经搞出来了,虽然实际上那个筛选条件我至今都没搞懂。现在的问题是那个阶梯费用表达把我难住了。从简单的几个时间区间生成一堆连续日期单价对PQ来说实在太简单了,但为什么这种事情用DAX去表达却那么的难呢?所以实际上我觉得这个问题跟库存的计算一样,我还没想到那个方法该如何表达,也就是说理论上要做到这个也是很容易的。

如果我的单价用PQ实现,我的库存用PP去实现,最终我只需要很笨地把两边的数复制一下,然后在另外一个地方做一个很弱智的合并,显然这样也能曲线救国,以我现在的知识储备可以这般做到,但显然这不是我想要的效果。这个问题在近期我又开始纠结之前,已经困扰了我一年有多。

虽然不知道最后的那个灵感什么时候才会到来?但我知道那一定会到的。

就在这篇东西口述出来后,那个晚上我什么都没干,没有运动,也没做其它别的,一心就扑在PP里实现单价这个问题上。接近晚上10点,这个问题好像终于有了破解的苗头。用的是LASTNONBLANK函数,网上教程用的是LASTNONBLANKVALUE,但PP里没有这个东西,为什么呢?Power BI里面有但Excel里没有???

LASTNONBLANK ( <列名>, <表达式> ):为表的每行计值表达式,返回结果不为空的最后一个列值。

LASTNONBLANKVALUE ( <列名>, <表达式> ):为表的每行计值表达式,返回结果不为空的最后一个列值所对应的表达式的值。虽然被归为迭代函数,但与 LASTNONBLANK 不同的是,LASTNONBLANKVALUE 的<表达式>参数在筛选上下文中计值,这是由于存在一个隐式的 CALCULATE 将行上下文进行了转换。

https://www.powerbigeek.com/dax-functions-lastnonblank/?f=1
https://www.powerbigeek.com/dax-functions-lastnonblankvalue/?f=1

以我现在的水平我是搞不懂他俩到底什么情况,但Excel里没有我也没办法,把LASTNONBLANKVALUE的东西转化为适用于LASTNONBLANK,这又折腾了好些时间。其实这个东西说白了就是为了向下填充,如果这个地方空白,就用这一列对上一个有数的那个东西向下填充。当然,其实这个东西一开始的意图不是填充,是为了找到最后一条记录,这种东西要准确,通常默认跟时间关联。

虽然道路是曲折的,但我总算在单价这个问题上发现了我觉得应该很简单的实现方式。

2022-09
30

Power Pivot上瘾

By xrspook @ 8:52:56 归类于: 烂日记

对上一次晚上10点之前单位就结束所有业务,晚上11点之前我已经完成了所有事已经不知道是多久以前的事了。晚上11的时候我一个人坐在宿舍在书桌前,关了空调,开着风扇,一边等头发干,一边在看Power系列的书。通常在那个时候我都不会看技术类的书,因为非常有可能越看越精神,然后我就睡不着了。绝大多数情况下,在那个场合,我会看小说,但不知道为什么,前天晚上我选择了拿下一本已经被我放在书架上冷落好久的Power纸质书。那本书里面主要是说Excel里面的Power Query和Power Pivot。一本书要讲好这两个强大的东西,尤其是Power Query,显然不可能讲得那么透彻,但实际上我只是想看PP。办公室我正在看的那本叫《DAX权威指南》,那本书跟我放在宿舍里那本薄薄的2合1来说高端太多了,但是权威指南准确来说是一本翻译的书,我觉得原书的作者以及翻译的人都很用心,所以看上去并没有感觉太别扭,但因为里面所引用的事例全部都是英文的。示例里面用的是英文,但实际上翻译的时候有些地方用英文,有些地方用中文,虽然都很简单,翻来覆去都那几个单词,但是你还是得有一些反应时间,但是宿舍的那本书,完全是中国人写的,里面以一问一答的方式开展教学。一方面我觉得这挺弱智的,另一方面我觉得因为他们的软件以及他们的示例都是基于中文,这样的话我就可以快速阅读很多东西,因为这不是一本翻译的书,所以在某些表述上我会觉得比较正常。如果某一天我也要去教学,我也会用一些比较通俗的话来解释那些比较深奥的东西,但我又明白那些看上去很深奥的东西,实际上是术语,所以正规翻译得那样,但有些时候只要把问题讲清楚,让不懂的人搞懂就可以了。机器有机器的语言,但要把某些东西教会别人,还是得说人话。最高境界当然是用通俗的语言把机器的思路讲清楚讲明白,但显然这不是一件容易的事。

还有一件很尴尬的事,就是《DAX权威指南》非常牛逼,书本配套了大量素材,但问题是学习的时候我应该用什么软件呢?我应该怎么使用那些素材呢?如果是Excel教程,他们会告诉你这本书是基于什么版本的Excel,然后你找那个版本就好了,但是这个东西你可以在Excel的PP里运行,当然了,只有某些版本的Excel才自带这个东西,有些即便自带了,却有一些模棱两可的感觉,好像部分翻译了,但是又翻译得不太到位。在我印象之中,家庭学生版的Office2016有PQ,但是界面有些是中文,有些是英文,后来不知道从什么渠道我才知道理论上Office2016的家庭学生版是没有power系列的。后来当我用上了Office365就再也没有遇到过中英文对半这个情况,而且好像相对而言PQ的启动速度会更快。

Power系列的工具原生在Power BI里出现,但是除了Power BI,其实Excel里某些东西也都能用,我用的是Microsoft365,但PQ很正常,但PP会出现卡顿,当你要调试某个东西的时候,总感觉那不是一个靠谱的窗口。当高手们要在Excel里面使用PP,估计都会装个DAX studio。studio装上后写代码爽快多了,但问题测试度量值要看报表效果,根本没办法在studio里做,所以还是得把studio的代码贴到Excel里。这样显然就很不科学。PQ里有高级编辑器,你在里面敲代码就行了,既然PP也需要这种东西,为啥我就不能在某个地方敲代码呢?如果它内置了一片可以用来敲代码的编辑器的话,我也就不需要跳到studio里实现了。《DAX权威指南》可能是基于Power BI的,但实际上没有明确指定学习这套东西你得用某个软件。光看不练会让人很迷茫,感觉自己看懂了,但实际上用的时候一团糟。

一旦上瘾了,我就完全停不下来了。办公室看,宿舍看,家里也看,幸好从前买的书够多,可以到处放一本。

2022-08
4

一个人干

By xrspook @ 20:23:38 归类于: 烂日记

当我只有一个人干活的时候。我感觉事情做不完,随着年龄的增长,我感觉自己越来越容易忘记即将要做些什么。那个突然间就忘记的状态好像叫做开窗效应,通常会发生在切换场景的时候。比如说当你正打算去做某件事,但是这个时候你开了个窗又或者开了个门,突然之间你就忘记了你要做什么。以前我觉得自己没这么神经,但是现在我觉得这种事情对我来说越来越普遍了,可能根本不需要开窗或者开门,哪怕只是多走了两步路,只要我的心思不在上面,我立马就能忘记刚才刚才想做的是什么东西。

回到一开始的话题,一个人干活的时候,我只能一根筋,只做一件事,否则正如前面所说的开窗效应。正在做件事,突然转到另外一件,我就会老是所有东西都半天掉,没有一件做得完。因为所有事情都一个人做,虽然不难,但是却很多很烦,而且事情很多都是那种不是一次性都能做完的,有时候可能做到一半就卡在那里,无法继续。有些卡壳是可以预知的,但是有些则完全在意料之外。在这种情况之下,我就是一个六亲不认的机器,我只能一直都想着那件东西,我才可以把自己的事情干完。如果突然间接了个电话,又或者非要去开个会,我就会感觉有压力,我放不下工作,然后莫名其妙焦虑就来了。

最焦虑的事情我觉得是在我数磅单的时候,突然有人找我。如果那是可以拖一拖的,我会让他等一下,但是如果那是一个电话,我一点办法都没有。如果我正在电脑输入还好一点,那个还能暂停,保存就好,但如果我正在用计算器,那就意味着之前我打过的所有单据全部都得重来。全部工作都我一个人干,全部单去都得我一个人核的时候,我没有任何回旋的余地,因为我不是那种有脸皮叫别人帮我核数的人。我知道自己的粗心大意会经常性习惯出现。尤其当我反复的做这一件事的时候,更加容易暴露出来。为了避免这个发生,我只能用尽一切方法避免自己分神,同时上一些技术手段让自己少犯错误。根据多年的经验,我的粗心大意绝大多数时候都是因为图快,比如小学的时候经常计算错误,是因为数学老师以竞赛的方式让我们计算,为了图快,我的字写得很潦草,于是写着写着我自己都搞不清自己到底写了什么数字了。搞不清就大概差不多继续算下去,那这样的结果当然是没有结果。平时训练的时候潦草,到不赶时间测验考试的时候当然也改不了这种习惯。在重新做回统计之前,我的计算器都是用一个手指按的,但不知道从什么时候开始,我习惯那多根手指在上面飞舞。如果我还没有分神还好一点,飞舞的手指就能得出飞快的结果,但问题是如果我不在状态,飞快的手指就意味着出错。我也不知道为什么出错就错了,因为我自己都没看清。几乎可以这么说,当我手指飞舞的时候,我一定在盲打,而且这种盲打还不仅仅是眼睛不看数字键,而且是眼睛不看计算器的显示屏,眼睛就只盯住单据本身。这种盲打的确很炫酷,但是却要付出错误的代价。我打得很快,但是要打很多次,与其这样不如让速度降下来。一次偶然的机会,我发现了Excel的单元格朗读功能。这样就等于是有了一个会发声的计算器。发声的计算器用外放喇叭,会骚扰别人,但用蓝牙连接耳机以后 Excel就可以静悄悄地报数,让我把活干好。用朗读的方式核对录入数据,尤其是录入大批量短数据的时候非常有效。以前如果数据出错,我就得全部重来。作死了一遍又一遍以后,我发现可以用对半式的方法找出问题所在。先看一半的累计数,然后在有问题的里面再对半。这种思路是在我做python习题的时候掌握回来的。在python中,在不运用字典的前提下,这种对半搜索效率很高。

粗心大意是不能避免的,起码对我来说是这样,但是我却可以通过主观手段有效地降低粗心大意的概率。

2021-12
17

VBA合并报表

By xrspook @ 8:47:14 归类于: 烂日记

我花了三天时间(但实际上每天都只有半天时间)把二维报表提取数据成以一维数据表。这有什么难度呢?一开始我也认为好像难度不是很大,但开始琢磨以后我发现事情远远没有我想象中的那么简单。我用的是Excel的VBA。如果操作简单的话可以在Excel的数据层面进行操作,但如果我要进行大量的数据清洗显然为了要追求效率,就必定要用到数组,数组这种东西无非就是不断地叠加循环以及判断。循环和判断我觉得几乎可以这么说,是编程的核心。要实现最终的目标,首先你得有一个非常清晰的逻辑,然后用那些循环和判断实现你的逻辑。当我看到某些人逻辑彻底混乱的时候,我心里就会冒出一句话,他们绝对不会懂得编程。也正是因为这样,所以现在的幼儿教育有时会把编程列为一个非常重要的项目,实际上练习编程就是锻炼逻辑,但是逻辑这种东西又分为了既定的规则以及你的自创招式。自创招式都来源于各种规则,但是不同的编摆方式会有不同的效果。成功编程的话效率极高,是秒杀型的,但是要制造那个秒杀效果的过程可能非常漫长。

我需要处理的那个报表,准确来说是一套报表,但是用的几乎都是一个版式。虽然看上去几乎一样,但是有可能某些细节上会有不同。如果我用了一个靠谱的逻辑去抓取数据,无论什么微调,对我来说都毫无影响。所以首先我要确定我要在报表里抓取什么东西,我要用什么方式去除掉那些我不需要的东西。如果用Excel表格的思路去理解的话,我肯定是先做一个筛选,然后把我不要的删除掉。如果不要的东西在行那里我还可以用关键词筛选掉,但如果那些东西出现在列那里,难道我要先做一个转制,然后再做删除吗?更郁闷的是那个表格的表头有三行。就一个现成的要达到最终效果的报表而言,三行的表头没有任何问题,但是如果你要把它按照数据层面去理解,这就很逆天。就更加不用说这三行的表头里面还有不少合并单元格,但幸好的是当我把单元格拆分了以后,实际上每个单元格里其实都有靠谱数据的。

我的思路是先把我不要的行删除掉,然后把我不要的列再删除掉。在删除行这个问题上一步我就搞定了,但在删除列这个问题上,我花了好几步,首先是删除没有数据的列,其次是删除含有某些关键词的列,也就是那些虽然有数据,但对我来说也没什么作用的列。把可以删除的东西都删除掉以后,我进行了一个二维表转化为一维表的操作,接下来就是在那个加工完的表里加一列存放表名。之前我说过我要处理的是一组样式差不多的表格。上面说的一大通,我只是说针对一个表我需要这么处理,所以在这之前我要有一个把文件夹里所有工作簿里面包含某些关键词的工作表汇总到一个工作簿里的步骤。我觉得这个合并工作表的耗时挺长,相对于后面的数组操作来说,这实在太费时了。之所以会这么耗费时间,是因为实际上Excel需要把工作簿一个个打开,抓取里面的某个工作表,然后关掉,不断地重复这个步骤,不断地开关工作簿会非常耗时。

如果之前我没有花过很多时间在账本的合并数据上,现在突然要我整这个的话,我肯定得花好几倍甚至十几倍的时间,但因为现在我是站在曾经自己的肩膀上的,所以虽然期间有过纠结,但总的来说还算是比较顺利。我考虑过要不要进行这种操作,但过去几年我都一直没这么干,因为要合并这些数据,一年只做一遍,有没有必要开发这样一个VBA脚本去实现呢?当那个报表被国粮局修改了,我又得重新修改脚本适应。所以之前我就在那里纠结到底有没有必要进行这个脚本的开发。

最终我做了,而且还做到了。

2021-04
13

新悟汇总

By xrspook @ 8:36:57 归类于: 烂日记

前段时间我看了几页POWER BI的教程,然后我就重新开始了之前我没有完成的事。因为我知道我肯定是要把那个东西搞定。虽然POWER BI的教程只看了几页,我已经对数据的理解有了一个确切的答案。如果可以的话,如果分析软件足够强大的话,又或者说个人电脑足够厉害,我们完全可以利用最基础的原始数据进行各种蹂躏,这样的话,颗粒度是最小的,也能够组合出最多的信息。但很多时候因为最原始的东西信息量实在太大了,有可能电脑吃不消。也有可能是别人问起来的时候还得各种加工处理,比较麻烦,所以就有了汇总数据这种东西。在汇总数据上面做汇总数据,的确能得到某些东西,但这样的话,显然就限制了想象力。因为一开始某些数据已经被汇总起来了,于是里面的某些细节再也不可能被打散。这样做不得不牺牲一些东西。可能那些东西暂时来说没什么必要,但说不准什么时候就会用到。所以可以的话,我还是比较喜欢对最初级的东西进行处理,而不是在汇总的基础上做汇总。在汇总的基础上做汇总,最终只能得出某些目标结果而不能天马行空,我觉得这样挺无聊的,但很多时候大家为了纯粹完成任务,不得不这么干。我觉得如果非得这么干的话,不如写个VBA脚本,全套自动运行没有烦恼。毕竟如果真这么干的话,做的纯粹是条件反射,循规蹈矩得出那些东西我觉得基本上不怎么需要动脑子。脑子应该用在制定程序上面而不是一次又一次重复某些步骤。在重复步骤这个能力上,人类远远比不上机器。我仅仅看了几页的POWER BI教程,已经给我明确了过去我一直都隐约觉得,但是却一直都没有总结出来的东西。现在我证实了我的直觉是正确的。

POWER BI之所以是POWER BI,因为它们可以处理Excel不能处理的东西,百万级的东西可以轻松搞定。从前那些不得不分几个Excel才能得出来的结果只要从那里导入,根本没有底线这个说法。我还记得新冠疫情某段时间英国说他们的统计数据出现的问题,有些数据被漏报了,原因是信息量超过了Excel最大的行数。这也实在太扯淡了吧!他们怎么会不用数据库呢?数据库的底线好像我还没听说过。如果Excel有底线的话,完全可以把数据分在几个Excel文件里,然后通过POWER BI把数据联合起来。所以他们给出那种完全不能让人接受的答案的时候,我在那里呵呵。那种数据级别居然还在用Excel,而没有没有专业的数据库去处理,这实在太让人震惊了,是因为他们只习惯于用Excel吗?大概是因为改数据的时候比较方便吧。毕竟进入数据库进入服务器的东西是会留痕的,但Excel可以随心所欲颠倒黑白,想怎么写就怎么写。

我不知道现在的世界到底有多么的水深火热,反正今年的股市就一直都很不咋地,我的基金被套住了,一开始只套一点,现在越套越多了,于是我也懒得去看到底是怎样。与其把人生耗费在钱生钱上面,不如干一些实实在在的东西。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress