2025-06
2

两个毛病

By xrspook @ 8:36:43 归类于: 烂日记

让我有点出乎意料,2025-05-31的作业在下午16点多居然就结束了,那个时候我还在外面。刚刚吃完个糖水,正要解决晚饭,还不知道晚饭的那个地方到底在什么地方。为什么单位月末这一天的作业这么快就结束了呢?集装箱快结束我是可以理解的,因为15点多的时候就已经说车已经都到了,而且都已经检验合格了。理论上还要装一条船,那条船我感觉是没办法装完的,因为要清仓。不知道为什么有个科室说那条船2025-06-01才装,实际上另外一个科室2025-05-31就开始装了,装一半停了。之所以这样,我感觉一个原因是要清仓,另外一个原因是那个仓里面的货有些已打达到了缓冲仓,需要从缓冲仓里面拉出来装船。缓冲仓拉出来再装船这个操作需要其它配合。可能这个操作他们已经是默认2025-05-31不干。于是这就变成了一条船,只能把某个仓里面的东西能装的都装,其它的等之后再解决,这里所说的之后就是2025-06-01或者以后。

傻眼了,单位的作业居然就结束了,还没到下午17点就结束了。我人在外面,不在电脑旁,一直在纠结,我得赶快回家把这些事情都做完。我到家的时候已经接近晚上19点,这已经很快了。我没跟我妈说2025-05-31我们得早点回家。实际上我们就是这么处理的,比如说当我妈还想着要去某个地方买柠檬的时候,我直接在路边看到一个小超市,然后进去解决问题。

5月末的事情,我大概花了两个小时多一点解决所有。这其中出了一个小插曲。当我把很多表的数据都更新完以后,突然发现在核对的时候有个数对不上,仔细一看,就是2025-05-31的某个数据。某个手动添加的字段我粗心大意添加错信息,所以就出现了这种毛病。如果我不是一次更新那么多表达话,这个东西回头还是很简单的。但关键是这个月末我就不知道为什么那么手贱,在没有核对资料之前就已经把所有信息都粘贴好了,于是在修改了那个字段以后,我还得把所有这种信息全部重新粘贴。一次性到位和这种二次到位相比,让我做完了以后依然有一种我到底改彻底了没的疑问。所以改完一次以后,我还是得把那些东西翻来覆去再看几遍确认已经都改完了。这件事让我自己又多了个经验,在核对好数据之前不应该把那个数据一下子全面铺开生成各种表格。如果出现错误,会让我很被动。除了这个点以外,在后面一次核对数据中,我发现平均库存居然对不上,为什么居然会对不上呢?多表研究了一番以后,发现在某个大表里,我标注高亮的日期标错了,应该是5月1日和5月31日,结果我标成了5月1日和5月30日。当我把那个东西调整过来以后,平均库存都对上了。平时正常情况下,无论是之前的字段内容还是特殊日子的高亮标注,我都极少出错,或者说从未出错过,但这一次就出现了这么两个让我小惊讶的事。虽然这些东西要改过来都很简单,但是发现对不上的时候,人还是会有点紧张。虽然无论是哪条流程实际上我都已经运作了三年或者以上,突然出状况会让人觉得很意外,同时也会让人有点茫然,毕竟为什么之前一直没有问题,而现在却这么个情况。

那总算在晚上21点多的时候,我结束了一切。

2025-06
1

糟糕的汇总功能

By xrspook @ 8:17:07 归类于: 烂日记

智能化这个东西,我感觉是一个深渊、无底洞。理想很丰满,现实很骨感。几乎可以这么说,现在单位的所谓智能化,无论是单位的作业系统,还是集团公司的OA系统,都是一个四不像的东西。也不是说它们不能把某些数据呈现出来,关键是明明那些明细数据都已经收集齐全了,但是最终那些如何汇总可以这么说,两边都是一团糟。为什么都这么糟糕呢?为什么就不能把数据整合到一个让人舒服的模样呢?最基础的东西不断地让我填,填了一遍又一遍,但最后明明这个汇总结果根据已有的基础数据是完全可以组合生成出来的,但出来的东西就是非常的糟糕。比如说把不应该拼接的东西拼接在一起,结果那个结果就是还不如直接没有,因为放在那里只是碍眼而已,没有任何实质效果。两边的系统都存在这种问题。这是技术上实现不了的吗?显然不是。

因为浪潮现成的那些导出让我们的活没法干,所以我们单位的人也就只能写数据库查询,把我们想要的那些明细数据整合出来,然后通过Excel查询数据库,最终输出。我自己也在做同样的事情,我通过的是Excel的VBA,查询的是多个我自己的原始数据,有些数据只是一个复制粘贴,但有些数据需要日积月累手动录入,之所以不能直接使用系统的数据,因为某些数据是需要进行拆分微调的,某些则需要人肉添加某些必要的字段。为什么浪潮那里就不能把那些字段直接带入呢?还有那些微调,本来是不应该存在的,之所以存在,就是因为发生了一些非常规的业务。某些人觉得这么干没有问题,但实际上他根本没有考虑到我们的系统不支持你这么脑洞大开。再深一层的考虑,为什么会不支持?因为那的确不是一个白纸黑字明码标价说明可以这么操作的事情。难听一点,可以称之为违规,因为规范里根本没说过可以这么干,但如果人情一点,可以说这也是一条没什么问题的操作方式,只是原有的那些不够全面。最终到底认可还是不认可就看你怎么解释,听你解释的人是如何理解、有多大的容忍度。

无论是我的同事查询数据库,还是我用VBA查询多表,最终大家都是根据已有的明细数据生成一个我们觉得舒服、我们需要的那种表达方式。为什么我们能做出来,但是那些所谓系统却做不出来呢?浪潮做不出来,可能是他们根本没有在那个地方用过心。致远做不出来,居然跟我们说是因为我们给的钱不够。实际上有些功能是一期的时候给过钱,写过需求,要求他们那么干的,但实际上他们出来的效果不符合我们的要求。在这种情况下,你应该给我修正过来啊,但为什么没有呢?写需求的人没发现,发现的人不知道如何去反馈。基层单位不知道集团公司当初写的需求是什么。集团公司要基层单位使用这套系统的时候完全没有任何的指引。基层单位只能摸着石头过河,没有手册,没有讲课。我也不知道我应该看到些什么,不应该看到些什么。当我看到一些理论上跟我没有关系的东西的时候,我只能认为可能那套系统就这么个样子,就是可以让我看到,虽然那对我来说没有什么意义。

无论是浪潮还是致远,他们觉得基础数据的收集是他们得做的,而后续的汇总查询是额外的工作量。实际上换一个角度考虑,如果你能把那些字段构直接交给用户,让用户自己去设定流程查询,你完全没有任何工作量。你只需要教会用户如何组合就好了。汇总数据,无论是1个还是10个还是100个,都只是用户发挥想象力的事情而已。他们不敢放开这个,可能他们就没试过放开过。为什么会这么说呢?因为中兴云在介绍他们的系统的时候,就曾经说过这么一条:用户可以自己设定流程,生成自己的查询汇总数据,具备很强的拓展功能。说是这么说,实际上他能不能实现我不知道。显然即便开放了,这也不是一般人就能做得了的事情,起码他得懂一些东西。提出某些汇总需求的人得明确讲出他的数据是怎么来的,然后那个懂一些的人才知道该怎么给你凑出这个玩意。现在我估计情况是要汇总数据的人没有说清楚那是怎么来的,其次那个懂一些帮你设置那个流程的人不存在。

明明打通任督二脉就能轻而易举就解决的问题,现在翻来覆去、耗费大量人力物力。

2025-05
31

折磨3天

By xrspook @ 8:14:58 归类于: 烂日记

2025-05-28集团公司的财务部发了个文,准确来说那个文是2025-05-27发的,我在2025-05-28下午才在某个群里看到,那是一个统计群。发布的人圈出了里面的日期,发起人要发起某个进度表,要求在每月1日下午18点之前发起,整个流程要在3天之内结束。发起这个流程,我感觉没什么问题。里面需要点过的人随便数了一下,超过10个。这其中还有很多主任部长副总经理之类的人物。要求走这条流程,我觉得很合理,但关键是那个时间非常不合理。因为写的是每月1日,不是工作日。然后我们再算算,每年的1日有多少个月不是工作日?1月1日、5月1日、10月1日一定不是工作日,今年的6月1日刚好也不是工作日。光是算算就知道这相当不可思议。为什么要有这种要求呢?因为财务部的报表是每月3日之前完成。这个完成的限定时间针对直属库。我不知道为什么非得这样不可,因为统计月报不是这样的,提交的时间是工作日,如果遇到五一十一会有延迟,会计的这种做法到底是怎么个逻辑呢?可能有些单位也是这么干的,但你知道别的单位是不是限定每月最后那一天几点之前就截止所有单据呢?可能是上午12点,可能是下午18点,也可能是晚上22点。但我们就没有这种截止。我印象非常深刻的是2024-12-31。那天单位最后一条作业是23:59:32结束的,之所以不是59秒,可能是因为如果真是那个时候结束,系统的保存时间就已经跨天了,到2025-01-01了。实际上那天单位的那些作业也是做到2025年凌晨才结束的。因为显然这是一个连贯的操作,不可能因为说跨了天我就不继续完成余下的那些。为什么要把人逼成这个模样呢?

说回财务部的那个流程。发起人要填单是肯定的,好几个人要审核,但上面的人没审核完,下面的人就干不了,怎么能保证这个流程能快速通过呢?领导是不审核的,也不是说他们真的没做事,他们做的事跟我们的思路有点不一样,可能他们会发现一些漏洞,抠出一些细节,又或者他们在宏观的角度发现了一些我们不该有的错误,但是那些细枝末节的核对是由基层的人去完成的。基层审核的人一个又一个等待上一个流程结束,这根本就是一个无底洞。你不知道发起人什么时候发起,你不知道你前面的那个领导什么时候点过。所以在这三天的时间里,你都处在一个on call的状态,时刻准备着。因为万一到你这一步,你拖了半天你才结束,真不知道后面会怎样。但是你又真的不确定你前面的那个领导什么时候才把他的那个提交点下去。你甚至不知道这条流程到底走到哪里了,因为不到你那里,你是不知道的。领导的流程可能5分钟之内就通过了三个,但也有可能3个小时、半天甚至一天都没动过。这就要靠前面流程的人及时提醒,但是他们有没有这个脸不断催促呢?

OA上面的流程,我见过有些5天都没走完。很多都是,如果是周五发起,随便就跨了个周末,完全没动过。周末没动过,那么这个每月1日的这个玩意,谁能保证就一定会动起来呢?

制造这一条让大家都这么难受的规则,最终实际上不会有什么结果。因为直属库的数据跟财务部的付款用的不是同一个节点,所以折腾这么一圈,最终只是个可预知的杯具。

2025-05
30

自动生成Excel索引

By xrspook @ 8:22:23 归类于: 烂日记

我要对一堆的本地eml文件做一个索引,应该用什么方式表达呢?一开始我想到的是做一个html的网页。上面需要表达的信息包括:分类、时间、附件个数、发件人、邮件主题以及文件路径。文件路径应该是一个超链接,我点击这个网页的超链接,就能到达那个文件,可能是直接打开文件。有没有一种方式是打开资源管理器直接锚定到那个文件但不打开呢?一开始我是这么设想的,但后来网友告知,在浏览器层面没办法打开这些文件,因为安全性的原因,浏览器没有打开文件的权限。如果那是一个txt文件,那么你可以直接在浏览器里打开,如果是一个图片,也能打开,但是如果那是一些其它后缀的文件,理论上是打不开的,哪怕你在浏览器里以资源管理器索引的方式打开了文件夹的目录,当你点击某个后缀文件的时候,会弹出一个窗口让你下载。一整个下午我就在这里兜圈子,总感觉是不是有一种方式能够让浏览器弹出资源管理器锚定到那个文件,哪怕不打开文件本身。我一开始天真地觉得,在浏览器里面点超链接就能直接打开eml文件,因为那个后缀的文件我已经设定了默认打开方式是雷鸟。事实证明,我只是一个下午都在白费力气而已。

普通a开头的超链接是无法打开eml文件的,我想到了Excel里面的超链接。Excel的超链接可以直接链接到某个文件。它跟浏览器不一样。不会在Excel里面打开那些东西,哪怕那些个txt或者一个图片,会直接打开文件。所以我就尝试在Excel里给eml文件做一个超链接,结果发现。当我点击那个超链接的时候,会弹出一个窗口,告诉我这么干不安全,但是我依然可以选择是继续打开那个文件,之后雷鸟就会启动,那个eml文件就被打开了。所以简单来说,实际上在Excel里面是直接可以打开eml文件的,不过打开的时候会有一个令人烦恼的弹窗,可能在某些地方进行设置,可以把那个安全提醒的弹窗去掉,但我觉得没有必要。如果你不想被那个弹窗烦恼,你可以右键那个单元格的链接地址,直接贴到任何一个资源管理器地址栏,回车就打开了。操作是有点烦,但起码不会像浏览器那样,打不开或者非让你下载不可。

折腾了一个下午之后,我发现原来我的目标居然是把那个邮件索引做在Excel文件里。Excel的版本可以做的,和之前的功能没有区别,更强大的地方在于如果是在Excel文件里,排序很方便,搜索也很方便。

接下来我没有做更多浪费时间的事情,直接去把这个问题丢给Deepseek,问它如何用Python的方式把批量的 eml文件信息输出到Excel。第1次给我的那个版本只能针对某个路径,但如果那个路径里面还有子文件夹会被忽略,所以后来我增加提问,所以Deepseek又给了我递归那个路径下所有文件夹的版本。默认的回答没有附件个数,所以最后我要加多了要计算每个邮件附件个数的功能。

事实证明Deepseek真的是一个好东西,因为它第1个版本的代码已经能输出大概差不多那种东西,但是不能完全符合我的要求,因为它认为重要的信息和我需要的信息以及排序始终有区别。把pandas里面的数据输出到Excel有好几种方式,但是有些输出方式出来的那个Excel文件我个人感觉很丑,所以我又花了半个下午的时间改成了以xlwings输出,这个东西比其它输出在格式调整方面有更大的调控空间,比如自适配行高和列宽。在其它引擎里可能需要一大段的代码,但是在xlwings里面就只需要一句autofit。之所以知道这个,是因为之前在学Python提高Excel工作效率的书里我已经接触过这个东西。

Deepseek的代码能解决核心问题,但细节调整还是得靠自己。从第1次叫Deepseek写代码到我最终得到我想要的那个Excel索引,花了不到24小时。

2025-05
29

手动批量下载完毕

By xrspook @ 8:11:37 归类于: 烂日记

合计花了一天的时间,总算把我网易免费企业邮箱里的邮件下载回来。告诉我邮箱容量调减的时候我看了一眼,那里大概有3900多封邮件。我当然不会全部下载,因为我知道其中很多可能是可以直接删除的,比如京东和淘宝的退款退货发货发票之类的邮件,全部都可以删掉。让我意外的是,原来邮箱的大头是Nature的文件夹。那个东西当我还读大学,还在用雅虎中国邮箱的时候,就已经订阅了。雅虎中国挂掉了以后,我就把邮箱改成了网易的免费企业邮箱,因为邮件太多,所以根本不看,以前在雅虎中国的时候我也不看,直接指定了邮件地址,然后会自动给我分类投放到某个文件夹。并且标注为已读状态,所以接收那些邮件的时候我是无感的。这一次删除的时候,这个文件夹里面的邮件可以完全不看,直接删掉,原来那里有2500多封邮件,合计占了120MB的空间。理论上一下我应该还有1400多封邮件,接下来我得一个一个减肥。最终我下载回来的邮件是548个,放在24个文件夹里,总的大小是113MB。我第1次看有3900多个邮件的时候,占了300多个MB。为什么我合计花一天的时间去下载,就是因为这也包括了我不断的筛选邮件的时间。筛选的过程中我发现好像有些邮件放的目录不太对,所以还得调整过来。

其实下载邮件的过程是挺快的,如果不是遇到那些同名邮件,速度会更快。无论是上TinyTask还是直接手抽筋去点击鼠标都很快。只要你把那个步骤搞熟练了,一切都好说。我得新建文件夹,然后保存文件,接下来开始批量操作,批量的过程中遇到重名文件,得赶紧快捷键退出手动处理。我觉得最耗费我时间的是文件下载回来了,我得在邮箱的列表界面和我的文件夹核对,是不是下载全了。但可能还是会有一些漏网之鱼,就文件数量来说不会缺,但是下载要一定时间,万一我手速太快,浏览器实际上还没下载完,那个邮件已经被我丢到回收站,然后还被我彻底删除了,这就真没得救了,我也不打算纠结自己到底有没有干这种蠢事。下载大文件的时候拼的是网速,下载小文件的时候手速太快就不行了。现在的情况是下载的绝大多数都是很小的文件。小到什么程度呢?还不到10个KB。一边下载,我一边还会把网易文件夹列表里面的邮件清空,然后删除垃圾,这样我就会看到免费企业邮箱到占用容量、邮件数量在不断下降。删除了这些邮件以后,我会把文件夹也删除掉。最后删除的状态就是里面除了通讯录,基本不含我的信息。这样的好处就是哪怕我被黑了,也黑不到什么东西,获取通讯录,知道那些邮箱地址,也难有什么作为。这样一个什么都没有的免费企业邮箱,感觉挺让人放心的。既然我已经花了那么大力气去干这种清空的事情,接下来我就更加没有欲望去网易那边申请恢复我的发件权利。以后估计我很少会用这个邮箱进行注册。其实自从从这个邮箱再也不能发件起,我也基本不用这个邮箱注册,但话说回来,之所以这样,是因为2021年以后,需要用邮箱注册的地方少了,尤其是在国内,而国外我去的时间又少了很多,不会再花发掘些什么好玩的东西了。

接下来我想做的是针对这一批本地储存的eml文件,建立一个索引。从原理上说,我感觉比较简单,但从实施的角度考虑,第一个下午我就已经遇到了一些,我以为很容易,实际上无解的问题了。

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress