2025-06
1

糟糕的汇总功能

By xrspook @ 8:17:07 归类于: 烂日记

智能化这个东西,我感觉是一个深渊、无底洞。理想很丰满,现实很骨感。几乎可以这么说,现在单位的所谓智能化,无论是单位的作业系统,还是集团公司的OA系统,都是一个四不像的东西。也不是说它们不能把某些数据呈现出来,关键是明明那些明细数据都已经收集齐全了,但是最终那些如何汇总可以这么说,两边都是一团糟。为什么都这么糟糕呢?为什么就不能把数据整合到一个让人舒服的模样呢?最基础的东西不断地让我填,填了一遍又一遍,但最后明明这个汇总结果根据已有的基础数据是完全可以组合生成出来的,但出来的东西就是非常的糟糕。比如说把不应该拼接的东西拼接在一起,结果那个结果就是还不如直接没有,因为放在那里只是碍眼而已,没有任何实质效果。两边的系统都存在这种问题。这是技术上实现不了的吗?显然不是。

因为浪潮现成的那些导出让我们的活没法干,所以我们单位的人也就只能写数据库查询,把我们想要的那些明细数据整合出来,然后通过Excel查询数据库,最终输出。我自己也在做同样的事情,我通过的是Excel的VBA,查询的是多个我自己的原始数据,有些数据只是一个复制粘贴,但有些数据需要日积月累手动录入,之所以不能直接使用系统的数据,因为某些数据是需要进行拆分微调的,某些则需要人肉添加某些必要的字段。为什么浪潮那里就不能把那些字段直接带入呢?还有那些微调,本来是不应该存在的,之所以存在,就是因为发生了一些非常规的业务。某些人觉得这么干没有问题,但实际上他根本没有考虑到我们的系统不支持你这么脑洞大开。再深一层的考虑,为什么会不支持?因为那的确不是一个白纸黑字明码标价说明可以这么操作的事情。难听一点,可以称之为违规,因为规范里根本没说过可以这么干,但如果人情一点,可以说这也是一条没什么问题的操作方式,只是原有的那些不够全面。最终到底认可还是不认可就看你怎么解释,听你解释的人是如何理解、有多大的容忍度。

无论是我的同事查询数据库,还是我用VBA查询多表,最终大家都是根据已有的明细数据生成一个我们觉得舒服、我们需要的那种表达方式。为什么我们能做出来,但是那些所谓系统却做不出来呢?浪潮做不出来,可能是他们根本没有在那个地方用过心。致远做不出来,居然跟我们说是因为我们给的钱不够。实际上有些功能是一期的时候给过钱,写过需求,要求他们那么干的,但实际上他们出来的效果不符合我们的要求。在这种情况下,你应该给我修正过来啊,但为什么没有呢?写需求的人没发现,发现的人不知道如何去反馈。基层单位不知道集团公司当初写的需求是什么。集团公司要基层单位使用这套系统的时候完全没有任何的指引。基层单位只能摸着石头过河,没有手册,没有讲课。我也不知道我应该看到些什么,不应该看到些什么。当我看到一些理论上跟我没有关系的东西的时候,我只能认为可能那套系统就这么个样子,就是可以让我看到,虽然那对我来说没有什么意义。

无论是浪潮还是致远,他们觉得基础数据的收集是他们得做的,而后续的汇总查询是额外的工作量。实际上换一个角度考虑,如果你能把那些字段构直接交给用户,让用户自己去设定流程查询,你完全没有任何工作量。你只需要教会用户如何组合就好了。汇总数据,无论是1个还是10个还是100个,都只是用户发挥想象力的事情而已。他们不敢放开这个,可能他们就没试过放开过。为什么会这么说呢?因为中兴云在介绍他们的系统的时候,就曾经说过这么一条:用户可以自己设定流程,生成自己的查询汇总数据,具备很强的拓展功能。说是这么说,实际上他能不能实现我不知道。显然即便开放了,这也不是一般人就能做得了的事情,起码他得懂一些东西。提出某些汇总需求的人得明确讲出他的数据是怎么来的,然后那个懂一些的人才知道该怎么给你凑出这个玩意。现在我估计情况是要汇总数据的人没有说清楚那是怎么来的,其次那个懂一些帮你设置那个流程的人不存在。

明明打通任督二脉就能轻而易举就解决的问题,现在翻来覆去、耗费大量人力物力。

2025-05
31

折磨3天

By xrspook @ 8:14:58 归类于: 烂日记

2025-05-28集团公司的财务部发了个文,准确来说那个文是2025-05-27发的,我在2025-05-28下午才在某个群里看到,那是一个统计群。发布的人圈出了里面的日期,发起人要发起某个进度表,要求在每月1日下午18点之前发起,整个流程要在3天之内结束。发起这个流程,我感觉没什么问题。里面需要点过的人随便数了一下,超过10个。这其中还有很多主任部长副总经理之类的人物。要求走这条流程,我觉得很合理,但关键是那个时间非常不合理。因为写的是每月1日,不是工作日。然后我们再算算,每年的1日有多少个月不是工作日?1月1日、5月1日、10月1日一定不是工作日,今年的6月1日刚好也不是工作日。光是算算就知道这相当不可思议。为什么要有这种要求呢?因为财务部的报表是每月3日之前完成。这个完成的限定时间针对直属库。我不知道为什么非得这样不可,因为统计月报不是这样的,提交的时间是工作日,如果遇到五一十一会有延迟,会计的这种做法到底是怎么个逻辑呢?可能有些单位也是这么干的,但你知道别的单位是不是限定每月最后那一天几点之前就截止所有单据呢?可能是上午12点,可能是下午18点,也可能是晚上22点。但我们就没有这种截止。我印象非常深刻的是2024-12-31。那天单位最后一条作业是23:59:32结束的,之所以不是59秒,可能是因为如果真是那个时候结束,系统的保存时间就已经跨天了,到2025-01-01了。实际上那天单位的那些作业也是做到2025年凌晨才结束的。因为显然这是一个连贯的操作,不可能因为说跨了天我就不继续完成余下的那些。为什么要把人逼成这个模样呢?

说回财务部的那个流程。发起人要填单是肯定的,好几个人要审核,但上面的人没审核完,下面的人就干不了,怎么能保证这个流程能快速通过呢?领导是不审核的,也不是说他们真的没做事,他们做的事跟我们的思路有点不一样,可能他们会发现一些漏洞,抠出一些细节,又或者他们在宏观的角度发现了一些我们不该有的错误,但是那些细枝末节的核对是由基层的人去完成的。基层审核的人一个又一个等待上一个流程结束,这根本就是一个无底洞。你不知道发起人什么时候发起,你不知道你前面的那个领导什么时候点过。所以在这三天的时间里,你都处在一个on call的状态,时刻准备着。因为万一到你这一步,你拖了半天你才结束,真不知道后面会怎样。但是你又真的不确定你前面的那个领导什么时候才把他的那个提交点下去。你甚至不知道这条流程到底走到哪里了,因为不到你那里,你是不知道的。领导的流程可能5分钟之内就通过了三个,但也有可能3个小时、半天甚至一天都没动过。这就要靠前面流程的人及时提醒,但是他们有没有这个脸不断催促呢?

OA上面的流程,我见过有些5天都没走完。很多都是,如果是周五发起,随便就跨了个周末,完全没动过。周末没动过,那么这个每月1日的这个玩意,谁能保证就一定会动起来呢?

制造这一条让大家都这么难受的规则,最终实际上不会有什么结果。因为直属库的数据跟财务部的付款用的不是同一个节点,所以折腾这么一圈,最终只是个可预知的杯具。

2025-05
30

自动生成Excel索引

By xrspook @ 8:22:23 归类于: 烂日记

我要对一堆的本地eml文件做一个索引,应该用什么方式表达呢?一开始我想到的是做一个html的网页。上面需要表达的信息包括:分类、时间、附件个数、发件人、邮件主题以及文件路径。文件路径应该是一个超链接,我点击这个网页的超链接,就能到达那个文件,可能是直接打开文件。有没有一种方式是打开资源管理器直接锚定到那个文件但不打开呢?一开始我是这么设想的,但后来网友告知,在浏览器层面没办法打开这些文件,因为安全性的原因,浏览器没有打开文件的权限。如果那是一个txt文件,那么你可以直接在浏览器里打开,如果是一个图片,也能打开,但是如果那是一些其它后缀的文件,理论上是打不开的,哪怕你在浏览器里以资源管理器索引的方式打开了文件夹的目录,当你点击某个后缀文件的时候,会弹出一个窗口让你下载。一整个下午我就在这里兜圈子,总感觉是不是有一种方式能够让浏览器弹出资源管理器锚定到那个文件,哪怕不打开文件本身。我一开始天真地觉得,在浏览器里面点超链接就能直接打开eml文件,因为那个后缀的文件我已经设定了默认打开方式是雷鸟。事实证明,我只是一个下午都在白费力气而已。

普通a开头的超链接是无法打开eml文件的,我想到了Excel里面的超链接。Excel的超链接可以直接链接到某个文件。它跟浏览器不一样。不会在Excel里面打开那些东西,哪怕那些个txt或者一个图片,会直接打开文件。所以我就尝试在Excel里给eml文件做一个超链接,结果发现。当我点击那个超链接的时候,会弹出一个窗口,告诉我这么干不安全,但是我依然可以选择是继续打开那个文件,之后雷鸟就会启动,那个eml文件就被打开了。所以简单来说,实际上在Excel里面是直接可以打开eml文件的,不过打开的时候会有一个令人烦恼的弹窗,可能在某些地方进行设置,可以把那个安全提醒的弹窗去掉,但我觉得没有必要。如果你不想被那个弹窗烦恼,你可以右键那个单元格的链接地址,直接贴到任何一个资源管理器地址栏,回车就打开了。操作是有点烦,但起码不会像浏览器那样,打不开或者非让你下载不可。

折腾了一个下午之后,我发现原来我的目标居然是把那个邮件索引做在Excel文件里。Excel的版本可以做的,和之前的功能没有区别,更强大的地方在于如果是在Excel文件里,排序很方便,搜索也很方便。

接下来我没有做更多浪费时间的事情,直接去把这个问题丢给Deepseek,问它如何用Python的方式把批量的 eml文件信息输出到Excel。第1次给我的那个版本只能针对某个路径,但如果那个路径里面还有子文件夹会被忽略,所以后来我增加提问,所以Deepseek又给了我递归那个路径下所有文件夹的版本。默认的回答没有附件个数,所以最后我要加多了要计算每个邮件附件个数的功能。

事实证明Deepseek真的是一个好东西,因为它第1个版本的代码已经能输出大概差不多那种东西,但是不能完全符合我的要求,因为它认为重要的信息和我需要的信息以及排序始终有区别。把pandas里面的数据输出到Excel有好几种方式,但是有些输出方式出来的那个Excel文件我个人感觉很丑,所以我又花了半个下午的时间改成了以xlwings输出,这个东西比其它输出在格式调整方面有更大的调控空间,比如自适配行高和列宽。在其它引擎里可能需要一大段的代码,但是在xlwings里面就只需要一句autofit。之所以知道这个,是因为之前在学Python提高Excel工作效率的书里我已经接触过这个东西。

Deepseek的代码能解决核心问题,但细节调整还是得靠自己。从第1次叫Deepseek写代码到我最终得到我想要的那个Excel索引,花了不到24小时。

2025-05
29

手动批量下载完毕

By xrspook @ 8:11:37 归类于: 烂日记

合计花了一天的时间,总算把我网易免费企业邮箱里的邮件下载回来。告诉我邮箱容量调减的时候我看了一眼,那里大概有3900多封邮件。我当然不会全部下载,因为我知道其中很多可能是可以直接删除的,比如京东和淘宝的退款退货发货发票之类的邮件,全部都可以删掉。让我意外的是,原来邮箱的大头是Nature的文件夹。那个东西当我还读大学,还在用雅虎中国邮箱的时候,就已经订阅了。雅虎中国挂掉了以后,我就把邮箱改成了网易的免费企业邮箱,因为邮件太多,所以根本不看,以前在雅虎中国的时候我也不看,直接指定了邮件地址,然后会自动给我分类投放到某个文件夹。并且标注为已读状态,所以接收那些邮件的时候我是无感的。这一次删除的时候,这个文件夹里面的邮件可以完全不看,直接删掉,原来那里有2500多封邮件,合计占了120MB的空间。理论上一下我应该还有1400多封邮件,接下来我得一个一个减肥。最终我下载回来的邮件是548个,放在24个文件夹里,总的大小是113MB。我第1次看有3900多个邮件的时候,占了300多个MB。为什么我合计花一天的时间去下载,就是因为这也包括了我不断的筛选邮件的时间。筛选的过程中我发现好像有些邮件放的目录不太对,所以还得调整过来。

其实下载邮件的过程是挺快的,如果不是遇到那些同名邮件,速度会更快。无论是上TinyTask还是直接手抽筋去点击鼠标都很快。只要你把那个步骤搞熟练了,一切都好说。我得新建文件夹,然后保存文件,接下来开始批量操作,批量的过程中遇到重名文件,得赶紧快捷键退出手动处理。我觉得最耗费我时间的是文件下载回来了,我得在邮箱的列表界面和我的文件夹核对,是不是下载全了。但可能还是会有一些漏网之鱼,就文件数量来说不会缺,但是下载要一定时间,万一我手速太快,浏览器实际上还没下载完,那个邮件已经被我丢到回收站,然后还被我彻底删除了,这就真没得救了,我也不打算纠结自己到底有没有干这种蠢事。下载大文件的时候拼的是网速,下载小文件的时候手速太快就不行了。现在的情况是下载的绝大多数都是很小的文件。小到什么程度呢?还不到10个KB。一边下载,我一边还会把网易文件夹列表里面的邮件清空,然后删除垃圾,这样我就会看到免费企业邮箱到占用容量、邮件数量在不断下降。删除了这些邮件以后,我会把文件夹也删除掉。最后删除的状态就是里面除了通讯录,基本不含我的信息。这样的好处就是哪怕我被黑了,也黑不到什么东西,获取通讯录,知道那些邮箱地址,也难有什么作为。这样一个什么都没有的免费企业邮箱,感觉挺让人放心的。既然我已经花了那么大力气去干这种清空的事情,接下来我就更加没有欲望去网易那边申请恢复我的发件权利。以后估计我很少会用这个邮箱进行注册。其实自从从这个邮箱再也不能发件起,我也基本不用这个邮箱注册,但话说回来,之所以这样,是因为2021年以后,需要用邮箱注册的地方少了,尤其是在国内,而国外我去的时间又少了很多,不会再花发掘些什么好玩的东西了。

接下来我想做的是针对这一批本地储存的eml文件,建立一个索引。从原理上说,我感觉比较简单,但从实施的角度考虑,第一个下午我就已经遇到了一些,我以为很容易,实际上无解的问题了。

2025-05
28

小TinyTask解决大问题

By xrspook @ 8:13:00 归类于: 烂日记

再次给网易免费企业邮箱发了个工单,问上一次告诉我的操作方法的图裂的到底是什么。两天之后终于收到了回复,之所以花了两天,因为刚好卡在了周末。看没看到那个图片其实我也觉得不重要了,我猜那个图片是告诉我如何导出某封邮件,就是把那个邮件保存为eml格式。后来工单回复证实了我的猜想。

既然他们觉得只有这种方式把邮件导出,那么我就要用我的思路把邮件批量下载回来。我首先想到的是鼠标录制,可能是针对windows系统的,也可能是针对网页本身的。针对网页本身的,我觉得那些什么油猴脚本之类估计有解决方案。针对系统的,解决方案会更多,因为说白了这是一个批量鼠标操作的过程。如果这是在Excel里进行,可以理解为那就是一个VBA,录制一个鼠标的宏。一开始我用普通的搜索引擎结果,好像都不太靠谱,最后我问了一下Deepseek,发给了我好多方案,我随便就去搜了第1个方案,是一个叫做TinyTask的软件,进行鼠标录制。那个东西很小,只有三十几KB。从那个界面我感觉应该可以满足我的需求,但是当我到那个官方网站的下载页面,发现所有下载链接都指向了github的某个账号,但关键打开那个页面是404。我的第一个感觉是,会不会因为我是用中国的IP打开的呢?于是我又用了其它的方式打开,发现还是404,所以我猜可能那个账户自己主动删除了或者被删除了。说白了就是没办法从最官方网站下载这个软件了。直接搜索软件,在中国的很多下载网站有那个东西,但现在我已经不怎么相信那些玩意了,最后我在吾爱破解论坛里找到了那个东西。吾爱破解里,这个软件还有好几个版本,同一个版本也有好几个款式。有一些是以附件方式出现,需要付论坛币才能下载,有些放到了网盘,但是外链的那些网盘好像打不开,所以我就花了两个币,把那个汉化版下载回来。

经过测试,TinyTask的确能满足我的要求。因为实际上我要做到的就是打开某个邮件先保存一遍,因为我要确认批量保存的是在某个路径下。保存的步骤是下拉菜单,点击下载,保存在某个路径,然后在邮件页面点下一封。如果一切顺利,只需要三个按钮,但关键是以这种方式下载的邮件文件名是缩略版的邮件标题。邮件标题这种东西经常会重复。如果你用录屏的方式,因为出现了告诉你文件重复的弹框,等于有个乱入,会导致整个保存的过程失败。直接用邮件名作为文件名,这个行为可以理解,但难道那些让人保存邮件的人就没想过这样会让批量下载的时候出现大问题吗?他们完全是可以避免这种问题的,只要他在文件名前面加个时间。这里要说明的是不仅仅是日期,而是要精确到时间。如果不用时间就用时间戳,也能实现这个功能。有了时间戳和邮件名,基本上重复的概率很低。但显然,开发下载按钮的那个人根本没想过你要一个一个下载。甚至他们都没想过你要搬家,要把所有东西都挪走。不知道那些通过压缩包方式批量备份的邮件到底是如何避免相同文件名这个问题的。

TinyTask这个鼠标录制软件,在没有遇到相同文件名的时候是很好用的,但是你的速度不能太快,我个人感觉两倍已经是极限了,因为这是一个联网的操作。点击下载以后会弹出一个系统的路径,那个弹出是有一定延迟的,所以你的播放速度太快直接窗口没弹出鼠标就已经点了那个地方,结果是一点效果都不会有的。我的经验设置是把播放速度调为两倍,循环次数为5,邮箱页面列表显示10封邮件。这样批量操作以后,核对是否下载正确眼睛就不会那么累。

既然别人不给我活路,我就只能自己硬是开出一条路。

PS: 键鼠自动宏软件-TinyTask使用教程

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress