2025-05
31

折磨3天

By xrspook @ 8:14:58 归类于: 烂日记

2025-05-28集团公司的财务部发了个文,准确来说那个文是2025-05-27发的,我在2025-05-28下午才在某个群里看到,那是一个统计群。发布的人圈出了里面的日期,发起人要发起某个进度表,要求在每月1日下午18点之前发起,整个流程要在3天之内结束。发起这个流程,我感觉没什么问题。里面需要点过的人随便数了一下,超过10个。这其中还有很多主任部长副总经理之类的人物。要求走这条流程,我觉得很合理,但关键是那个时间非常不合理。因为写的是每月1日,不是工作日。然后我们再算算,每年的1日有多少个月不是工作日?1月1日、5月1日、10月1日一定不是工作日,今年的6月1日刚好也不是工作日。光是算算就知道这相当不可思议。为什么要有这种要求呢?因为财务部的报表是每月3日之前完成。这个完成的限定时间针对直属库。我不知道为什么非得这样不可,因为统计月报不是这样的,提交的时间是工作日,如果遇到五一十一会有延迟,会计的这种做法到底是怎么个逻辑呢?可能有些单位也是这么干的,但你知道别的单位是不是限定每月最后那一天几点之前就截止所有单据呢?可能是上午12点,可能是下午18点,也可能是晚上22点。但我们就没有这种截止。我印象非常深刻的是2024-12-31。那天单位最后一条作业是23:59:32结束的,之所以不是59秒,可能是因为如果真是那个时候结束,系统的保存时间就已经跨天了,到2025-01-01了。实际上那天单位的那些作业也是做到2025年凌晨才结束的。因为显然这是一个连贯的操作,不可能因为说跨了天我就不继续完成余下的那些。为什么要把人逼成这个模样呢?

说回财务部的那个流程。发起人要填单是肯定的,好几个人要审核,但上面的人没审核完,下面的人就干不了,怎么能保证这个流程能快速通过呢?领导是不审核的,也不是说他们真的没做事,他们做的事跟我们的思路有点不一样,可能他们会发现一些漏洞,抠出一些细节,又或者他们在宏观的角度发现了一些我们不该有的错误,但是那些细枝末节的核对是由基层的人去完成的。基层审核的人一个又一个等待上一个流程结束,这根本就是一个无底洞。你不知道发起人什么时候发起,你不知道你前面的那个领导什么时候点过。所以在这三天的时间里,你都处在一个on call的状态,时刻准备着。因为万一到你这一步,你拖了半天你才结束,真不知道后面会怎样。但是你又真的不确定你前面的那个领导什么时候才把他的那个提交点下去。你甚至不知道这条流程到底走到哪里了,因为不到你那里,你是不知道的。领导的流程可能5分钟之内就通过了三个,但也有可能3个小时、半天甚至一天都没动过。这就要靠前面流程的人及时提醒,但是他们有没有这个脸不断催促呢?

OA上面的流程,我见过有些5天都没走完。很多都是,如果是周五发起,随便就跨了个周末,完全没动过。周末没动过,那么这个每月1日的这个玩意,谁能保证就一定会动起来呢?

制造这一条让大家都这么难受的规则,最终实际上不会有什么结果。因为直属库的数据跟财务部的付款用的不是同一个节点,所以折腾这么一圈,最终只是个可预知的杯具。

2025-05
30

自动生成Excel索引

By xrspook @ 8:22:23 归类于: 烂日记

我要对一堆的本地eml文件做一个索引,应该用什么方式表达呢?一开始我想到的是做一个html的网页。上面需要表达的信息包括:分类、时间、附件个数、发件人、邮件主题以及文件路径。文件路径应该是一个超链接,我点击这个网页的超链接,就能到达那个文件,可能是直接打开文件。有没有一种方式是打开资源管理器直接锚定到那个文件但不打开呢?一开始我是这么设想的,但后来网友告知,在浏览器层面没办法打开这些文件,因为安全性的原因,浏览器没有打开文件的权限。如果那是一个txt文件,那么你可以直接在浏览器里打开,如果是一个图片,也能打开,但是如果那是一些其它后缀的文件,理论上是打不开的,哪怕你在浏览器里以资源管理器索引的方式打开了文件夹的目录,当你点击某个后缀文件的时候,会弹出一个窗口让你下载。一整个下午我就在这里兜圈子,总感觉是不是有一种方式能够让浏览器弹出资源管理器锚定到那个文件,哪怕不打开文件本身。我一开始天真地觉得,在浏览器里面点超链接就能直接打开eml文件,因为那个后缀的文件我已经设定了默认打开方式是雷鸟。事实证明,我只是一个下午都在白费力气而已。

普通a开头的超链接是无法打开eml文件的,我想到了Excel里面的超链接。Excel的超链接可以直接链接到某个文件。它跟浏览器不一样。不会在Excel里面打开那些东西,哪怕那些个txt或者一个图片,会直接打开文件。所以我就尝试在Excel里给eml文件做一个超链接,结果发现。当我点击那个超链接的时候,会弹出一个窗口,告诉我这么干不安全,但是我依然可以选择是继续打开那个文件,之后雷鸟就会启动,那个eml文件就被打开了。所以简单来说,实际上在Excel里面是直接可以打开eml文件的,不过打开的时候会有一个令人烦恼的弹窗,可能在某些地方进行设置,可以把那个安全提醒的弹窗去掉,但我觉得没有必要。如果你不想被那个弹窗烦恼,你可以右键那个单元格的链接地址,直接贴到任何一个资源管理器地址栏,回车就打开了。操作是有点烦,但起码不会像浏览器那样,打不开或者非让你下载不可。

折腾了一个下午之后,我发现原来我的目标居然是把那个邮件索引做在Excel文件里。Excel的版本可以做的,和之前的功能没有区别,更强大的地方在于如果是在Excel文件里,排序很方便,搜索也很方便。

接下来我没有做更多浪费时间的事情,直接去把这个问题丢给Deepseek,问它如何用Python的方式把批量的 eml文件信息输出到Excel。第1次给我的那个版本只能针对某个路径,但如果那个路径里面还有子文件夹会被忽略,所以后来我增加提问,所以Deepseek又给了我递归那个路径下所有文件夹的版本。默认的回答没有附件个数,所以最后我要加多了要计算每个邮件附件个数的功能。

事实证明Deepseek真的是一个好东西,因为它第1个版本的代码已经能输出大概差不多那种东西,但是不能完全符合我的要求,因为它认为重要的信息和我需要的信息以及排序始终有区别。把pandas里面的数据输出到Excel有好几种方式,但是有些输出方式出来的那个Excel文件我个人感觉很丑,所以我又花了半个下午的时间改成了以xlwings输出,这个东西比其它输出在格式调整方面有更大的调控空间,比如自适配行高和列宽。在其它引擎里可能需要一大段的代码,但是在xlwings里面就只需要一句autofit。之所以知道这个,是因为之前在学Python提高Excel工作效率的书里我已经接触过这个东西。

Deepseek的代码能解决核心问题,但细节调整还是得靠自己。从第1次叫Deepseek写代码到我最终得到我想要的那个Excel索引,花了不到24小时。

2025-05
29

手动批量下载完毕

By xrspook @ 8:11:37 归类于: 烂日记

合计花了一天的时间,总算把我网易免费企业邮箱里的邮件下载回来。告诉我邮箱容量调减的时候我看了一眼,那里大概有3900多封邮件。我当然不会全部下载,因为我知道其中很多可能是可以直接删除的,比如京东和淘宝的退款退货发货发票之类的邮件,全部都可以删掉。让我意外的是,原来邮箱的大头是Nature的文件夹。那个东西当我还读大学,还在用雅虎中国邮箱的时候,就已经订阅了。雅虎中国挂掉了以后,我就把邮箱改成了网易的免费企业邮箱,因为邮件太多,所以根本不看,以前在雅虎中国的时候我也不看,直接指定了邮件地址,然后会自动给我分类投放到某个文件夹。并且标注为已读状态,所以接收那些邮件的时候我是无感的。这一次删除的时候,这个文件夹里面的邮件可以完全不看,直接删掉,原来那里有2500多封邮件,合计占了120MB的空间。理论上一下我应该还有1400多封邮件,接下来我得一个一个减肥。最终我下载回来的邮件是548个,放在24个文件夹里,总的大小是113MB。我第1次看有3900多个邮件的时候,占了300多个MB。为什么我合计花一天的时间去下载,就是因为这也包括了我不断的筛选邮件的时间。筛选的过程中我发现好像有些邮件放的目录不太对,所以还得调整过来。

其实下载邮件的过程是挺快的,如果不是遇到那些同名邮件,速度会更快。无论是上TinyTask还是直接手抽筋去点击鼠标都很快。只要你把那个步骤搞熟练了,一切都好说。我得新建文件夹,然后保存文件,接下来开始批量操作,批量的过程中遇到重名文件,得赶紧快捷键退出手动处理。我觉得最耗费我时间的是文件下载回来了,我得在邮箱的列表界面和我的文件夹核对,是不是下载全了。但可能还是会有一些漏网之鱼,就文件数量来说不会缺,但是下载要一定时间,万一我手速太快,浏览器实际上还没下载完,那个邮件已经被我丢到回收站,然后还被我彻底删除了,这就真没得救了,我也不打算纠结自己到底有没有干这种蠢事。下载大文件的时候拼的是网速,下载小文件的时候手速太快就不行了。现在的情况是下载的绝大多数都是很小的文件。小到什么程度呢?还不到10个KB。一边下载,我一边还会把网易文件夹列表里面的邮件清空,然后删除垃圾,这样我就会看到免费企业邮箱到占用容量、邮件数量在不断下降。删除了这些邮件以后,我会把文件夹也删除掉。最后删除的状态就是里面除了通讯录,基本不含我的信息。这样的好处就是哪怕我被黑了,也黑不到什么东西,获取通讯录,知道那些邮箱地址,也难有什么作为。这样一个什么都没有的免费企业邮箱,感觉挺让人放心的。既然我已经花了那么大力气去干这种清空的事情,接下来我就更加没有欲望去网易那边申请恢复我的发件权利。以后估计我很少会用这个邮箱进行注册。其实自从从这个邮箱再也不能发件起,我也基本不用这个邮箱注册,但话说回来,之所以这样,是因为2021年以后,需要用邮箱注册的地方少了,尤其是在国内,而国外我去的时间又少了很多,不会再花发掘些什么好玩的东西了。

接下来我想做的是针对这一批本地储存的eml文件,建立一个索引。从原理上说,我感觉比较简单,但从实施的角度考虑,第一个下午我就已经遇到了一些,我以为很容易,实际上无解的问题了。

2025-05
28

小TinyTask解决大问题

By xrspook @ 8:13:00 归类于: 烂日记

再次给网易免费企业邮箱发了个工单,问上一次告诉我的操作方法的图裂的到底是什么。两天之后终于收到了回复,之所以花了两天,因为刚好卡在了周末。看没看到那个图片其实我也觉得不重要了,我猜那个图片是告诉我如何导出某封邮件,就是把那个邮件保存为eml格式。后来工单回复证实了我的猜想。

既然他们觉得只有这种方式把邮件导出,那么我就要用我的思路把邮件批量下载回来。我首先想到的是鼠标录制,可能是针对windows系统的,也可能是针对网页本身的。针对网页本身的,我觉得那些什么油猴脚本之类估计有解决方案。针对系统的,解决方案会更多,因为说白了这是一个批量鼠标操作的过程。如果这是在Excel里进行,可以理解为那就是一个VBA,录制一个鼠标的宏。一开始我用普通的搜索引擎结果,好像都不太靠谱,最后我问了一下Deepseek,发给了我好多方案,我随便就去搜了第1个方案,是一个叫做TinyTask的软件,进行鼠标录制。那个东西很小,只有三十几KB。从那个界面我感觉应该可以满足我的需求,但是当我到那个官方网站的下载页面,发现所有下载链接都指向了github的某个账号,但关键打开那个页面是404。我的第一个感觉是,会不会因为我是用中国的IP打开的呢?于是我又用了其它的方式打开,发现还是404,所以我猜可能那个账户自己主动删除了或者被删除了。说白了就是没办法从最官方网站下载这个软件了。直接搜索软件,在中国的很多下载网站有那个东西,但现在我已经不怎么相信那些玩意了,最后我在吾爱破解论坛里找到了那个东西。吾爱破解里,这个软件还有好几个版本,同一个版本也有好几个款式。有一些是以附件方式出现,需要付论坛币才能下载,有些放到了网盘,但是外链的那些网盘好像打不开,所以我就花了两个币,把那个汉化版下载回来。

经过测试,TinyTask的确能满足我的要求。因为实际上我要做到的就是打开某个邮件先保存一遍,因为我要确认批量保存的是在某个路径下。保存的步骤是下拉菜单,点击下载,保存在某个路径,然后在邮件页面点下一封。如果一切顺利,只需要三个按钮,但关键是以这种方式下载的邮件文件名是缩略版的邮件标题。邮件标题这种东西经常会重复。如果你用录屏的方式,因为出现了告诉你文件重复的弹框,等于有个乱入,会导致整个保存的过程失败。直接用邮件名作为文件名,这个行为可以理解,但难道那些让人保存邮件的人就没想过这样会让批量下载的时候出现大问题吗?他们完全是可以避免这种问题的,只要他在文件名前面加个时间。这里要说明的是不仅仅是日期,而是要精确到时间。如果不用时间就用时间戳,也能实现这个功能。有了时间戳和邮件名,基本上重复的概率很低。但显然,开发下载按钮的那个人根本没想过你要一个一个下载。甚至他们都没想过你要搬家,要把所有东西都挪走。不知道那些通过压缩包方式批量备份的邮件到底是如何避免相同文件名这个问题的。

TinyTask这个鼠标录制软件,在没有遇到相同文件名的时候是很好用的,但是你的速度不能太快,我个人感觉两倍已经是极限了,因为这是一个联网的操作。点击下载以后会弹出一个系统的路径,那个弹出是有一定延迟的,所以你的播放速度太快直接窗口没弹出鼠标就已经点了那个地方,结果是一点效果都不会有的。我的经验设置是把播放速度调为两倍,循环次数为5,邮箱页面列表显示10封邮件。这样批量操作以后,核对是否下载正确眼睛就不会那么累。

既然别人不给我活路,我就只能自己硬是开出一条路。

PS: 键鼠自动宏软件-TinyTask使用教程

2025-05
27

囤货狂

By xrspook @ 9:25:57 归类于: 烂日记

一直以来我都是个囤货爱好者。2003年是我上网的元年,那是高二升高三的暑假,家里装上了长城宽带。那个东西不能说好用,但起码能上网。上网对我来说是开启了一个未知世界的大门,可以这么说,我的世界观由此改变了很多。一开始上网,我就是个囤货爱好者。一开始囤货,倒不是因为我有那么高敏感度觉得此刻我能看到的东西可能以后就看不到了,因为各种各样的原因。一开始的时候,我不知道墙的存在,但后来这种感觉越发明显,不过之前我说的那种可能以后就看不到了,倒不是因为墙的原因,是因为把东西挂在网上,有个域名了有个服务器,这都需要钱,如果是一个私人网站,那么某一天在任何一方面不续费了,自然我之前看到了网站就会不复存在。这种事情可能会发生在一个博客上,也可能发生在一个论坛上,同时也有可能发生在一个自行建立的网站上。

一开始的我没什么技术,只会复制粘贴,但怎么把格式都粘贴过去呢?所以我想到的office,把我喜欢的网页贴到word里。所有网址也都开一个word文档收藏,这样的好处是超链接是有效的。一开始的时候,我不知道怎么编辑超链接,我只会把它贴过去。后来我知道了怎么保存网页,所以对那些没什么图片,有大量文字的东西,我选择的是保存网页。跟文字相比,一开始我存下来更多的是图片。网站是西班牙语的,如果是纯文字,我还可以复制翻译一下,但是按钮是西班牙语的,当时的OCR识别没那么好,而且他们用的是花体,估计哪怕是现在也有点难度的。链接点进去,大概差不多感受一下那到底是什么。

在那里我发现一个很大的相册。大相册里面又有很多不同的部分。最开始的时候我是挑着右键保存,后来我发现那已经满足不了我的收藏欲望,所以最终我做的是批量下载,我也不知道为什么我居然掌握了那项技能。之所以可以这样做,是因为那个相册以及相册里面的图片命名都是非常规律的,所以那个时候我就用Flashget批量下载图片。非常感谢建立那个相册的人那么规律。他们用的是数字序号。有时候某些相册里面的序号是终端,比如3就跳到5,但不影响我。如果相册里每一张图片的命名都不一样,那么就真的是好崩溃。又过了大概10年,哪怕相册里命名没有规律,每张图片都不一样的。只要缩略图和大图的命名是一致的,我依然可以通过发现规律在小图界面把大图下载回来。下载那堆东西耗费了我非常多时间,但是下载回来以后我又打开看过多少次呢?每次我感觉自己都是这样,下载的时候花很多时间,但下载回来就下载回来了,我再触碰的几率很低。文字是这样,图片是这样,后来的视频也是这样。

不知道其他人是不是也像我这样是囤货狂。

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress