2025-11
10

AI的瞎扯

By xrspook @ 8:13:57 归类于: 烂日记

我一直都觉得新手的运气,这个说法非常对,因为从我的经验看来的确就是这么回事。

今年的统计分析我想有所突破,想从以前的可视化跟分析更进一步,又或者准确地来说,从以前一般的可视化分析上更进一步。我需要做一些专业判定的统计分析,但是要做什么统计分析、怎么去做?在我的本科课程里,只略微说到,并没有详细铺开。我的老师在那里略微说的时候,实际上我没有完全搞懂到底什么意思。理论上如果我还继续读研究生,还继续读我这个专业,硕士的课程里就有科学统计。我觉得那个东西无论是在我的专业还是在其他的专业都是通用的。

这一次当我和数据不断打交道之后发现分析方法的确就那些,但经典的科学统计分析方法尤其是针对检验类重复性检验的那些,跟我现在需要处理的那些数据很不一样,数据的数量以及形态很不一样。

比如说如果那是某个实验数据,通过多次重复、通过不同因素排列组合得出来的结果可以直接用那些经典的分析方法套用,最经典的那个是方差分析。方差分析后,还可以针对不同的组合进行进一步的两两分析,最后得出结论。那些分析最终通过查表,直接给出某个值的范围是什么样,给出是一个什么定性结果。但貌似在我记忆之中,20年前老师好像没给我着重说明不同的分析方法的前置条件各自是什么。比如方差分析的前置条件是默认不同组别的数据数据量相等、方差接近、每组数据都应该符合正态分布。符合正态分布,但是方差不相同,会用另外的方法。如果方差跟正态分布都不满足,就只能用非参数的分析方法。所以折腾了一大轮以后,我发现我的数据如果真要较真,只能用非参数的方法。这些是在我折腾了一圈以后才发现的。如果一开始我就有系统地学过科学统计,显然我就不会绕这个弯路,但如果我真没学过,我又能怎么办呢?

当我把两组数据经过脱敏以后交给Deepseek,它滔滔不绝地给蹦出一大堆东西。光看那些文字,你觉得那真的是头头是道,但关键是懂行的人一开始就知道那有毛病。情况就好像是两个人再进行讨论,其中有一个说,月经周期通常是28天,±7天都是合理的,月经量大概是多少,持续时间大概是多少,月经期间会有什么生理反应,可以做什么措施避免那些不良的感受。噼里啪啦说了一大堆,但他报告结束报告之后,发现原来他们需要讨论的对象不是女人,而是老年男性。所以之前那堆关于月经的东西全部都一无是处,可以说是牛头不对马嘴。但你光看那堆东西,又不觉得有什么问题。我觉得Deepseek给我的感觉就是这样,我不知道其它AI怎么样,之所以有这种感受,是因为当我把那组脱敏的数据给Deepseek以后,它给我做了一大通的方差分析和基于方差分析的两两对比,但是当我真的纠结结果以及执行过程的时候,却发现好像我那组数据根本不应该拿去做方差分析。

由此可见,AI牛逼起来的时候真的好厉害,但也不排除它只是在和你瞎扯。

2025-11
9

又想起了Python

By xrspook @ 8:44:06 归类于: 烂日记

大概两年前,我买了一本叫《超简单 用Python让Excel飞起来》的书。那本书是怎么买的呢?我搜索关于Python跟Excel的书,然后就看到了它。说白了就是教你用Python去处理Excel。前面的部分是一些批处理,后面的那些是利用Excel的数据作图。批处理的部分我看得挺认真,也实际操作过。感觉基本上都是可以实现的,我在VSCode里写Python,然后引用Excel文件,最后把结果输出到Excel。的确,这样干可以批处理一些基本的问题,但关键是我是个完美主义者,所以我对输出格式有一定的要求,实际上这本书教你的东西不怎么包括具体调整格式本身。通常来说做法大概是读取文件,然后通过pandas处理,最后输出。在这里我学得比较认真的部分是批处理文件,无论是把一个工作簿的每个工作表分别另存为单独的工作簿还是把某个文件夹里面的工作簿全部都合并到一个工作簿里。这些翻来覆去的操作其中一个跑不掉的是要进行一定的循环,循环的思路搞清楚了以后一切都好说。学的时候很认真,也都全部尝试过了,但一段时间之后不用还是会全部都忘光光,最后剩下的只是知道一定可以通过批处理实现这些功能。

在电脑里面安装Python,然后通过这种方式的确是可以处理Excel文件,后来我也进一步对那些输出的文件进行了格式控制,但总的来说,还是有些不如人意的地方。就数据处理本身来说,Python没有任何问题,但关键是跟VBA这个原生的东西相比,在处理格式方面还是显得有点有心无力,又或者无法控制。一个很明显的地方就在于跟VBA相比,Python读取文件跟输出文件都得一定时间,可能数据处理本身不需要多少性能,但关键是打开文件关闭文件这都需要时间。后来机缘巧合之下,我知道了在VBA里可以通过ADO的方式用SQL解决数据的问题。ADO的方式意味着我并不需要真的打开文件,这样就节省了很多时间。以至于后来我用VBA取代了Python的功能,因为Python之所以好用是因为把Excel的数据传进去了以后,它对数据进行了一个类似数据库的标准化改造,然后用标准的语言实现某些功能。相比之下我觉得SQL更简单易懂。所以自从迷上了ADO+SQL以后,我基本上就没再用Python处理Excel了。我一直也没有进行太多高端的操作。可以肯定的是,如果我要做的话,实现同样的功能,我可以通过这两种途径分别得出方案。

回到一开始那本书,前面部分说的是一些批处理,后面部分说的是用Python作图,其实那个时候我并不明白为什么要用Python作图,因为Excel本来就可以作图,而且就控制来说Excel是可视化的,Python全部都得写上去,所以后面作图的部分我看得很潦草,直接快速掠过,只是知道能干这种事而已。

直到这一次数据分析需要做箱形图。Excel可以做箱形图,但对箱形图的控制不如人意,我想到了Python,也想到了R语言。我知道这两个东西通过某些包就可以轻松做出我想得到或者想不到的图。

R语言被我放下了太远,以至于我已经基本不知道该如何操作了,所以我选择先用Python探索一下作图。

2025-11
8

Excel里的箱形图

By xrspook @ 8:17:33 归类于: 烂日记

不知道哪一次Microsoft 365升级以后,Excel的图表里面就多了一个箱形图。在做一些我一开始没什么头绪的图之前,我都会选择数据,然后让Excel给我推荐一下图表,我从来没有试过被推荐箱形图。我只是知道那个东西的存在。同时我也没有在Excel相关的公众号的推送里面看到过箱形图的使用方式。或许他们是有推送的,只是我越来越懒惰,忽略掉了,但我之所以会忽略掉另外一个很重要的原因,可能是他们有推送,但是推送的频率不高,而那些不高的频率又刚刚被我因为这样那样的错过了,所以我一直没看到。这个忽略掉其实也不完全怪我,微信也是一个很重要的因素,因为现在的公众号的信息不会全部展开,除了第1篇会展示以外,余下的那些就只会说还有一篇还有两篇,不手动点开根本看不到,所以万一箱形图的推送出现在那个地方,当然就很容易被我忽略掉。不知道为什么微信要做这样的设置,其实手指多划两下没什么问题,又或者我觉得微信可以让用户自行选择到底要不要展开。更精细化的管理可能是对这个公众号不折叠,对那个公众号只显示首篇。这种分类方讨论的方式就像是正常的群显示聊天条数和那些忽略的群只给一个红点。

只要你有一组数据,你就可以做出箱形图,因为它是根据最小值两个四分位数中位数以及最大值组成的。简单来说这个可以把一组数据浓缩成万物皆有的几个数,然后你就可以把它们放在一起作图或者分析,我感觉无论是箱形图还是小提琴图,都是一个可视化分析数据的工具,能更直观地看到数据的情况。跟箱形图相比,小提琴图还多了一个数据密度的展示。如果离散性很好的话,小提琴图显然更妙,但如果本来就不怎么符合正态分布,也就没必要做小提琴图了。

以前的Excel不能直接做出箱形图,大家只能做堆积柱状图,然后进行加工,得出类似箱形图的东西,但据说从Office 2021开始就有了这个功能,但是有些人说他们的版本里有,但有些人说他们的版本里没有,我猜这会不会跟家庭版和专业版的区别有关,又或者有些人进行了更新,但有些人选择永不更新?

虽然现在的Microsoft 365里面可以做箱形图,制图方式也很简单,但是跟其他图表比起来,箱形图的各种设置感觉都是怪怪的。无论是字体、字体大小、标题、坐标轴等等对其它图来说很好控制很容易实现的功能搞箱形图的时候都很奇怪感觉很别扭。其中一个让无数通过Excel直接做这个图的人感到很无奈的是理论上做箱形图的时候,第一行是标题,余下的那些行是数据,数据可以是同样大小的也可以是不同大小的。按照大家的理解,数据是通过箱体现的,第一行的标题应该就是X轴上的标签,但实际上无论你怎么操作。现在直接出来的箱形图那里的X轴标签都是1。搜索一下就发现很多人都遇到这个问题,貌似我只在一个地方看到了可能的解决方案,首先你把那个1去掉,然后插入图例,选择在底部展示。这样的话,上面的那些箱算是终于有了标签,虽然那个标签估计不会跟那个箱体完全对位。这个思路太诡异了,设计Excel箱形图的人怎么会想出这么离谱的事情。为什么在Excel里这个图可以直接生成,但实际上效果却这么的糟糕呢?同样让我无法理解的就是我无法控制几个箱之间的距离或者是箱体的宽度。高度是由数据本身决定的,但箱体的宽度,理论上用户可以自行设定。但貌似就没有一个直观的方式让你好好操控。那种感觉跟浪潮开发的软件有异曲同工之妙,功能有了,但好不好用我不管。

箱形图是数据分析里一个非常经典的可视化表达方式。Excel不能很好满足我的要求,我只能用其它方式实现。

2025-11
7

戴尔显示器的USB拓展口

By xrspook @ 8:12:46 归类于: 烂日记

把办公室的联想显示器换为旧的那个戴尔显示器以后,键鼠不能唤醒,又或者是显示器拓展口无法供电的问题彻底没有了,于是我继续可以愉快的把键盘和鼠标都插在戴尔显示器的拓展口上。那个显示器一共有4个USB拓展口。除了键鼠以外,我还插了一个无线网卡。最后一个拓展口我没有插东西,以前那个口插了条短的USB延长线,有了那个的话,我就可以轻松地把U盘插上去读取,又或者连接我那个用得很少,但是需要使用的针式打印机。近期我发现可能那条线拔插次数过多有点问题,比如当我把小米手环4的充电线插上以后,会有时有反应,有时没反应。小米手环的充电线本来就有点神经,所以当我一开始遇到那种情况的时候,我不以为然,后来我把佳明FR255的充电线插上去的时候也发现会有那个问题,基本可以确定那条延长线可能不太行了,供电点问题。但是当我用那个连接针式打印机,好像又从来没出过状况,所以可能供电有问题,但数据传输问题还不算很明显。

在折腾联想显示器的时候,我把一个线比较短的USB拓展口直接插到了主机的前面板。搬办公室之前我已经是这么操作的,换了办公室之后,我曾经试过把那个插在显示器的拓展口,但因为联想显示器神经,所以我改变了那个策略。现在的针式打印机我不需要再连接显示器的拓展口,因为我在主机后面连了一条很长的USB延长线。那个延长线基本上是针式打印机标配的,所以使用率很低,之所以不把针式打印机直接连在主机后面板是因为我感觉这样就会占用一个USB口,没有必要,我那个延长线虽然绝大多数情况下都是为针式打印机服务,但或许还有一些零星情况。

办公室的戴尔显示器三个USB口是朝下的,一个是朝后的。朝下的那个三个互不干扰,朝后的那个,其实我也不知道为什么要这样。显然就拔插难易来说,朝后的那个更容易,但是因为在后面,你不可能把手在后面盲插,所以如果你真的要插的话,你得走到后面再插,但如果显示器是靠墙的,走到后面这就有点难了,把手伸到后面要插准不容易,唯一的解决方式是搞一条延长线,但如果搞一条延长线,插在后面跟插在朝下的那个口又有什么区别呢?现在朝后的那个口,我插的是一个有天线的无线网卡。无线网卡插在后面跟插在下面的区别很大。如果我插在下面就会影响其他USB线,但插在后面单独插一个,而且有开阔的空间,一切都显得非常合理,但我估计这个显示器设计出来的时候。无线网卡、蓝牙收发器之类的东西还没有流行起来。

家里的戴尔显示器跟单位的戴尔显示器样子看上去差不多,它们的菜单也差不多。USB被放在了能源选项里,但是USB那个项目是灰色不可调节的。大概这就Deepseek说惠普戴尔这些商用的品牌会对显示器拓展口的供电有比较全面的关照。他们会默认设置即便屏幕关闭也给USB拓展口供电,或者他们把这个拓展口的供电以及数据传输进行了比较独立的设定,不受屏幕关闭或者睡眠的影响。

工作以后,单位配的两台主机,第一个是惠普的,第二个是戴尔的,两个都是经典的商用品牌,我感觉都挺耐用的,但后来的品牌机都是联想,没有对比就没有伤害。

2025-11
6

全部USB口都不通电了

By xrspook @ 8:15:41 归类于: 烂日记

在联想显示器上设置永远允许USB依然无法让拓展口在关闭屏幕的状态下持续通电持续传输数据。几乎可以这么说,这直接判了这个显示器的死刑。貌似除了在win10的系统里面设置从不关闭屏幕,否则当把键鼠插在显示器的USB拓展口,想利用键鼠唤醒是不可能的。为什么联想显示器的设置界面有这么个选项但默认是关闭的呢?在尝试过开启依然无效之后,我感觉这是不是因为显示器的系统是统一的,但实际上功能有效与否很难说,也就是说非常有可能那个设置只是一个摆设,但也有可能这不是摆设,因为我的主机是戴尔,我老板的主机是联想。进行了同样的设置以后,我老板没有唤醒的问题,她的键鼠都插在显示器的拓展口上,但我的有问题。这又进一步证明联想和戴尔之间水土不服。到了这个地步,摆在我面前的只有两个选项,要不换回从前的戴尔显示器,要不在系统上设置从不关闭屏幕。

在最后妥协之前,我确认短按主机开关能唤醒屏幕,但是键鼠依然不通电的时候,我拿了另外一个键盘过来。把它插在连接主机的USB延长线上,或者直接插在主机的USB口上,让我惊讶的是,无论插在哪里,键盘都没有点亮。这意味着不仅仅是显示器的USB口不通电,甚至导致了我整个主板的usb口都不通电。为什么我说整个呢?因为USB延长线是插在主板后面的插口的,直接插在主机上的那个USB口是主机前面板的。当我把这个联想显示器设置为永远允许USB,在系统30分钟无操作之后关闭屏幕之后,显示器的USB口不供电,主板的USB口也不供电的问题。告诉Deepseek以后,它觉得这是一个更深层次的硬件问题,需要在BIOS层面排查。到这一步我就觉得很崩溃了。简单来说就是哪怕我的键鼠直接插在主机上,只要我的系统设置为屏幕自动关闭,那么在我系统自动锁定以后,我依然无法唤醒这个系统。在这种情况下,之前用一个外接电源的拓展口连接键鼠的方案也直接宣告无效。

这真的是戴尔电脑BIOS层面的问题吗?为什么以前就没有这个问题呢?为什么联想显示器拓展口USB通电与否居然会影响到整个主板的USB供电呢?理论上它们是相互独立的。

该做的我都做了,可以做的尝试我也都尝试过了,最后的结论就是联想跟戴尔有不共戴天之仇。我只好铁了心,把联想显示器还回去,把我之前的戴尔显示器拿回来。幸好我那个戴尔显示器还没被分配,所以我还能轻松地把它要回来,但即便那个戴尔显示器我要不回来,科室里还有一个同款的戴尔显示器。所以最坏的只是我要不回之前我用的显示器,要换一个戴尔显示器而已,但就功能而言,理论上毫无差别。

另外一个让我决心换掉联想显示器的原因是好长一段时间,我用的都是23.4寸的显示器,关键分辨率是1920*1280,而联想显示器是27寸的,好像是个2K显示器。对我这种人到中年老花的用户来说,用最高的分辨率,用100%的比例,我看得很辛苦。所以我得把它调成125%的比例,但这样的话,有些东西可以变大,有些不行,比如我的谷歌输入法图标就无法变大。一些可以变大的应用,实际上出来的效果又跟原装100%不一样,比如在Excel表格里,某些列以前是可以完全显示的,当显示器分辨率高了,我又用125%显示的时候,那些列就变成了N个#。

硬件方面实在无能为力,软件方面当我把显示器换上去试用的时候,我就已经感觉别扭,所以最终的结果就是辛辛苦苦30年一夜回到解放前。

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress