2018-12
13

改进

By xrspook @ 10:14:35 归类于: 烂日记

总是抱怨别人这里不好那里不好,其实不如抱怨自己,到需要采集数据的时候我才发现自己的一些设置不完善。有些数据需要聚合,有些数据需要拆分。到底如何把握那个度,至今我仍没有一个确切的答案,把数据聚合起来的确可以让我省事。有些要拆分的东西如果不把那分开,根本没把得到一个正确的答案,但是如果把数据拆分得太多,到聚合的时候你又真的是不知道该如何下手了。规则是我定的,但当我自己整理的时候也发现问题,理论上这个东西可以通过设计好正确的逻辑去避免,但问题是,连我自己都说不清,我怎么能要求别人做出我需要的效果呢。今年的数据收集我基本沿用的是去年的方法,但明年我会对数据进行一些增加或者减少一些不必要的工作量,完全就不需要一再重复了,这样可以减少我每天处理基础数据的时间,而在一些没办法通过基础数据整合出来的东西,我必须用更详细的方法记录下来。今年让我很麻烦的那些拆分与整合的数据,是因为今年一开始的时候我一直没有做好收集工作,而是过了大半年以后我才开始着手慢慢找回来。虽然这样也行,但是数据多的时候自然就会默认产生惰性,批量生产的时候人难免会犯错,那个错误到底在哪里,你又实在是说不清。

我觉得最应该改变的是我要把正在使用的Office系统换掉,从2003换成2016,因为在数据查询方面,2016加的某些功能是2003无论如何都做不到的。比如说数据的不聚合功能,通过那样的方法可以轻松地对文字进行数据透视,但2003的数据透视表就只能把所有信息用数字的方式表达。明明可以通过窗口界面进行的外部数据联合查询,但是在2003里就只能使用脚本编写,虽然也能达到类似的功能,但显然这有点繁琐,而且必须小心翼翼,稍有差错就没有然后了。2016很早我就想换掉了,但是我需要使用的电脑是我家里那台跟我单位工作的这一台。该怎么说服领导让他给我买正版软件呢?或许别人会说用WPS不行吗?显然,Office跟WPS不是一回事,差太远了!专业的人不会用WPS,因为那只是一个高仿,核心的东西他们永远放不完全。2016这个东西貌似网上没有一个完美的破解版。几乎所有破解的版本最后只能过一段时间就去注册一次,才可以让软件继续使用。与其这么麻烦,不如直接买正版。半年之前,到处都可以买到2016的正版,但现在,微软官方商城的价格被提到非常高,而其它我知道有卖正版的地方貌似都已经不卖了,至于为什么,是因为微软在推他们的Office365。他们希望你每年都为软件给钱,而不是一次性地把软件的使用权买断。这样的话他们就可以一直赚钱,同时也保证了你可以一直使用他们的更新服务,让你的软件随时保持最新版本。对联网的人来说是完全没有问题,但是,在中国这种特殊的国情之下,有些时候,我们的网络真的不怎么好,虽然理论上的网速很快,但实际上让人很着急。使用盗版软件是我们一向的作风,使用正版软件还是得每年都给钱,这会让人有点难以接受。我个人觉得给钱买服务这完全是可以的,但估计我的领导不这么认为。虽然,只要我提出要求,估计他们会允许我在这方面每年都投入几百块钱买正版软件。别人不会向他提这个要求,因为他们的工作不会迫切地需要用到这个。这也是我跟他们很不一样的地方。但同时我也会遇到这么一个问题,领导会不会说你找一找有没有破解版本,那么就可以省下一笔钱了。虽然即便那笔钱省下来了,还是不会到我的口袋里去。既然付得起钱,为什么要用盗版软件呢?破解版某些功能是憋足的,你得到完整的售后服务,何必呢。

我需要变好就必须改变,要改变就必须得思考总结。

2018-11
30

旋风图

By xrspook @ 9:55:37 归类于: 烂日记

我看过无数次,怎么用Office 2016或者2013制作旋风图。但昨天是我第一次用Office 2003做那个图。理论上,都可以做到,因为利用的最基础的图表是柱形图,但当你真的要做的时候,会发现一搜索铺天盖地都是2007以上的版本,于是你就很纳闷,因为在2003的版本里面你找不到他们所说的那些按钮。在某一个网页里,我终于找到了应该是2003的版本,因为从那个配色看来,是那么回事,但实际上那里说的那些东西又好像大概只能把我引导到门口,最后那一步无论如何都进入不了。之所以会发生这种事,是因为他们加入了辅助列,直接把数据从正数变成了负数。理论上我觉得这个是没有必要的,因为这只是把轴顺畅地变成负数,最后通过修改数据的显示方式,把负数再变成正数,挺折腾的。

在中午吃饭之前,我已经差不多成功了,最后那一步,还没摸索到,当我吃完饭回去以后发现,原来就只差一步,把最小值设置为。主坐标轴或者次坐标轴的,最大值相反数就行,而且把Y轴与X轴相交于0。这样的做法就等于把主坐标轴跟次坐标轴都扩大到可以容下反向坐标轴。第一次做出这个的时候,我非常高兴,但马上我发现问题了,因为我把图例放在靠上的位置,但是坐标轴的颜色跟图例的颜色刚好相反了,于是我就重新改一次主坐标轴和次坐标轴。我觉得最容易改的估计是图例的显示顺序,但我不知道为什么我会选择把坐标轴折腾一遍。大概只有通过这样才能会让我加深记忆。我曾经试过把Y轴的标签放在两个坐标轴之间,这样理论上跟美观,但实际上会造成左右两个坐标轴的单位长度不一致。虽然X轴的标签我是不会再放的了,但你看两边柱状图的具体数据还是会有问题,之所以这样,大概是因为我只在一侧为了对称好看不断地增加空间。

有人试过做两个柱状图,然后把它一起显示。左右柱状图,再加中间一个图表构成了三联的旋风图。我觉得这样做有点多余。标签不放在中间放在一侧也没什么问题。我需要做旋风图数据左右两侧的最大值不一致,一个只有3万多,一个超过5万。也正是因为这样,所以我在设定坐标轴最小值的时候就必须有所取舍,而不像网上的例子那样,两边都是一样的值就OK了。因为网上的例子大多是用百分比只显示,最大值也就只有1,所以不会遇到我这么多的问题,但我觉得,第一次做这种东西遇到很多问题是件好事,下次再做这个图的时候任何版本的Office我都不会再彷徨了。如果不做旋风图,其实我完全可以做一个堆积柱状图,但如果把这两种图对比的话,显然旋风图更牛逼。不过话说回来,如果里面包含的数据不只是两个,而是多个,还是做堆积柱状图比较合理。

什么样的数据选择什么样的图标是一个学问,如果你经验丰富,你可以不加思索就选择出靠谱的,但如果你只是个新手,或许你真得用一下Office 2016的那个推荐图表,因为他们会很清楚地告诉你应该用什么图,这个图有什么优势,你不应该用什么图,那个图会会有什么问题。那个软件不只是让你能完成任务,而且还会教你如何应对问题。

每年的统计分析都是一个斗智斗勇的过程,其间学到的很多东西让我觉得很有趣,虽然过程有点折腾有点虐。

2018-11
29

Excel做图

By xrspook @ 10:05:16 归类于: 烂日记

昨天一整天我都沉浸在写统计分析之中,很多图我都没做,而只是看了个大概然后就继续写下去,但因为没有图,写出来的东西当然肯定会缺少点什么。之所以不做图,一个原因是Office 2003做出来的图相比于2016的的确有点丑,我想用笔记本的2016做图。第二个原因是,实际上我统计的那个数据还有最后的一些还没有出来,所以有些数据还不能确切地定下来。Word里的图通常我都是从Excel里面直接粘贴图片过去,没有确切的数据贴过去的图,当然也就肯定得被替换掉。这次的统计分析我觉得我写得好像有点单调,因为我用的基本都是直方图,以前我没想过要大量使用这个,以前我用得最多的是柱形图。而这次之所以用直方图而不用柱状图是因为我不想把具体的数据全部罗列出来。对读者来说,他们没必要知道我们的仓号有哪些,我们的客户有哪些。一定程度上,把数据太明细地反映出来就有点暴露我们的信息。他们真没必要知道全部,所以我就选择了直方图,用统计频率的方式来体现效果。

Office 2003的方直图不出现在插入图表那里,而是在数据分析里面的。那个功能出来的东西有点复杂,我摸索了一阵才知道我要的到底是什么。直方图是个很牛逼的东西。但现在我就只是用它体现个频率分布。一直以来我都说要学习一些专业一点的统计,但实际上这一年下来我几乎没看过那种书。因为我不知道,当然我就没想出要用什么方法去表现我的东西,所以基本上我就从头到尾都在搞直方图。在某个数据表达上,我想用树状图,出来的效果很惊艳,但是也很浪费空间,而且表达出来的数据如果不加上鼠标,没办法体现全部。如果那单色打印在白纸上面,效果会更糟糕。我用了一个直方图和一个直方图图,外加一个柱状图才表达出一个堆积柱状图的东西,为什么我要浪费那么多的空间做了三个图呢?!我觉得Office 2016的树状图和旭日图是非常牛逼的存在,但实际上出来的效果并不好,因为如果数据一边倒,那些代表数量很低的东西根本没办法体现,于是那反而不如传统的饼图,又或者是我一直用得很多的柱状图。

这次的统计分析里的表格我用了三线表,这貌似是我第一次自己新建我自己的表格形式。之前,我只是一直都在套用最普通的表格。三线表是科技论文里必备的东西,让我觉得很奇怪的是我正在使用的Office 2003版本里面居然没有三线表。在我记忆之中,那应该是存在的,而且那个表是绿色的线条,但我找了半天都没找到,所以干脆自己做了一个黑色线条的。我知道Office 2016里可以做树状图,但是昨天我找半天都没找到,最后发现原因是我打开的那个工作簿是2003建立的xls文件,当我把工作簿另存为xlsx或者xlsb等高级的形式后,插入图表那里就出现了树状图和旭日图。如果xlsb里面没有2016创建的图表,而只是有数据,2003可以通过添加插件转换文件的方式打开并编辑那个东西,但是如果在2016里面插入过图表,再用2003打开这个文件的时候就会显示转换失败无法打开。所以最终虽然2003的图有点丑,但我还是全部选择使用2003画图。因为这是我第一次使用2016做图表,格式设置真的要找很久。下一次当我把手头使用的所有电脑都换成2016的时候。大概我才会真的放弃用2003来做图。

为了把事情认真做好,任何时候我们都得把心操碎。

2018-11
24

开始学习Excel VBA

By xrspook @ 20:18:50 归类于: 烂日记

昨天按照约定,我开始看Excel VBA的书,一开始我看的是实体书,那是以Office 2013为基础的,但是我手头上的Office是2003,所以在找某些功能的时候,会让我很抓狂,虽然最终也能找到,但显然那个工具的说法已经不一样了。所以我在电脑上也打开了kindle版的同一本书,而电子版的那本书是以Office 2003为基础的。的确,在找某些功能的时候是更简单的,但是那本电子书即便我是在23寸的显示屏上打开,里面的图片还是无法放大,还是会模糊。如果那只是一个运动动作,模糊也无所谓,因为能辨别的出来,但是那是Excel,看不清会很让人抓狂,但是那些东西还可以忍一忍。然后我就开始继续以电子书为主体开看。有些地方貌似有点难理解,于是我又打开了实体书,结果发现之所以电子书难以理解是因为实体书比电子书直接多出了两个章节介绍一些基础功能,而这些东西都是非常的有用的。一开始看书的时候,我已经发现虽然新旧版本的书都是ExcelHome的人做出来的,但是显然基于2013的那本书更有趣更直观更容易理解。我说的这些功能是基于他们在展述某些用途的时候,他们讲实例的时候没差多少,但是基于2013的版本在某些语句的书写上适应性会更强些,虽然那个句子相比2003的会长了一点。两本书理论上说的是一样的东西,但却被我偶尔发现原来有这样的差距以后,我觉得我还是得主要看那本实体书。

我是一个Excel控,也是一个编程控,两个东西我都喜欢。因为我有很强的控制欲,因为我很想用某些编程语言实现我懒惰的目标。明明我只是做了一些非常简单的事,但当那些语言真的运行成功的时候,又会给我很大的成就感。记得从前学习C语言的时候,我也有这种感觉。用各种语言写网站的前台或后台的时候,我也会有这种感觉。编写规则,然后让那些转化出很神奇高效的东西,虽然那个套路已经非常成熟,但我还是会觉得好神奇好强大。不是人人都喜欢做这种事,尤其是女生,我也不知道为什么别人不喜欢,反正这对我来说就像学会了某些绝招一样。我知道,当我把编程和Excel结合起来的时候,我将非常大程度地优化我的工作。不仅可以大量减少我的工作时间和工作强度,也会让我的工作精准度进一步提升,然后我就不再需要把注意力用在反复重复同一个步骤上面,而可以把注意力放在发现更多规则上面。几乎可以这么说,我的同事从来不会在这方面投入,他们也会去学习,有些是为了考各种证书,有些是为了赚钱。所以他们会去上各种网课,也会看各种教你赚钱的书。归根到底,他们的目标都离不开钱,但我貌似有点不一样,我只想把工作做得更好,至于更好以后能不能顺带挣到更多的钱,这个我从来没去考虑。如果我不能高效工作,我哪来时间去学习更多呢?!这也正是我一直都推崇的理念——要留有余地,才能有更进一步的发展。

奥林匹克精神——更高,更快,更强。

———————————————-华丽的分割线———————————————-

做事做全套,爽歪歪~

Thugs of Hindostan幕后制作花絮合集,全部13个!!!(故事部分10个,歌舞部分3个):

01、2018-10-09 – 【中文字幕】TOH幕后制作花絮 – 第一章 造船记
02、2018-10-10 – 【中文字幕】TOH幕后制作花絮 – 第二章 在船上拍摄
03、2018-10-11 – 【中文字幕】TOH幕后制作花絮 – 第三章 毁船记
04、2018-10-20 – 【中文字幕】TOH幕后制作花絮 – 第四章 习武记
05、2018-10-29 – 【中文字幕】TOH幕后制作花絮 – 第五章 服装篇
06、2018-11-05 – 【中文字幕】TOH幕后制作花絮 – 第六章 在泰国拍摄
07、2018-11-06 – 【中文字幕】TOH幕后制作花絮 – 第七章 传奇联盟
08、2018-11-07 – 【中文字幕】TOH幕后制作花絮 – 第八章 在拉贾斯坦邦拍摄
09、2018-11-07 – 【中文字幕】TOH幕后制作花絮 – 第九章 认识库达巴
10、2018-11-24 – 【中文字幕】TOH幕后制作花絮 – 第十章 认识费兰吉
11、2018-10-17 – 【中文字幕】歌舞Vashmalle 幕后制作花絮 – TOH
12、2018-10-25 – 【中文字幕】歌舞Suraiyya 幕后制作花絮 – TOH
13、2018-11-03 – 【中文字幕】歌舞Manzoor-e-Khuda 幕后制作花絮 – TOH

2018-11
19

xls变xlsb

By xrspook @ 10:24:57 归类于: 烂日记

这个月我突然发现一个很惊恐的现象,我的坚果云的1GB免费上传流量几乎爆掉了,为什么会这样呢?这一个月下来,米叔的东西是有点多,但是我整个文件夹都只有不到300MB,不可能会发生这种情况,而我每天都进行更新的就只有单位的统计数据的东西了。理论上坚果云是增量同步的,所以如果是同一个文件,我在里面新增了东西就同步那些,旧的东西不会再给我同步,但实际上,周末经过两天的观察,我发现情况不是这样的。每天我都会增加十几MB的上传数据,但显然我每天都加进去的东西不可能那么多,每天我加进去的东西顶多几MB而已。为什么会有几倍甚至十几倍的差别呢?昨天晚上我终于发现了原因!因为实际上它并没有传说中的那么神奇,坚果云直接把我更新过的文件重新上传覆盖上去了,不管那个文件里面之前有没有我已经存储过的内容。于是呢,这就让我比较惊恐了,因为我每天都要更新的文件里面有几个文件是MB级的,最大的那个甚至接近9MB,如果每天我都要更新数据,更新的文件达到15MB也就没什么奇怪的了。以每天15MB计算,一个月30天,即便我什么东西都不往里面添,450MB是跑走不掉。我该怎么解决这个问题呢?

这些数据文件绝大多数都是Excel数据表,我用的系统是Office 2003,所以文件是xls。以前我就发现用2007以上的xlsx更大大能节省空间,至于为什么我不知道。之所以仍然选择老版本,一定程度是因为我觉得用的习惯,而另一方面是因为我也曾经试过用Office 2013或者2016,结果发现他们的数据透视表有严重的绝对引用问题。我不知道那个东西在经过一轮又一轮的升级以后有没有得到改善,但显然我今年早几个月做测试的时候,那还相当糟糕,出来的东西完全不是我想要的。幸好那是年头,我只是改了几个数据表而已。据说这是因为xlsx看上去是一个Excel文件,但实际上是一个压缩文件,核心是xml所以它的体积要比传统的xls小起码一半,尤其是但文件里有缓存数据库的时候。xml不是微软自己的东西,有人曾经调侃,在2007版本以上出现的那个xml的绝对引用问题是临时工搞出来的,微软还没有完全吃透那个东西,就把它用在数据里面了。但是,据说如果用的是xlsb,就没有那个烦恼,虽然那个跟xlsx是同一代的产品,但是xlsb是微软自创的二进制的数据表,所以没那么多毛病。用xls保存文件大小是8.5MB,如果用x1sx,大小是二点多,如果用xlsb。文件就只需要一点多。这就意味着,那个东西能做到接近八倍的压缩,所以,如果平时我每天有15MB的数据量,经过这么一压缩,就会只剩下几个MB而已,一个月下来,那些东西顶多200MB就包住了。之前我一直觉得没什么问题是因为单位的数据量远远没有现在这么多,而另外一个情况是我一直很相信坚果云,我觉得xls是很普通的文件,增量同步应该没什么问题的,但显然,他们只是检测了文件有没有变化,如果有变化就整个换掉。到底什么文件上他们才可以做到增量同步呢?难道只能是txt文件吗?如果那样的话就实在太恐怖了。我还要测试一下在新版本的Office 2016环境下,是不是真的用xlsb就没有绝对引用的问题。xlsb对使用office软件的人一点问题都没有,但是如果对方使用的是WPS,非常有可能他们就打不开文件了。之所以这样是因为之前已经说过,那是微软自创的二进制模式,WPS没办法攻克这个也很正常。如果真的这样,我也就只能把只是我自己使用的文件转格式,而发给别人的文件还是用原来的样子。

之前我从来没试过坚果云单月超上传流量,但现在单位的数据真的把我逼上绝路了。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress