2020-07
17

为什么慢

By xrspook @ 8:53:45 归类于: 烂日记

要把9000多篇文章,准确来说,是9498篇文章生成一个静态网站实在太难了。如果只是几天,哪怕是几百天,放在哪里,用什么表达,都不成问题,无论是哪个编程语言都可以做到,只是快慢有所不同而已。到现在为止,我已经试过三种编程语言了,首先是go,然后新都javascript,最后是python。

go对应的是hugo,hugo的建站速度是最快的,但快的代价就是电脑的所有性能都会被用到极限。生成网站的时候,CPU飞到顶,内存一直往上走,最后当我看到内存到达90%以上,CPU的使用率反而下降,说明已经到顶了。因为我在做建站服务器测试,那些虚拟的东西全部都放在内存里,显然,我8GB内存的小电脑没办法在某些模板之下,hold住这9000多篇东西,但并不是所有hugo的模板都做不到,有些简单的模板可以做到。另外一些,别说9000多,一两千,都很困难。具体反映出来的效果就是建站的时间很长,其次是内存封顶,结束时间遥遥无期。

第二快的是python。python是我的老熟人了。而生成静态网站,我用的是mkdocs。这是一个python脚本,但实际上脚本自己又调用了很多东西。所以你以为你只是装一个脚本就完事,但实际上你得连串装一堆脚本。只有几个markdown文件的时候,mkdocs建站是很快的,但没到达hugo那种秒杀的地步,但是就建站构成来说最简单的。初始化以后,会自动生成了一个配置文件和一个文件夹,你把markdown文件放到文件夹,然后建站,就可以看到网站的雏形,虽然那个效果肯定不是你想要的。配置文件只有一个,所以也没什么好让你发挥的地方。正是因为够简单,所以我觉得,对那些纯粹写作的人来说,而且,是纯粹写书的人来说,mkdocs这个东西要比hugo实在。但其中一个不友好的地方是mkdocs自带的搜索对中文不友好。搜索英文的时候杠杠的,但是中文就无能为力。如果丢进去mkdocs的文件非常多,到达几百几千的时候。你会很崩溃,跟hugo不一样,mkdocs的CPU的使用率永远只耗尽我其中一个CPU,所以CPU的使用率永远只是25%,至于内存,貌似我一直都没有看到变化有多大。生成一个几页的网站,需要几秒,生成一个200多页的网站,需要十几秒。但是生成一个2000多页的网站,却需要1000多秒。为什么会有这种指数式的增长呢?我觉得跟他们的搜索索引有关。总的来说我觉得gitbook和mkdocs的思路类似。他们会建立一个json文件。而那个东西我感觉就像是一个字典。之所以能自带站内搜索,就是因为他们建立了这个东西。读取写入其它文件,再怎么慢,也有个限度,而且是匀速的,但是如果要不断的增加字典内容,把新的文件内容全部写入到json里,然后存起来,这就很变态。思路很简单,但执行起来的时候相当费劲。

其中一个让其更加费劲的地方在于,但markdown文件非常多,就肯定有一个不断打开文件关闭文件的操作,还得递归某个文件夹里面的所有东西,想想都知道这有多累。但如果有个大文件,全部都已经结合在一起的话,就没有这个烦恼。之所以我有这种感觉,是因为之前我写了一个脚本,专门用来输出9498篇文章的标题与文件名,作用是造一个目录。当时我没有把脚本输出文件的代码缩进,结果仅仅输出目录,居然需要20多秒。目录很小,但是运行时间却跟我把全部内容都输出一样过。昨天我才发现缩进的问题,那就意味着每次增加内容,文件都打开写一遍。这就意味着那个文件被反复的打开关闭9000多次。紧紧减少一个缩进,等于把写入的次数从9000多变成1,于是那个运行时间就缩短为了6秒。读取一个二十几MB的XML文件并输出目录仅仅需要6秒。可想而知,如果不是频繁打开关闭9000多个markdown文件,而是直接用完整的一个大XML文件生成json,速度会相当快。那不就是跟字典类似的东西吗,简单到没朋友。如果我不想进行全文搜索,我只需要进行标题搜索,事情会变得更简单。简单到跟我生成那个目录没啥区别。

经过了这一番折腾以后,让我明白到明细数据与汇总数据使用起来真的很不一样,虽然就总量来说,二者是等价的。

接下来,或许,我真的会像网友所说,自己写一个脚本,把已经进行wordpress标准格式化的XML转为一个静态网站。

天下大势,分久必合,合久必分。这次我算是深切体会到了。

2019-03
1

对自己负责

By xrspook @ 10:52:05 归类于: 烂日记

当我看到一个视频,我的第一个反应会是我要不要做翻译。当然,这里的视频肯定是有特指的,因为我知道那些东西估计不会有人做翻译。这里我说的是估计,至于有没有我不知道,我也没兴趣去探求,别人做我也做也没关系。这是我对自己的考验。至于别人做成怎么样,我不关心。我只需要做最好的自己。至于出来的那个结果能不能超越我以前所做的,我也不去考虑,毕竟视频是不一样的,内容不一样,表达的方式也不相同。不是同一个东西。,无法很客观地评价好还是不好。但有一点是可以判定的,我有没有尽全力去努力的做好它。当我开始干的时候,我会希望自己快点。因为如果东西放时间长了,新的意义就荡然无存了,那便成了旧闻。别人看过了其它版本再看我的,会感觉怪怪的,就像我做完自己的东西再去看别人的。有些地方我可能会觉得他们做得比我好,但有些地方我会不自觉地有一些不屑反应。但这东西着急也没用,我的确想快点,但实际上当你专心的时候,那些都会抛到九霄云外。

我知道自己是个丢三落四的人,所以我只能接受自己不得不一次又一次修改和压制,甚至上传完以后还得继续两三次重复。我觉得视频翻译校对压制上传的过程,对我来说就像一门考试,但是这门考试的评卷人不是其他人,而是我自己。即便已经上传完毕,我的脑子里会依然会想着那个视频,在不自觉的时候,自己还会挑里面的刺。跑步的时候肯定会想,走路吃饭洗澡的时候也会想。准确来说是只要我脑子有空闲,我就会不自觉想。但那种想是无意识的,我不能像播放器那样可以把整个片子播一遍,我没有那个记忆力,但是里面的某些句子我会突然觉得是不是用别的说法会更好。如果发现里面的某些句子,之前理解错了,又或者有更好的表达方式,我会修改字幕文件,重新压制视频。去年之前,还没有人能帮助我减少这种一次又一次的重复工作,但去年我认识了个朋友,他的确能减轻我这方面的神经质。虽然有别人的帮助,但最后判定要不要重来的还是我自己。一方面我没有对自己做什么非常明确的要求,但另一方面,其实我对自己非常严格。这种严格体现在我不能容忍自己目空自己已经知道的错误。还是学生的时候,老师一再强调我们不能有侥幸心理,觉得这道题我不会做考试就不会考,所以希望能蒙过去。当时的我也想不蒙过去,但我实在没有那么多时间和精力又或者有个大神来指点我让我不在那些问题上面有困惑。当我自己能掌控一切之后,如果某个东西我不懂,我一定会搞到懂为止。如果那个东西做不好,我会反复练,直到能做出我期待的效果。但有些时候就是做不到的期待的样子,因为我的目标设置有问题。那个时候,我会重新审视是不是其实那个终极目标是不可行的。我遇到过这种事,当时我在优化网站,发现某些需要做的步骤是我根本没办法做的,所以那一步优化只能跳过。那是主机的问题,那是服务商的问题,我们购买的那个服务不能实现那个功能。

如果可以重来,可能我的学生生涯会变得优秀点。但我跟其他人一样,一天只有24个小时,让我变得优秀的前提是我得付出比别人多很多,在有限的时间和精力下,我真的能做到吗?

2018-10
30

By xrspook @ 9:38:50 归类于: 烂日记

昨天在上班时间,我只有加起来不到半个小时的空闲可以摸鱼,而其它时候我都要马不停蹄。这种事情极少发生,准确来说,应该是我很久都没有进入过这种状态。之所以这样是因为我把往后几天要做的事能提前解决的全部都前置。显然那些东西全部都等到11月1号再做就会非常麻烦。需要清点数量的单据非常多,需要打印的账本也很多,而且那些账本还是手动录入的。昨天打印的时候我会发现有一些低级的文字错误,显然那是因为我疯狂地复制粘贴,完全没看。如果这些事情是每个月都做,不会发生。问题是昨天我做的那些东西,有部分是补全从前的内容。补一大堆以前东西的时候就非常容易复制粘贴过度。我觉得今明两天我还需要理清思路,我要知道还有多少东西可以前置,而不能前置的那些东西工作量有多少,我可能得花多少时间去完成。平时月头月尾这些东西该发生的时候就会发生。延后一两天没什么问题,但是这个月的东西我必须在下个月一号当天搞定,因为只有那天搞定了,往后我才可以有空余时间做检查,发现错误。

我不需要别人帮我检查,我也懒得帮别人检查。对有些人来说,这是非常不可理解的。情况就像双11上面的各种优惠经常会让你分享给朋友,然后让朋友给你点赞。你为我点赞,我也为你点赞,我很烦这种事。我宁愿不要那种优惠。之所以这样,大概是我人脉不广,从来我就是一个很宅的人。从小的教育的确有互相帮助这一条,但是这种事叫互相帮助吗?互相点赞是个无底深渊。回到工作的话题,我帮你检查账本,你帮我检查账本,也是一个无底深渊。我帮你检查的时候,我肯定要先去了解你的那些填写规则,但你帮我检查的时候,天知道你到底有没有用心去翻一翻。当人足够自信的时候,就应该做到我做出来的东西,可以随便让你检查,且找不到任何的问题。

小时候我非常担心出错这种事,因为无论测验考试里我把数学题检查多少次,还是不能拿到满分。要在数学这门课上拿满分,对我来说简直就是个奇迹。从前家长教了我非常多的检查方法,但是粗心大意还是无法避免。为什么背诵语文或者听写英语单词就不会发生这种事,但数学却永远会这样呢?后来我发现我经常性、习惯性的计算错误跟我在计算的时候字体太潦草、自己都识别不出来有关。我自己都看不清那个是什么数字?往后的计算又怎么可能百分百正确呢?我不知道我的同学为什么可以算得那么快,我也想快,但是一写得快,字体就变样,最终连我自己也分不清那到底是什么。如果当初我知道这个问题的原因,大概我需要练习的是快速写数字,又或者在计算的时候不要在乎那个速度,应该把字体写工整。我也说不准当时是不是因为我的书写速度赶不上我的大脑运转。现在我还是会犯低级错误,但现在我会用各种方法去核对验证,保证出来的东西没有原则性问题。虽然表格上有审核人那三个字,也需要某个人去签名,但实际上审核人这种事是形同虚设的,出了什么问题,最终还是那个制表人担所有责任。既然,我在做这份工作,我就必须接受这份工作的风险。有些时候的确会让你感觉有些难受,但是你也可以把那当作是寻求刺激。

把痛苦当作是酸爽。

2018-05
12

高铁速度

By xrspook @ 20:09:47 归类于: 烂日记

今天下午搭公交车回家的时候,我跟我妈推荐了我翻译的《古拉姆》。这件事我琢磨了很久,一直不确定应该以什么方式跟她说,虽然我确信我肯定是要说的。米叔90年代的电影,可能有人会更喜欢《印度拉贾》,但是我却钟情于《古拉姆》。如果现在再看,我不确定我会不会改变主意,但是把《古拉姆》看了一遍又一遍以后,我对那部电影越看越喜欢。虽然看多了那种感觉会跟第一次看的时候有一点点区别,因为你发现的东西会越来越多,不知道是被故意整出来、还是不小心带进去的东西都会被我看到。看到以后自然就会引发各种莫名其妙的思考。这种东西其实没有必要,但是那完全是条件反射、自发形成,控制不住。反正呢,那部电影我就已经放到我妈电脑里了,至于她什么时候看,那是她的问题。

近期我觉得,真的是有点,疯掉了,先是校对《忠肝义胆》,然后是翻译、校对《古拉姆》,刚刚整了一个下午《地球上的星星》的导演解说,然后就突然切入了Dangal的幕后制作花絮完整版。那个完整版是45分钟的,是蓝光光盘的彩蛋部分,讲述的是整部电影是如何制作的。我觉得基本上每一部印度电影的光盘都有这个部分。问题只是他们以什么方式体现出来。因为Dangal上映前已经发布了很多几分钟一个的小视频,那些其实也是幕后花絮的部分,所以我不确定这部电影结束以后,还会不会有一个其它版本的整出来,又或者只是把之前的那些拼合起来。在看到这个45分钟的版本之前,我还在猜想这会不会是一个只是把之前那些小视频剪接出来的东西呢?如果那样的话,我也得把我的字幕剪接一下。想想都觉得这很疯狂。但后来我发现,这完全是一个独立性的东西,虽然内容跟之前见过的那些,有点雷同,但大部分都是没见过的,又或者是以另外一种说法体现出来的。UTV是在2018-05-03,在他们的油管帐号发布这个视频,而且他们对这个视频进行了国别限制,印度以外的观众无法观看,所以尽管尝试过很多很多手段以后,我终于把视频下载了回来,但我还是没办法知道到底他们有没有给这个视频配上外挂的字幕。机缘巧合之下,我发现B站在一年多前就已经有人上传了一模一样的视频,但那个视频是内嵌的英文字幕的,上面也写得很清楚,是蓝光光盘的部分。之前我还在纳闷,该怎么为这个视频做中文字幕,因为里面说的绝大部分都是印地语,能听懂的英文可能只有20%,余下的就只能连蒙带猜。我基本上已经放弃了把这个做成熟肉。但又因为我居然见到了有内嵌英文字幕的版本,所以我就立马开工做翻译做时间轴。到今天为止,我已经完成翻译,也把轴搞上去了。因为这是一个介绍视频,每个人物都有各种定位标签,那个东西今天我也都整了。余下部分就是无数次的校对和修改。让我觉得有点气愤的是既然那么久以前已经有人上传了那个有内嵌英文字幕的版本,为什么就没人去做翻译呢?这不是几天几个月的事情,而是过去了一年了!同时我也有点责怪自己,为什么过去了一年,我都不知道原来有这个东西存在呢!我这个粉丝真的粉得太不专业了。在有点憋气又有点生气的混合作用力之下,三天之内,我就把那大体搞出来了,45分钟的视频,我整了接近840条字幕。这是挺疯狂的,因为《古拉姆》一部2小时42分钟的电影,字幕才1400多条。而之所以这样,因为这个幕后制作花絮里面的人所说的话语速真的很快,而且在变换各种场景的时候几乎是秒切,没有任何的过渡。已经不记得当年做《地球上的星星》的幕后制作花絮视频的中文翻译以及校对用了多长时间,所有加起来,估计有两个多月吧。但现在,我可能在一周之内就完成Dangal的。在过去这几年里,我所经历的实在是让我自己都觉得很惊讶。

是生活逼迫着我们非进步不可。

2017-05
26

RUN NOTE

By xrspook @ 23:59:38 归类于: RUN NOTE

星期五 2017-05-26 18:59
平均心率153,最高心率175,平均配速534。今天明显给我的感觉是冲刺跑的时候貌似我知道怎么把大腿抬得更高了,一般跑的时候不知道有没有起作用。让髋部的活动范围更大,让股二头肌的能力更强能从跑步效率上让我得到提升。最后1K我觉得略吃力,感觉跑不了更快了,但从时间上看,其实已经很不错。#xrspook未行够#

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress