2020-07
4

累死累活

By xrspook @ 23:04:56 归类于: 烂日记

折腾了一个晚上,打算关电脑睡觉了,突然想起好像今天自己的blog还没写。我把时间都耗在了什么地方呢?我正在校对其中一个老blog里的内容。

之前,我的关注点纯粹是格式的转换,先从BlogBus的XML转化为WordPress的XML,然后再从WordPress的XML转化为一篇一篇的markdown。纯粹技术的东西我已经几乎完成了,余下来的问题,需要在不断的转换之中发现,然后修正。今天我花了一个晚上搞的是校对从前那个blog导出来的内容。不知道从什么时候开始,我发现里面有些文章的正文是不存在的,是空白的,至于为什么,非常有可能是当时的文章我发布的时候其实没有成功,但是标题和其他内容已经有了,失败的纯粹只是正文。至于为什么不行,我当时也不知道。通常那些失效的文章,我都是批量手动粘贴发布的,可能是从一个网页,也可能是从一个word文档贴过去。在贴的过程中,自动带入了非常多的超文本格式,这个我之前已经吐槽过了。在格式转换过程中,我不得不费尽九牛二虎之力把那些转回来。其中那些空白的正文,这一次我想把资料填补回去。

昨天我的确好不容易找回了那些资料,也进行了填充,发现效果还不错,但是原始导出的那个BlogBus文件就不再原始了。接着,我发现那些有正文的文章其实也不完全可信,因为正文的内容不知道为什么只有一部分,不是全文。难道发布以后,我没有好好一个一个浏览过吗?还是说点发布之前,我看到的东西的确是完整的,BlogBus没有给我单篇文章字数的限制,但是实际上发布的只是部分。我的问题在于,有可能发布出去以后,我没有在前台校对一遍,但是也有可能我校对过了,当时看是没有问题的,但是当我在BlogBus后台把自己的东西导出的时候出了状况。一开始我觉得可能是我自己的问题,但后来我发现,断字断得好神奇,一个单词可能只剩下头两个字母,显然,如果是我复制错误的话,不会有这么低级的东西,顶多我会漏掉一些段落。现在搞清楚到底是我人为的错误还是BlogBus阉割了我的东西已经毫无意义。所以,我只能一篇一篇地校对文章的开头和结尾,确保是完整的。一些篇幅比较短的文章,暂时我还没发现断尾的现象,但是,对一些比较长的文章,断尾是必然的。纯文字有100K以上那些文章,通常BlogBus只留给我一半的内容,余下的那些消失了,而且还不告诉我。我记得从前选择BSP的时候,我知道有一些是对单篇文章的字数有限制的,到达一定程度以后就会告诉你,超过多少字了,请你重新修改,否则不能发布,但BlogBus没有这个限制,起码在一开始我选择他的时候没有。另一方面,我觉得之所以这样,会不会跟他们数据库的存储模式有关。如果他们数据库的某个存储单元顶多只能100K,我在那里输入了150K的文字。当然多出来的那些就不可能被保存下来,这纯粹只是我的猜测。几十上百篇文章,一个一个去检查头尾是否齐全,格式有没有乱套,这是相当累人的。虽然那些最原始的东西我还有,但绝大多数那些东西我都是保存网页的。现在那些网页已经不能在Firefox里打开了,用Chrome也不行,于是我只能使用IE,而且是兼容视图模式。我不觉得当年我用保存网页的方式把文字记录下来有什么毛病,我只是不明白为什么现在的浏览器不允许我打开那些老东西。

如果当年就有markdown这种这么神奇的东西,大概我就不需要走这么多弯路了。

2020-07
3

攻克静态blog

By xrspook @ 10:30:05 归类于: 烂日记

上周五我才开始研究静态blog。我选定的基本是hugo,因为这个东西生成网站的速度非常快。暂时我只是在本地操作。一开始的时候我不知道那个生成网站的命令窗口必须一直开着网站才能浏览,关掉的话就开不了了。之所以不了解这个,大概我还没研究过hugo的原理。之所以我在本地测试WordPress的时候可以一直开网站是因为虚拟的那个东西其实一直都常驻我的电脑。同样是本地测试,静态网站的生成速度以及网页打开速度比WordPress快非常多。如果只是几篇文章,生成网站的速度是毫秒级的,基本上就是一眨眼的功夫。昨天我测试了,生成200多篇文章的网站,也非常快,只需0.5秒。但是,如果网站有9000多篇文章呢,到底需要多长时间生成?这个我还没测试出来。因为我那9000多篇文章还没有完全符合的hugo框架的要求。

要用Hugo建立静态网站,如果是从零开始,当然很简单,按照他们的规则去写就可以了,但对我来说,我不是从零开始的,之所以用这个东西是因为生成速度快,而且可以挂在免费的空间上面。因为我的老blog很多,所以我必须要找一个这样的地方。如果我仍然使用WordPress,显然就非常浪费资源了。静态网站跟动态网站最大的区别,我觉得是静态网站不自带评论功能。几乎可以这么说,静态网站如果不外挂,是无法交流的。因为我挂的是老blog已经早就不去更新了,从前那些挂着blog的BSP都已经全部没了。我会在静态blog上留下可以交流的链接,如果有需要,访客可以找到我的blog,然后留言。这样的好处是起码你还能找到我,但坏处就是,你不能在你感兴趣的那个地方直接留言。去到我的blog还得解释你是从哪里来的,这就比较麻烦。但换个思路,我把那些已经不存在的东西重新又翻出来让你见到,其实已经很不容易了。

hugo的建站不难,但是如何把核心内容转化为hugo适配的不容易。我要把XML格式的大文档转化为一篇一边的markdown文档,这个星期我都在折腾这个。我本想直接用一个python脚本解决所有问题,因为理论上这是相当简单的操作,但是我却发现能搜索的python脚本,根本不适合我。有些已经老掉牙了,用的是python 2的版本,我试着转版本,让失败了,因为我实在不知道,里面的某些操作到底在新版本里是怎么个整法。

经历XML转化为另外一种格式的XML之后,我对XML这个东西算是有点了解了,我个人觉得输出markdown其实要比XML格式互转简单一些。XML互转只需要输出一个文件,但是markdown要生成无数个文件。python的操作之中,我最生疏的就是文件处理。输入输出那一章书我觉得自己根本没毕业。现成的python脚本无法满足我,我得自寻出路。幸好有一个叫做html2text python模块拯救了我,这个东西解决了从html到markdown的转换,所以正文最核心的东西的转化已经不成问题了,虽然里面还有一些说不准什么时候会出现的状况,但总体来说效果不错。XML的格式转化如果有一些我不想转义的东西,我还能用cdata把那些都圈起来,圈起来以后就没烦恼了,但是用markdown文件在hugo建站,必须有一个YAML的开头,而那个东西是有严格的格式限制的。篇名、分类和标签都必须严格符合这些要求。因为我的网址输出用的是python的时间戳,完全是数字,所以没烦恼,一开始的时候,文档的文件名我用的是时间加篇名,但因为片名的幺蛾子太多,所以,我选择了用纯粹的时间,单位精确到秒。如果不是手动设置过时间,不会发生重复。接下来我需要做的是整一套替换列表。把里面严格限制不让用的东西全部整理一遍。这样才能保证hugo的网站里能生成了我的全部东西,而不会有些不合规则的直接被屏蔽掉。WordPress没有这种烦恼,顶多出来的东西乱码而已,只要我把可能乱码的东西全部cdata。简直爽歪歪。之所以可以这样,是因为我把数据导入到WordPress的时候,软件默认把我不规范的东西规范化了,现在这个步骤,我完全得靠自己。

虽然现在我生成的文件还不能100%的符合hugo的要求,但从完全不会到可以生成,而且大多还是合格的,能做到这个我已经很满意。

2020-07
2

橡皮章排版文件找不到

By xrspook @ 9:09:23 归类于: 烂日记

昨晚我的一个同事过来玩我的米兔四驱越野车,因为放了太久,没电,所以要先充一下电。充电的时候,我就开始介绍我各种旁门左道的爱好,其中必不可少的就是橡皮章。橡皮章印出来的效果以及橡皮章的我都能找出来。橡皮章的设计图纸我也能找出来,但是,当我想从电脑里取出橡皮章的图片以及排版文档的时候,却发现图片在今年3月在我给坚果云减肥的时候已经删掉了。家里的电脑肯定有,但是单位的电脑的坚果云的同步文件夹上一定没有了,会不会我上传到了其他地方呢?当时,我没想出来。当我的同事玩完我的四驱车,我也把单位的数据整理好了以后。我记得那个东西我好像有上传到百度网盘,就是我在家里给坚果云减肥的那一天。的确,百度网盘,有我整个文件夹的内容,那是橡皮章的素材文件夹。但是,我无论如何都找不到橡皮章的排版文档。到底我把那个东西放到哪里去了呢?我一点印象都没有。记忆之中,我没有把我的素材图片跟我的排版文档放一起。排版文档理论上应该放在一个比较随手可得的地方,而素材则是放在另外一个地方。每次排版,我都把素材插入到文档之中,那个文档起码有10页,是一个word文件,理论上应该挺大,因为里面都是图片。有横版的有竖版的。这么大一个word文档,理论上应该很好找,但因为文档很大,所以,在我为坚果云减肥的时候,我应该也把那个东西咔嚓掉了。因为word里有很多图片,所以压缩也不能减少多少体积。但奇怪的是,在我印象之中,好像我没有删除过这么一个大文档。这个东西到底去哪里了呢?会不会从一开始我就没有把这个文档同步到坚果云里?

我是2017年7月转换科室的,那个时候我换了两次电脑。第1次换过去的那个电脑虽然是Win7,但跑起来感觉比我的老XP还要慢。所以,我先从惠普的XP换到了联想的Win7,最后再换到了现在的戴尔Win7。刻橡皮章这个习惯,我大概也是在2017年逐渐放凉的。我的习惯是在我没刻橡皮章之前,我会排版好一大堆的东西。所以非常有可能在我转换科室之前,我已经把现在手头上排版的资料全部整理好了,有可能在我转换科室以后我再也没有打开过那个文件。所以会不会是在我换电脑的时候那个东西已经丢失了呢?对我来说,这是一个非常重要的文件,为什么其它乱七八糟的都在,而这个却找不到了呢?

除了在现在的电脑上找,我也有去坚果云的回收站里找,让我惊讶的是,坚果云的回收站居然保存了我很多年以前已经删除掉的文件。为什么那些很久以前就删除掉的文件现在居然还能显示出来呢?我搞不懂。不是说坚果云的免费版本只能保存被删除一个月内的资料吗?但实际上,那里有我好几年的东西。里面的东西很多,也很杂乱,因为包括一些我手误新建出来的文件夹,还有一些新建的空文件,连名字都没改。但即便在那里,我仍然找不到自己的橡皮章排版文档。

接下来我还可以从几个方面去试着找一找。一个是去我的dropbox上面翻一翻。我已经不记得我是从什么时候开始不用dropbox的了。然后我可以把转科室后第1次用的电脑翻一翻。最后,我只能回家再找一找我的电脑。家里的电脑我用的是双硬盘,两个硬盘里都有一个坚果云的文件夹,一个有同步,而另外一个则停留在我装64位Win7的那个时候。那个硬盘的数据我没有删掉,因为里面有个32位的Win7。如果这些地方都找不到的话。大概,我就只能靠着现存的纸质排版,然后用那些橡皮章的素材,重新在排版一个文档。

我一直觉得我把自己的资料保存得很好,但这次是在让我太揪心了。

2020-07
1

神经质

By xrspook @ 15:47:09 归类于: 烂日记

从前我很讨厌月末出现在周末,但现在我发现,原来出现在工作日的月末更加讨厌。当然,如果月末出现在星期天,我星期一要上班,那是最讨厌的。上个月的月末就出现在周二。我总感觉这个星期很太漫长,因为虽然是周二,但实际上已经上了三天的班。实在搞不懂为什么一定要拼凑那些所谓的小长假,与其要拼凑出来,不如直接不放。其实以现在的状况,多放一天的公众假期也没什么问题。如果每个小长假都这样,肯定不行,但如果三天的小长假直接放假,不调休,5天以上的调休,这个我觉得还可以接受。为什么我会觉得连续上三天的班很累?首先因为这三天里其中一个是月末,一大堆的事情都堆在月末,另外一个是我们单位自找的麻烦。每个月我们都得去5个地方监管,一个月至少去一回。一个月有30天左右,但是却偏偏等到最后几天才安排去。这样就非常被动,因为要去的不是一两个人,而是起码4个人。月末这种东西对财务来说是很烦恼的,也忙得要死,在这个时候抽人实在是一个非常糟糕的决定。明明每个月除了第一周和最后一周以外中间还有两周,从两周的时间里抽出两天去5个点一点问题都没有,但偏偏他们总是喜欢把那两天堆砌在最后一个星期,甚至是一个月的最后两天。

我觉得从前的自己没有那么神经质,月头要交的报表我会在第1天之内完成,绝对不会拖到第2天才交上去,但现在我已经神经质到要在月末的那一天就搞定所有,然后在月初的第1天的一上班就拿去签名,解决所有步骤。这样就意味着我不可能不加班。单位的业务从来不会管你到底是月头还是月末,也不会管你那到底是不是假期。所以就像这个6月的月末,白天没什么作业,但是在下午6点以后却开始装船,装一条不到1000吨的船,到了晚上10点多。通常来说这条船应该只涉及一个仓房,但实际上这条船要调用两个仓房的粮食,于是我就非常被动。即便我把其它所有东西都搞定了,但是这个数确定不下来,最后我的报表以及账本就无法完工。我的神经质迫使着我得等到他们作业完成,然后先搞定当天的数,接着再把月度的数也搞出来。从理论上说,也就是两个数据的变动,无伤大雅,但实际上,大数是由小数构成的,是牵一发则动全身的道理。对我来说无所谓小,对我来说,只有有变动更无变动的区别。我根本不可能奢望他们在月末最后一天少安排作业,尤其是不安排在下午5点以后作业,这是不可能的。不知道从什么时候开始,我就已经意识到,这个问题。如果有大船来,情况会更糟糕,他们会作业到晚上11点,那么我就得等到11点过后才能有全套的数据。为什么我要这么逼迫自己呢?我也不知道。大概我觉得我逼迫了自己以后,我赢得的是属于我自己的时间,我赢得是别人的无可挑剔。我不过是在他们不工作的时间仍然在工作而已。

一个月神经质起码得神经质一次。

2020-06
30

原来是这样的

By xrspook @ 9:28:18 归类于: 烂日记

小时候我从来不觉得,自己家有多穷,但长大以后,当我看到很多不穷的东西以后,我才发现,原来我家真的不富裕。在我记忆之中,我们一家三口从来没试过去住宿一晚或以上的旅游。直到Dangal在中国上映之前,我们一家三口从来没有去电影院看过电影。爸爸妈妈也没有带我去过东方乐园又或者长隆的任何一个游乐场。我还是个小学生的时候,他们曾经有一次带我去过童心路的儿童反斗城,但就只有那么一次。在那之前,我不知道去那个地方是烧钱的。进去不用门票,但每一个机动游戏都需要游戏币,那些都是花钱买的。这等于是玩一个游戏就得花好几块钱。虽然如果游戏玩得好,会吐出很多纸币,然后用那些纸币你就可以换奖品。小时候我总羡慕别的孩子可以去那个地方玩,我不记得为什么那一次爸妈会带我去。在玩游戏方面,我从小到大都是个渣,所以那一次,我只换了一套文具和一个公仔。文具已经不知去向,但公仔还在我的书柜里。当时那个地方叫做儿童活动中心。大概也正是因为路口有这么一个东西,所以那条才叫做童心路吧。

不带我去这里玩去那里玩,大概是因为我爸妈是晚婚晚育的典范。我10来岁的时候,他们已经是中年以上的人了,从前我并不觉得自己的爸妈跟其他人的父母有什么不一样,但现在我有点明白到为什么我做的很多事貌似都要比我的同龄人成熟。因为我的长辈,我的父母,就年龄来说几乎可以成为我的某些同龄人的爷爷奶奶了。在我生活的圈子里,年轻的长辈根本是不存在的。他们不会在我面前做很傻很天真的事,因为他们早已过了那个年纪。跟我爸妈类似,我的亲戚年纪都挺大,而我的表哥表姐们跟我差不多,当时仍是未成年人。于是最终我得出了一个结论,在我的世界里,根本就没有一个很傻很天真的影子。看到现在的一些年轻父母。有些甚至还没毕业就已经生出了孩子,他们仍然只是个孩子但却已经是一个生命的爸妈。他们仍然每天都因为各种玩乐搞到半夜才睡觉,甚至还没有一个稳定的收入养活自己。自己尚且养不活,居然已经有一个小生命需要他们培育。这对我来说是根本不能接受的。怎么可能允许这种事情发生呢?!但可以肯定的是,年轻的父母可以陪着孩子一起玩,而不会像我这样,在我应该玩的时候,爸妈不可能是我的玩伴,他们已经没有那个玩的心了。从前我说不准我的人生到底少了些什么。现在我好像有点明白了,但这已经补不回来了。时光飞逝,我也已经错过了那个最青春最好玩的年纪。现在如果我结婚生孩子的话,结果可能跟我妈生下我的时候差不多。于是也就可以理解,为什么我妈养我的时候,可以如此的沉着冷静,可以如此的睿智,而不会像某些母亲那样,做出一些违反逻辑的事情。

我无法选择父母在什么年纪什么环境下把我生下,但我觉得,自己已经很走运了。

© 2004 - 2020 我的天 | Theme by xrspook | Power by WordPress