2020-07
9

状况连连

By xrspook @ 10:35:47 归类于: 烂日记

你永远都不知道纠结的路上会出什么状况。一路平坦不好玩,5分钟就能所有问题,那是无聊的节奏。老blog的重新上线是我近段时间一直在纠结的东西。要做的事情很多,应该如何开展?做这些事的步骤应该是怎样的?谁轻谁重?

首先我做的是处理blog的核心——内容。文字我是有的,我有大把大把,但里面也有非常多连我自己都说不上到底是什么的东西。有可能长文被阉割了,但我自己毫不知情,有可能是消息从其它网站上复制粘贴过来了,带入了一些我根本没有意识到的乱七八糟代码,不同网站连换行都不一样。有些是“br”,有些是“br/”,有些是“br /”,有些是“BR”,有些是“BR/”,仅仅是“b,r,/,空格”的排列组合就有多得你想不出的效果。如果这在HTML里,都不是问题,但我做静态blog的第一步是从html到markdown,该死的“strong”在html2text的脚本里是不允许期间有换行的,在这个脚本里,连续两个br就能自动匹配正路的p,但如果遇到稀奇古怪的“/”和空格呢?在我的python转码脚本里,我用了很多行去处理那些排列组合的问题,正则的、非正则的替换用了好多遍,所以脚本运行速度只可能在我一次又一次的增加新规则之后变得越来越慢。理论上,这些东西都是不存在,但事实就是这么残忍。除了html的问题,还有yaml以及文件名字符要求的问题。转义字符出现就丑陋了。丑陋归丑陋,字符不对,那是直接编译不出来的节奏。出状况这种事简直不计其数。我也不知道自己到底改了多少个版本,理论上脚本修改这种事我应该放在坚果云文件夹里进行,但因为我生成数据的文件夹和我的脚本文件夹一致,显然那就太消耗同步流量了,所以我大胆地把脚本放在了坚果云以外修改,那是一个错手就没得救的玩命。其实我完全可以把输出的文件夹设置在坚果云以外的地方,但我就是没有这么干。要把BlogBus和点点的数据匹配为WordPress的格式,然后再用WordPress格式的数据转化为markdown。为什么我要有WordPress这个步骤呢?起码但我学会了XML到另一个XML的规律后,不静态blog的时候我还能退回WordPress,虽然那意味着我导入数据的时间将是个天文数字。没经历过这些纠结,我就不会深切体会到好好码字,不要不规范乱写的重要性。从前,尤其是一开始在BlogBus写blog的时候,我总把网上看到的东西直接复制到编辑器里,这样过于简单的操作让我付出了非常多整理的代价。后来的点点几乎没有这种问题,现在我更加是极少会直接复制粘贴网上的东西到我的blog里发布,即便有时会截取一段,基本上都是保证无格式纯文本的。现在我知道了,但当时我不知道,成长是需要付出代价的。我仅仅是在处理自己的东西,所有坑都是我从前挖下的。如果我是被迫要帮别人擦屁股,估计我早就把那个人诅咒死几万年了。

内容基本确定下来后,一开始我觉得应该不会太难的静态blog主题原来也不好找。首先是样式得对上眼,其次是渲染速度要快。有些主题连单机渲染都会让我的电脑崩溃掉,连测试都无能,真的是什么都不用说了。我几乎得出一个结论,如果某个主题大于5MB,基本上无需考虑了,那些10MB左右的,更加会让我电脑宕机。不是人人都会遇到这种事,宕机与否的测试基于我需要渲染的文章有接近3900篇,不是人人都有这样的体量,这还是建立在我已经放弃了6100多篇图片内容已经失效,光文字意义不大的文章上。

内容好了,主题好了,还得考虑把网站托管在哪里。要免费,要速度快,要可以绑域名,要服务器稳定。对一个女人,对一个习惯于货比三家的人,这实在又是一个大纠结啊啊啊。

2020-06
23

做到了

By xrspook @ 10:27:38 归类于: 烂日记

昨天我终于用python写出了把点点转化为WordPress的脚本。这个东西我确信是可行的,因为python的转换过程中没有出错,这就证明没有遇到奇怪的事情。用别人脚本的时候,把转换好的文件上传到WordPress,我总会担心不成功,但我自己写的脚本,我知道该注意些什么,哪些参数是现在的WordPress必须要求有的,所以只要python的转换不出错,我的WordPress导入就不会有问题。因为点点的文章有9000多篇,要从后台管理界面导入到WordPress,会非常耗时间。如果一篇文章需要两秒,完全导入就需要5个多小时,所以我没有做这种事。我挑选出22篇,各个类型都有的,试验导入,结果非常成功,网页的效果也很好,完全按照我的意思生成了。我觉得如果要快速解决问题,估计我得在数据库端导入。之前把文章导入到WordPress,因为要尝试不同的版本,我得不断地导入删除,但删除的文章太多的时候,速度很慢。后来我暴力地在数据库那里直接写删除语句,结果秒杀就完成了。现在我发现了一个更干净的方法。直接把关联WordPress的数据库里的内容全部删掉,这也是一个秒杀的过程,而且绝对不会留下任何的手尾,比如文章删除了,但是分类和标签仍然在那里。可能某些东西已经不存在了,但是计数还停留在一个很大数值,之所以这样,肯定是因为我删除文章的时候不够艺术。与其让里面留那么多乱七八糟的东西,还不如直接把数据库清空。因为我这是单机上的WordPress,我纯粹只是用来测试。这样的删除是最快捷的。大概我从上周,才突然领悟出可以这样。别人之所以要在数据库里写语句删除文章或者标签,是因为不能删掉一些不应该删掉的东西,但我没有这个顾虑。既然在数据库层面可以快速的删除,那么理论上也应该可以从数据库层面快速的导入。之所以有这个想法,是因为我发现WordPress的插件有些是针对数据库的,有些是针对WordPress自带函数的,数据库层面的查询要自带函数快非常多。现在我已经学会了转换适配后台界面导入的文件格式转换。下一步大概我得学习一下如何在数据库层面进行导入。这么高端的做法,貌似之前我还没有听说过。在网站迁移的时候,的确是把数据库打包,然后重新放到别的地方的,但那个数据库是本来就已经存在的。从一个地方挪到另外一个地方,原封不动地,但是我却要把大量的数据以快速的方式导入到数据库,并且还得按照WordPress的脾性建立各种关联,显然这貌是非常不简单,但理论上应该可以做到。

我不知道我的python到底学成怎样了,但起码我可以用那个东西实现我自己的愿望。相比于书本的习题,我觉得实现自己的愿望更有成就感,虽然其中有很多问题完全只能靠自己,没有参考答案。虽然总的来说,脚本不是我一个人写的,我是站在巨人的肩膀上修改而成,但BlogBus和点点的结构还是有差异的。最幸运的是某些我不知道该用什么手段实现的东西前人已经给我指明了方向。昨天我只是把脚本写出来了,接下来我要把脚本优化,一些老是翻来覆去说的句子完全可以把那作为自定义函数。到底什么东西应该泛化,应该泛化到什么程度,这个我还没有想好。昨天之所以可以这么迅速地完成任务,大概是因为在我开始之前先做了个思维导图,明确了我到底要做些什么。基础数据有哪些,应该在哪里取数,需要判断的参数有哪些,各自的参数有什么特性,能不能合并同类项。之前我就写过类似的东西,但是跟思维导图比起来,之前我写的那个真的很水。有思维导图、有专业的思维导图软件,人的思路可以非常快地展开。整体定下来,下面的事情就只剩下一步一步地实现。我做梦也没想到,自己这次居然这么高效。某些我没有把握能快速解决好的问题,昨天不知道为什么很多都迎刃而解了。转换一个30多MB的XML文件,我用了16秒。转换出来的文件大小为22MB。我觉得应该可以更快,但怎么才能更快呢?文件里的数据结构是我没有考虑过的,我是不是应该从那里入手?一些相同的判断,大概我应该做一些合并。

追求更好是没有尽头的。

2012-11
6

盼头都逃跑了

By xrspook @ 17:37:15 归类于: 烂日记

我的反应比较迟钝,刚才不小心门夹手指了,首先是感觉到手被夹到,过了大概2秒,痛才出现,于是,我的那句SH*T甚至比我的痛感来得还要早。大痛是那么一下子的,然后疼痛越来越弱,最后变成刺痛而已。现在,如果我不是在敲键盘的话估计已经感觉不到痛了,但那是中指,用得比较频繁,所以还是会有略像酸痛的效果。

旅游归来,一切都貌似不容易,我不过是到山沟里4天而已,却仿佛发生了天翻地覆的改变。

首先是,能上网,能如此快速的下载,这简直是恩赐啊,我实在没什么可抱怨的了。

其次,2012-11-02开始点点停止了自定义模板的使用,跳回的原始模板一团糟,于是我不得不换了一个官方模板。当初选择点点很重要的一个原因是它的模板非常自由,但现在,点点的长处没了,而我,剩下10天就是DIR的一周年,头已经洗湿,没有任何其它办法了,忍耐吧。我一直很讨厌D,所以要我加入那个组织?直接给我氰化钾算了。我会尽力做一个好人,一个上进的青年,但我绝不承认我所做的一切是为了某组织。每次都抽风,每次都有不同花样的神经质。若要人不知,除非己莫为。贪污腐败是公开的秘密,装逼呢这是!

今天发现我卓越的WWE Encyclopedia (Second Edition) [精装]订单被取消了。之前这是预售到,但昨天开始这变成了缺货。在我的订单列表里,昨天还有这个商品的,不过没定发货时间而已,但今天,没有了,再看看我的电子帐户,钱已经退回给我的银行卡。囧!这是我11月期待之一呢!米国阿马逊这书还在预售,预计发行时间是2012-11-19。我都在卓越定了半个月了,我不在乎再等那么一个月,但现在把钱退给我,我表示很桑心。

生活的盼头啊~~~ 没有WWE百科全书2,没有小米2,泪奔~~~

昨天下午上班前几分钟回到单位,一整个下午和晚上都在往DIR里补东西,接近30篇的内容啊!日积月累,水滴石穿,这些东西靠恶补,真的会很累。

离传说中的1112还有5天!

2012-10
22

狂刷,我也很累

By xrspook @ 17:42:47 归类于: 烂日记

连续2个小时+都在做筛选,ctrl+c,ctrl+v,排序,关键词我也很累。在收集战报的时候告诉自己,这是最累的了,但起码,1个小时内我可以把官方战报和非官方战报都收集完,最累的其实是贴图!如果,我不在乎图片的顺序和描述的话,我不会那么累,但我不是那种明明发现问题都任由其存在的人,所以,我很累,两种战报加起来需要1小时,官图贴图又需要一小时。当最后我把25篇东西都发布并自动推到围脖的时候,看到的人都傻眼了,甚至会马上有把我屏蔽了的欲望,任何人都会觉得,我绝对是在犯傻!罪该万死!!!

好吧,如果你们喜欢这么评价,fine,谁叫我是heel,虽然我知道我自己所作的事的价值所在,但我不会觉得我做了错事不该被责怪。

在最后刷出25篇之前,我已经奋战了2个小时!

谁会在乎坏人做坏事其实也要付出努力呢?whatever,自己问心无愧就好。

当好人累死累活后他们还能给自己一句安慰的话“因为我要拯救世界”!但坏人呢?坏人到底要用什么样的心态去面对屡次被好人KO呢?这种换位思考真有趣。

再怎么累,我也没想过要放弃,为什么要放弃呢?总有完成的时候,每天刷一个月的会累,减少数量不就OK了,又或者提高每天扔进去的时间那么就可以快点结束这恐怖生活。

没有战胜不了的坎。

2012-10
11

链接页上线

By xrspook @ 17:57:28 归类于: 烂日记

按照计划,今天我总算作出了这个——DESTINY IS REAL的链接页

就是一个直白的资料收集页面。直接采用“标题+空格+地址”的方式,我完全可以把地址都超链接到标题,但我宁愿用这种比较丑陋的方式。这么丑陋完全不是因为我懒,因为这样做其实和做超链接一般麻烦,甚至可以说更麻烦,而且会因为某些太长的标题或地址显得很不和谐,但这是最经典的,我不想复杂,技术含量是要有,但我不想通过这样体现出来。

另外一个改进是把DESTINY IS REAL的导航栏一律换为2个字的项目。这主要是考虑到位置不够,太长了真心弄不下,除非我分两行。现在全部都2个字了,划一靠谱。外国人看不懂,让他们猜去吧,其实,如果是懂规矩的,看看我的网址应该明白是怎么回事了。我不可能满足所有人的需求。

这么做出来我不是为了增加神马外链神马浏览量,那都是浮云。我只是为了很自私地方便自己,当我不使用自己电脑的时候也能轻松地访问我平时访问的资源。点点的网站之所以一直都保持活跃更新就是因为我一直像爬虫一样一直关注那些地方。我一直在做人肉网页爬虫,囧。

有时我会问自己,我为什么可以如此神经质地坚持,为什么人家的兴趣都是一波一波阶段性的,而我却可以一直处于高峰值的兴奋状态,这到底为什么?如果我还是个学生,估计我没办法保证这个,但现在,我却很幸运地可以一直都抽出这么多的时间,奇迹一般。

希望这种状态可以一直持续下去。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress