2020-07
24

分类管理

By xrspook @ 9:22:41 归类于: 烂日记

越是整理数据,越是觉得挺奇葩的。还记得一开始的时候,BlogBus只有分类,没有标签,后来多了标签,但分类没了,强迫把我们的分类全部变成标签。后来分类回来了,标签依然有,但分类只能选一个,标签可以好多个。这样的设计纠结了好长时间才终于确定了下来。后来当我用上WordPress以后,发现原来人家分类和标签都可以同时多个,但因为BlogBus的使用习惯,所以分类通常我只会选一个,而标签会搞一大堆。这是因为blog上的使用习惯,所以我在文件归档的时候也会用分类和标签,我的默认设置继续是分类只有一个,标签有一堆,用python的思路去解释就是某个文件跟某个分类是一一对应的,它们可以形成字典的关系。某个文件和某串标签是一对多的,如果要用字典表话。那堆标签得用列表去表达,于是在文件一开始的时候,就得引入特殊的字典模块。我也不知道为什么必须得有个分类。如果没有分类,全部都只有标签呢?其实也说得过去。文件完全按照时间排序。如果时间一样的话,就按照不同的文件号排序,因为文件号这种东西也是有一定的命名规律的。至于用什么关键词找到这个文件,则可以通过标签,所以其实我觉得标签和关键词是非常类似的东西。

当我在进行动态blog数据转为静态网站以后,我有点明白到。分类就像是定义一个人的一级目录。有些人的blog分类的命名非常有意思。对我来说,那肯定是花了很多心思才终于想出来的,对别人来说或许不这样。要快速定义一个人的话,用分类基本上就可以了。标签通常体现的是某个人的各种特征。标签使用的多少跟这个人的性格和特点很有关系。标签云是一种非常有用的东西,通过不同的颜色以及不同字体的大小就能体现出标签出现的频率,从而反映出这个人的特点。分类这种东西,像是自我介绍,是努力想出来,把自己介绍给别人的,而标签更像是无意之中积累回来的东西。我不知道别人的blog情况会怎样,基本上我的blog的分类是废掉的,因为绝大多数文章都被分类到烂日记,因为我的习惯是一天至少要有一篇日记,而烂日记每天也顶多只有一篇,如果大于这个数的话,我就会用其他分类。从前当我还非常勤快的时候,还有其他分类,但现在,每天一篇日记算是保底,也是封顶。只有一些非常特殊的时候,我才会有两篇或者以上的日志。从前的我,那些多于一篇的日志类型五花八门,而现在也就只有当我心血来潮的时候才会来一些,而通常,那都是专注于某个领域的。对我来说,分类能代表些什么呢?那只能代表过去我曾经做过的某些事。真能体现我个人特点的,只有标签云。到底我用过多少个标签呢?我实在记不清楚了,因为WordPress是个神经病的存在,有些标签我输入了,但是有错别字,我删掉了,但那居然也会保存下来。即便我没有按保存按钮,而有些时候,我真的敲错别字了,但是自己毫不知情。那个错误的标签也保留下来。一篇文章我会输入多个标签。基本上,想到什么相关就会往里面写,所以标签可能一大串,也正是因为这样,各种标签都会出现,所以只出现一次的标签在我的blog里,概率很高。于是就造成了一个比较搞笑的局面,我的分类是严重偏科的,而我的标签是海量的。如果某一天我要把这些东西选进我比较简洁的目录,我该怎么选择呢?标签肯定是不行的,但分类也很奇怪。所以大概那个时候,我就只能用日期做归档了,又或者选择用得最多的10个标签。

静态blog很伟大,但我觉得,我的东西、我过去16年的生活没那么容易在一个静态blog里全部展现出来。因为连我自己都说不清,那到底有多少东西。

2020-07
23

停不下来的狂

By xrspook @ 10:11:36 归类于: 烂日记

我觉得自己很喜欢做自己跟自己较劲的事,哪怕那些事对别人来说可能根本不值一提,但也正是因为我是那种一旦进入就完全控制不住的人,所以开始了某个让我沉迷的项目以后,我会完全停不下来,其它事情都没有心情去做,而一些本应该做的事情,被我抛到九霄云外。每个工作日晚上,我都跟自己说,我不要过度沉迷那些脚本,我应该运动,什么类型的都可以。最好可以有一个小时,即便半个小时也好。晚上7点半我就应该开始运动了,但实际上,推到了8点、9点仍然没有开始,过分的时候,甚至10点、11点还坐在电脑前,看着那堆代码,纠结自己还没搞定的事。我不知道我什么时候才可以把这个东西放下。一直以来,我都不知道放下是什么。对我来说,放手是个非常难做到的事,尤其当那件事已经被我放在日程表上,放在脑子里的第一位。

也许有人会说,人谈恋爱的时候,大概就是这种状态。按照这个逻辑,我跟很多东西都谈过恋爱了,而真正应该谈恋爱的男人除外。我着迷于某件事时的那种疯狂劲比谈恋爱的还要夸张。也说不上是因为我爱得死去活来,因为有些时候,那根本谈不上是爱,有时那是恨,因为我会一边做一边咒骂。爱也好,恨也好,凡是有这些情绪的时候,我的状况就是停不下来。不知道什么时候才可以有个高人指点我这个迷津,我到底该如何走出这个人生的困局。大概有人会说,如果我把这种疯狂劲用在谈恋爱上,估计我早就结婚生孩子了。但是人生为什么非得就把疯狂耗在那上面呢?如果把疯狂用在别处,难道就得称呼那些为错误吗?可以确定的是,历史上每一个牛逼轰轰的科学家都是疯狂人士。没有在某个领域出类拔萃的疯狂,就不会有他们的成就。我没想过要成名,也没想过要搞出什么大名堂,我只是一直跟着直觉去走。随着人生阅历的逐渐丰富,我的直觉越发有了明确的方向。

疯狂是件好事,但疯狂停不下来,不能可持续发展,显然就不好了。很多时候,我的拖延症问题在于我过度疯狂。有时我会想,是不是我应该学习一下时间管理呢?到达某个时候,我就必须得停下来,无论我手头上正在做什么。这样更有利于我完成某些既定的目标,但是,这样会打击我的疯狂吗?我的计划一定就比我的疯狂对我更有好处吗?我觉得,通常情况下,我都是个很规律的人。即便哪些事情暂时还没成为我的规律,一旦我觉得那有必要,我就会强迫自己养成习惯。但是,在疯狂面前,所有规则都是浮云。也许在我心灵深处,我潜意识觉得疯狂比我平时的规则重要。虽然我明白到,过度的疯狂实际上会损害我的健康,比如每天都不安排时间运动,比如每天晚上都接近12点才睡觉。我知道那样不好,但我真的停不下来。如果我还是个孩子的话,干这种事早就会被父母骂死或者打死了,但现在,我已经是个成年人,我应该学会控制自己。

每次都是疯狂过后,冷静下来时,才觉得自己真不应该那么狂。

2020-07
22

jinja模板,你好

By xrspook @ 19:20:33 归类于: 烂日记

我终于做到了用模板的方式以及我自己的数据生成静态网页。暂时我还不知道,那些放进去就能用的格式类东西应该怎么在生成网站的时候顺便一并放进去。肯定是有方法的。虽然现在我手动挪一挪也无所谓。我觉得那大概是一个获取文件,然后解压到目标位置的操作。

jinja的模板套用比我想象中简单。在进行我自己的操作之前,我复制了网上的一个教程的代码,发现真的很容易。模板本身也可以通过浏览器查看效果,这个非常棒。从前BSP不就是干这种事吗?无论是可视化编辑的,还是纯代码操作的,其实都是在设计模板。现在我也终于明白,为什么相比于其它核心功能,在模板方面,我为什么总感觉自己有那么多的经验,因为实际上,我的确在那个方面花了很多时间。现在我已经不记得BlogBus的模板是怎样的了,唯一的印象是他们用的是代码编辑。他们会给你一些核心代码的封装,你可以把那些东西放在指定的某些模板里。封装的东西以外的部分,你可以通过css,或者js去控制,但是封装在里面的,基本上就是一个无药可救的状态了。所以有些格式你觉得你应该可以控制得了,实际上你却做不到,因为封装在里面,已经把格式给写死了。不知道如果我在css那里强行加个important,能不能扭转局面,但显然,当时我根本不知道有important这种东西。css的important的确威力无穷,但是important如果经常用,就会破坏规则,也不好维护。不得已我才会用,即便用了,一个css文件里面,通常不会超过三处。

以前的模板设计,我只是能处理一些格式上的东西。现在,我自己写脚本生成静态网站。无论前台后台,我都玩了,我得顾及前台的模板形式。也要考虑后台的数据整合以及数据的架构类型。在用jinja模板之前,我用的是人肉低端的字符串合并。虽然实际上,我做的低端操作也是实现模板的功能,但就维护来说,这实在太困难了!如果一个网页里面有很多数据是动态的,我就不得不把网页切分为很多份。切着切着,我都不知道自己切到哪里了。就数据生成效率来说。我的低端做法效率会更高,至于为什么,我不知道。9498个页面,我的低端做法转化需要22秒,jinja模板只需要32秒。这个不是偶然事件,在进行9498个页面转化之前,我先进行了一个只有几个页面的测试。结果跟大数据的很类似,低端做法,要比高端做法快1/3。这其中的原因是什么呢?据说jinja已经是个生成速度自称为“快速”的脚本,如果是另外一些,可能更慢。9000多个页面才多10秒钟,任何人都忍受得了。就维护的便捷性来说,低端拼接的维护成本随便超过10秒,所以用jinja模板绝对是值得的。这让我想起了我最在行的邮件合并,用word和Excel联合起来批量生产东西。我不知道其他人玩这个能溜到什么程度,反正这个东西一直都是让我引以为傲的,当然了,这种技能,也是后天逼出来的,工作使然也。

一些我觉得可能挺不容易的东西,居然很轻松就被我攻克了,感觉非常意外。接下来,生成搜索引擎所需的索引,估计不是件容易的事。生成索引,最重要的是思路,而过程不过是一些机械操作而已,我必须掌握好那个思路!

2020-07
21

改进

By xrspook @ 9:18:56 归类于: 烂日记

当我把电子书的列表从800多KB改成几个以后,整个静态网站的生成速度就从之前的120秒降为20多秒。20多秒的生成速度跟生成markdown文件没什么区别了。准确来说,生成速度更快了,因为少了一个markdown转换的过程,我猜可能是这样吧。虽然我已经绕了一个大圈又重新做了一个判断,如果我直接从点点转换成静态网站,而不是先格式化为wordpress标准的XML格式,估计速度会更快,但可以肯定的是,如果那样的话,我还是得做不少的判断,因为点点的文件里面不同类型的核心内容是不一样的。其实最简单的方法,是我生成wordpress格式文件的时候把分类继续放在分类,不把博客的名字放在分类,不把分类作为其中一个标签,相对来说这样的改动是最简单的。其实现在我绕了一个圈再回去,也没麻烦多少,因为那个标签是第1个,而我的判断是,如果找到了某个标签,就马上停止循环,所以虽然每篇日志的标签有n个,但判断第1个以后就结束了。就循环来说,没耗多少时间,只是代码会显得又长又臭。

近段时间我一直在纠结如何把手动输入的字典搞得好看些。除了好看,也要容易维护。最明白的方式当然是自己写键值对,但是那么多的引号,那么多的冒号,那么多的逗号,想想都觉得好疯狂。最整齐最不容易出错的方式是一行一个,但那样的话,好像有点奢侈了。所以有时我也搞不懂自己,到底是想节省空间,还是维护容易。

昨天晚上,我纠结一个问题,如果某个单词被我用作变量,在字典里那个单词又是一个key,同时这个单词也是个文本。有没有某个函数能把某个变量只当作是某个名字的字符串呢?如果这样,我的某句话就可以写得很简洁。否则的话,当我调用函数的时候,我就要把这个单词写一遍,当作字符串再写一遍。或者你会说,我直接把这个变量等于这个字符串不就好了吗?显然,我之所以把那个单词当作变量,肯定是因为其内涵跟字符串不一样。所以我试试是不是自己挖了个坑给自己跳呢?我明明不应该把这两个东西命名成一样。

有些时候我会问一些很弱智的问题,明明我是知道的,但是一下子就是想不起来。归根到底,我觉得是我的基础还不够扎实。在完成了静态博客的部署以后。我还没想好我是继续把Think Python那本书从我中断的地方继续看下去,还是应该从头开始,复习一遍,加深印象,因为那些很基础的东西在用着用着的时候,我觉得自己已经忘光了。所以到用的时候,我又得翻箱倒柜。那些东西,我明明应该已经掌握的。

现在的静态网站转换,我是用很低端的字符串连接整出来的。有些字符串是一成不变的,有些字符串是变量。我就在变量的之前之后把静态字符串断开,储存在某个文件里。最后就像穿珠子一样,把动态和静态的东西连在一起,最终合成一个网页。实际上,这是一种模板的思路。接下来,我要利用python的模板引擎,把静态的东西写在模板里,把动态的东西放在某些参数中。这才是我的网页转化应有的方式,但我不确定,这样的转化效率会不会比我现在的低端做法还要低。对我来说,那是一个未知的世界,我非常想,立马通过实践得出答案。

人在求知的路上会越发明白到自己的无知。

2020-07
20

普通人的小生活

By xrspook @ 11:24:43 归类于: 烂日记

昨天晚上我根据电影的时长,看了一部叫做《肆式青春》的电影。那是一部动画电影,中日合作的。至于合作的是什么部分,我就不知道了,反正画风是日本的。上个星期,我看了《大鱼海棠》,同样是一部动画电影。我个人感觉《肆式青春》比《大鱼海棠》好看,因为没有那些过于纠结的爱情。《肆式青春》反映的更多是现实生活。里面说的远远不止是北上广。那里说的是生活中一些每个人都会遇到的事情。当我看完电影,要去豆瓣做记录的时候我才发现。这部电影的豆瓣评分非常低。为什么那些人可以给出这么低的分数呢?从我的角度考虑,第一个故事已经把我看哭了。我承认我的泪点比较低,每到那种话题我就会哭。如果是几年前,大概不会这样,但当我经历过这种事以后。我完全不能自已。之所以有人能打出那么低的分数,肯定是因为他们不曾经历过这种东西。所以他们完全体会不到应有的泪点。看到电影的分数被拉下去以后,我觉得自己被代言了。

《肆式青春》的三个故事我都喜欢。因为那就是我身边普通人的味道。没有非常精密的设计,那更多上是普通人的日记。在广州的那个故事里,基本上广州最著名的建筑物都融到里面去了,尤其是珠江新城的那一片,让我莫名地感到亲切。虽然那一部分说的是粤语,但我觉得那个大概不是广州方式的粤语,那有点香港感觉的,但起码那是纯正的粤语,而不像现在公交车上粤语播报的那种带有口音。会说粤语的这么多,为什么要搞个带口音的来进行语音播报呢?唯一的解释就是挑选人的和审核这条语音信息的人,根本不懂粤语。又或者说,他们不知道纯正的粤语应该是怎样的。在外地人的心目中,粤语大概就那样,发出差不多那个音就可以了,但是对土生土长的人来说,实在太别扭了。开始我以为,只是某条公交车线路,又或者是某个汽车公司的播报是这样。但后来我发现,全部线路用的都是那个带口音的新语音播报。我实在不知道他们到底是怎么想的。到底有多少人像我这样已经听出不对劲呢?我明明知道那不对劲,但是我没有进一步采取手段。比如主动反馈到某些部门,虽然它通常没有用,但不管有用没用,这个连尝试都没做过,怎么知道结果呢?大概有很多人也听出了不对劲,但是也跟我一样,心里觉得很别扭,但是却没有主动改变这个事实。当别人的普通话说得很不普通的时候,我们会笑话他们,尤其当某些香港明星普通话很水的时候,经常会被大家当作笑柄。同样的事情发生在说普通话的人在香港街头跟本地人说很普通的粤语的时候。明星说话不标准那只是他们自己的事,但一个城市的公交车语音播报带了口音那可是整个城市的是事!当一个城市的曾经的母语逐渐消失到大家都不知道母语应该是怎样的,这个城市的魂算是丢了。

记忆还在那里,但里面的东西再也摸不到了。

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress