python « 我的天

2020-08

喜欢VS Code

By xrspook @ 11:30:56 归类于: 烂日记

我感觉自己越发喜欢VS Code了，这个东西的确就是我想要的写码工具，如果早点认识它，从前我就不需要走那么多的网路了。用VS Code写过代码以后，我对它是一发不可收拾的喜欢，但我始终不习惯在暗黑界面码中文，毕竟写代码和码中文不一样，写代码的时候思路是自己的，但积木的类型是固定的，这就意味着写码的时候如果有Emmet会相当便捷快速不出错，但如果在写blog的时候，尤其不是写代码技术类的时候，Emmet会变得毫无用处。同样我不需要额外纠结的还有中文语法。写blog是很自由的事，试想一下满屏的各种颜色波浪线，侧面和下面还有各种数字圈圈那将多么的恼人，当然了，貌似VS Code还没有厉害到可以有中文语法自动检测这种功能，我估计英文可能已经有了，Office几百万年前就已经有的功能VS Code可能天生就内置了，即便没有，让你绝对想不到的插件也肯定能实现。Offcie有中文语法检查的功能，但那个东西，笑而不语就好，别当真。

写码为啥要VS Code呢？不仅仅是Emmet功能，写过的函数，设定过的变量往后再用的时候，敲几个字就能有提示，就更不用说，使用默认的系统函数时能马上显示出详细的函数说明。自己写的变量一个颜色，系统函数一个颜色，保存以后还能自动语法检查，妈妈再也不怕我会犯格式上的错误。但话说回来，格式不错，不代表代码就一定可以运行出你想要的效果。毕竟代码的核心仍然应该是你的思路。

我不知道为什么大家都说暗黑模式写码护眼，护不护眼我不知道，但我知道白色界面看五颜六色的高亮会刺眼，相对来说，背景主色调是深色就没有这种不和谐。是不是因为这样，所以一开始的电脑都是黑屏白字而不是反过来呢？因为他们完全可以把那个东西做成计算器那样白屏黑字。现在我的习惯挺奇怪，写码的时候我用黑屏，写blog或者写其它文章的时候用白屏。我感觉自己用白屏的时候字体大小得设定到起码是黑屏的1.5倍。

去年我第一次接触R语言，觉得那个东西实在太伟大了！今年年初我的计划是学习R语言，但结果Python捷足先登了。VS Code搭配Python那是爽得一逼的节奏，因为Python是很大路的程序语言，所以很多东西已经非常完备了，相对来说R语言小众一点。无论是官方自带适配的还是第三方插件都比较弱。我用过R语言写码，那个东西简直是太难写了！一大串东西写好，要修改其中的一些，还不能鼠标快速插入，只能用键盘光标移过去，实在太逆天！当时我用的不过是系统函数，很多参数的位置和写法都是固定的，无数次我运行失败都是因为我手贱敲错了。试想如果这放在VS Code，有自动的语法提醒纠正，这种烦恼根本不存在。同样比较烦人的写码还有Excel VBA。运行的时候他们会弹出一个代码告诉你出错了，代码到底什么意思呢？到底是哪里卡死了呢？他们明明都得出代码了，却不直接告诉你到底是什么意思，很多时候，运行卡住是因为我手贱把一些系统参数的名字写错了…… 又是参数名字写错！如果在VS Code，这种事情根本不会发生啊！

写代码的方法千万条，但能边写边提醒你不犯低级错误的通常都不是某个程序语言自带的编辑器……

标签：python, R语言, VBA, VSCode, 代码, 提醒, 烂日记, 白屏, 纠正, 脚本, 语法, 高亮, 黑屏

评论关闭

2020-07

改进

By xrspook @ 9:18:56 归类于: 烂日记

当我把电子书的列表从800多KB改成几个以后，整个静态网站的生成速度就从之前的120秒降为20多秒。20多秒的生成速度跟生成markdown文件没什么区别了。准确来说，生成速度更快了，因为少了一个markdown转换的过程，我猜可能是这样吧。虽然我已经绕了一个大圈又重新做了一个判断，如果我直接从点点转换成静态网站，而不是先格式化为wordpress标准的XML格式，估计速度会更快，但可以肯定的是，如果那样的话，我还是得做不少的判断，因为点点的文件里面不同类型的核心内容是不一样的。其实最简单的方法，是我生成wordpress格式文件的时候把分类继续放在分类，不把博客的名字放在分类，不把分类作为其中一个标签，相对来说这样的改动是最简单的。其实现在我绕了一个圈再回去，也没麻烦多少，因为那个标签是第1个，而我的判断是，如果找到了某个标签，就马上停止循环，所以虽然每篇日志的标签有n个，但判断第1个以后就结束了。就循环来说，没耗多少时间，只是代码会显得又长又臭。

近段时间我一直在纠结如何把手动输入的字典搞得好看些。除了好看，也要容易维护。最明白的方式当然是自己写键值对，但是那么多的引号，那么多的冒号，那么多的逗号，想想都觉得好疯狂。最整齐最不容易出错的方式是一行一个，但那样的话，好像有点奢侈了。所以有时我也搞不懂自己，到底是想节省空间，还是维护容易。

昨天晚上，我纠结一个问题，如果某个单词被我用作变量，在字典里那个单词又是一个key，同时这个单词也是个文本。有没有某个函数能把某个变量只当作是某个名字的字符串呢？如果这样，我的某句话就可以写得很简洁。否则的话，当我调用函数的时候，我就要把这个单词写一遍，当作字符串再写一遍。或者你会说，我直接把这个变量等于这个字符串不就好了吗？显然，我之所以把那个单词当作变量，肯定是因为其内涵跟字符串不一样。所以我试试是不是自己挖了个坑给自己跳呢？我明明不应该把这两个东西命名成一样。

有些时候我会问一些很弱智的问题，明明我是知道的，但是一下子就是想不起来。归根到底，我觉得是我的基础还不够扎实。在完成了静态博客的部署以后。我还没想好我是继续把Think Python那本书从我中断的地方继续看下去，还是应该从头开始，复习一遍，加深印象，因为那些很基础的东西在用着用着的时候，我觉得自己已经忘光了。所以到用的时候，我又得翻箱倒柜。那些东西，我明明应该已经掌握的。

现在的静态网站转换，我是用很低端的字符串连接整出来的。有些字符串是一成不变的，有些字符串是变量。我就在变量的之前之后把静态字符串断开，储存在某个文件里。最后就像穿珠子一样，把动态和静态的东西连在一起，最终合成一个网页。实际上，这是一种模板的思路。接下来，我要利用python的模板引擎，把静态的东西写在模板里，把动态的东西放在某些参数中。这才是我的网页转化应有的方式，但我不确定，这样的转化效率会不会比我现在的低端做法还要低。对我来说，那是一个未知的世界，我非常想，立马通过实践得出答案。

人在求知的路上会越发明白到自己的无知。

标签：python, 基础, 字典, 扮IT, 模板, 烂日记, 转换, 静态网站

评论关闭

2020-07

DIY python脚本实现静态网站生成

By xrspook @ 18:05:16 归类于: 烂日记

当所有现成的方法都解决不了问题的时候，我选择了自己写python脚本转换我的静态网站。花了一个下午的时间，居然还真做出来了。之所以可以这样，是因为我是站在巨人的肩膀上的，我用的是gitbook的格式，他们的静态网页是怎么整的，我就怎么整，毕竟在一个网页里面，哪些部分的数据需要动态变化，哪些需部分的数据无需变动是显而易见的。

之所以可以这么快，另外一个原因是我有了调试的利器。这一次，我用的是VS Code调试html代码。VS Code本来就很强大，昨天更新了个新版本以后，还自动内置了自动修改标签功能，之前这个功能需要用插件实现。大概因为要用这个功能的人实在太多了，所以还不如把它变成默认支持。默认也是需要设置的，不过那就不过是打一个勾而已。VS Code版本更新来得很及时，刚好在我需要用到这个功能的时候，他们就更新了。我还安装了美化格式的插件，这样的好处是，缩进空行什么的一键完成，虽然这个东西看上去很美好，但实际上也是有缺陷的，甚至导致我都不敢用了。因为他们为了好看做了一些不该做的事，超连接给我回车分行，并且在a和href之间再加入很多缩进，这样的话，超链接就不再是超链接了。我实在不知道他们是怎么想的，显然这是一个很大的bug。帮助我最大的是一个叫做live server的插件。这个东西可以虚拟出服务器，网页就可以直接在浏览器上实时更新了。这样的好处是显而易见的，因为这样的话，网站上的超链接全部都可用了，而不需要再按一个CTRL。那种感觉就像直接是在服务器上运行了。我觉得这个效果大概跟各种脚本建立虚拟服务器静态网站差不多。那些脚本除了建立静态网页到缓存，还开起了虚拟服务器。现在，我自己写静态网页，live server开启虚拟服务器。

从前用记事本或者Notepad++，写html的时候，标签配对从来是个大问题，虽然写好了以后，他们会提醒你标签到底配对到哪里了，但在写的时候一点都不智能。之所以这样，可能因为我一直没有去找Notepad++的相关插件。VS Code自带了智能配对的功能，当你写完半边标签以后，后半边自动跳出来了，而且标签你不用写全，写一部分他们就会提醒你，你即将要写的是什么，然后选择就可以了。这样的好处是，标签的配对再也不会出状况，而且标签也不可能写错了。当时我是在看某个介绍VS Code的视频的时候知道这个Emmet功能的，也正是因为这个功能吸引我，那天晚上就下载了个便携版。我不知道便携版和安装版有什么不一样，反正后来，VS Coe用得越来越多，安装版是必须的。如果从前就有VS Code，大概我的很多工作就不需要走那么多的弯路了。但话说回来，现在我写的是静态的网站，如果那是动态的，估计就没那么容易了，但是，就标签配对来说，VS Code还是相当棒的。

现成的各种方法用几个小时，甚至根本生成不出来的电子书是静态网站，我用120秒就搞定了。前提是我们的数据源不一样。我配给他们的数据源是9000多个markdown文件，而我自己使用的数据源是一个20多MB的XML文件。可以生成我梦寐以求的静态网页当然是件好事，但这些静态网页加起来，居然有接近8GB的大小，显然这就很逆天，没有哪个地方能供得起这样的数据。根本原因在于我的每一个页面里面都有一个800多KB的目录列表，排除那个目录列表以外，实际上每个网页文件的内容大都只有不到10KB。所以摆在我面前的是，我不能让那个目录存在于每一个页面，我需要做一个目录页，也就是归档页，我要把那个归档页的链接放到现在的目录那里，而现在的链接则放在归档页里面。只放全部文章的归档页又好像非常空旷，所以接下来，我得考虑把从前的点点分类重新带回。最终的目录那里会有全部文章归档，以及各个分类的归档链接。这个过程挺绕，是我让那些分类消失的，现在我又要把那些分类带回来。最简单的方式是我修改点点到wordrpess的转换转换，让那些分类重新回到分类那里，然后下一步的wordpress XML转化为静态网页文件才会流畅。

python已经成为了我的大杀器，我要学更多，让这杀器更厉害！

标签：emmet, gitbook, HTML, Notepad++, python, VSCode, 扮IT, 烂日记, 目录, 脚本, 静态网站

评论关闭

2020-07

为什么慢

By xrspook @ 8:53:45 归类于: 烂日记

要把9000多篇文章，准确来说，是9498篇文章生成一个静态网站实在太难了。如果只是几天，哪怕是几百天，放在哪里，用什么表达，都不成问题，无论是哪个编程语言都可以做到，只是快慢有所不同而已。到现在为止，我已经试过三种编程语言了，首先是go，然后新都javascript，最后是python。

go对应的是hugo，hugo的建站速度是最快的，但快的代价就是电脑的所有性能都会被用到极限。生成网站的时候，CPU飞到顶，内存一直往上走，最后当我看到内存到达90%以上，CPU的使用率反而下降，说明已经到顶了。因为我在做建站服务器测试，那些虚拟的东西全部都放在内存里，显然，我8GB内存的小电脑没办法在某些模板之下，hold住这9000多篇东西，但并不是所有hugo的模板都做不到，有些简单的模板可以做到。另外一些，别说9000多，一两千，都很困难。具体反映出来的效果就是建站的时间很长，其次是内存封顶，结束时间遥遥无期。

第二快的是python。python是我的老熟人了。而生成静态网站，我用的是mkdocs。这是一个python脚本，但实际上脚本自己又调用了很多东西。所以你以为你只是装一个脚本就完事，但实际上你得连串装一堆脚本。只有几个markdown文件的时候，mkdocs建站是很快的，但没到达hugo那种秒杀的地步，但是就建站构成来说最简单的。初始化以后，会自动生成了一个配置文件和一个文件夹，你把markdown文件放到文件夹，然后建站，就可以看到网站的雏形，虽然那个效果肯定不是你想要的。配置文件只有一个，所以也没什么好让你发挥的地方。正是因为够简单，所以我觉得，对那些纯粹写作的人来说，而且，是纯粹写书的人来说，mkdocs这个东西要比hugo实在。但其中一个不友好的地方是mkdocs自带的搜索对中文不友好。搜索英文的时候杠杠的，但是中文就无能为力。如果丢进去mkdocs的文件非常多，到达几百几千的时候。你会很崩溃，跟hugo不一样，mkdocs的CPU的使用率永远只耗尽我其中一个CPU，所以CPU的使用率永远只是25%，至于内存，貌似我一直都没有看到变化有多大。生成一个几页的网站，需要几秒，生成一个200多页的网站，需要十几秒。但是生成一个2000多页的网站，却需要1000多秒。为什么会有这种指数式的增长呢？我觉得跟他们的搜索索引有关。总的来说我觉得gitbook和mkdocs的思路类似。他们会建立一个json文件。而那个东西我感觉就像是一个字典。之所以能自带站内搜索，就是因为他们建立了这个东西。读取写入其它文件，再怎么慢，也有个限度，而且是匀速的，但是如果要不断的增加字典内容，把新的文件内容全部写入到json里，然后存起来，这就很变态。思路很简单，但执行起来的时候相当费劲。

其中一个让其更加费劲的地方在于，但markdown文件非常多，就肯定有一个不断打开文件关闭文件的操作，还得递归某个文件夹里面的所有东西，想想都知道这有多累。但如果有个大文件，全部都已经结合在一起的话，就没有这个烦恼。之所以我有这种感觉，是因为之前我写了一个脚本，专门用来输出9498篇文章的标题与文件名，作用是造一个目录。当时我没有把脚本输出文件的代码缩进，结果仅仅输出目录，居然需要20多秒。目录很小，但是运行时间却跟我把全部内容都输出一样过。昨天我才发现缩进的问题，那就意味着每次增加内容，文件都打开写一遍。这就意味着那个文件被反复的打开关闭9000多次。紧紧减少一个缩进，等于把写入的次数从9000多变成1，于是那个运行时间就缩短为了6秒。读取一个二十几MB的XML文件并输出目录仅仅需要6秒。可想而知，如果不是频繁打开关闭9000多个markdown文件，而是直接用完整的一个大XML文件生成json，速度会相当快。那不就是跟字典类似的东西吗，简单到没朋友。如果我不想进行全文搜索，我只需要进行标题搜索，事情会变得更简单。简单到跟我生成那个目录没啥区别。

经过了这一番折腾以后，让我明白到明细数据与汇总数据使用起来真的很不一样，虽然就总量来说，二者是等价的。

接下来，或许，我真的会像网友所说，自己写一个脚本，把已经进行wordpress标准格式化的XML转为一个静态网站。

天下大势，分久必合，合久必分。这次我算是深切体会到了。

标签：CPU, gitbook, go, hugo, javascript, json, mkdocs, python, 全文搜索, 内存, 扮IT, 烂日记, 虚拟服务器, 速度, 静态网站

评论关闭

2020-07

过去的纠结开花了

By xrspook @ 9:38:16 归类于: 烂日记

当我以死磕式全包围的方法学习Think Python和做里面的习题的时候，网友觉得我完全不需要这样，那样太学生了，只需用到什么就学什么就可以了，但实际上，我觉得我这样做挺好。虽然我学的时候并不知道我除了这样还能怎样。看完书，但不会做里面的习题，我这书算算看好了吗？我要上手python，得到达条件反射的程度，不经过练习根本不行。我完全明白知道了理解了某些东西，但没有经过实践会是一个什么状态。

初中前两年我的英语老师从前是大学老师，后来不知怎的沦落到在一所臭名昭著的中学里教英语。他从来不给我我们布置作业，也不会有什么小测之类的东西，所以一年下来除了期中考试和期末考试，我们见不到习题。的确，开学的时候除了教材以外还会发1本练习题，很薄的一本，但做不做，做到什么程度，老师是放任自流的。他讲课完全么有问题，语法解释得很到位，字也写得非常漂亮，但他这种教法除非遇到非常自觉刷题的学生，遇到我们这种完全不自觉的，简直是必死无疑。我觉得小学毕业的时候，我的英语是很不错的，尤其是英语听力，因为某年寒假我还被选去某个地方上某个班强化过，但初中的前两年我算是被荒废了。要用得溜，无论你心法掌握得多好，依然需要大量的练习。中考的几门科目里，我的英语是最低分的。当我上了一所重点高中以后，我更加领会到我跟其他同学的差距，因为我所经历过的习题实在比他们少太多了！为什么当年我会刷物理的参考书，刷化学的参考书，却从来不刷英语的参考书和习题呢？？？英语这个东西和理科有一定的差别，理科你掌握了原理以后或许还能八九不离十，即便某些题目里有些综合，见过和没见过顶多是反应快慢的差别，但思路还是摆在那里的。英语这个东西有什么规定搭配，什么默认的例外，什么俚语，没遇到根本没法玩，我的跟头就是栽在了这里。如果可以重来，英语这个鬼东西我一定会刷很多题，而且还必须建立错题本。海量的阅读量和海量的单词量外加各种写作技巧拼凑起来，英语考试是可以拿高分的。不过话说回来，英语考试高不高分我完全无所谓，大概从高中开始，我就觉得英语是一种工具，实用至上。跟外国人交流的时候你根本不需要用非常正确的英语他们都能理解，所以其实六十分跟九十分没啥区别，都能解决问题。

学习python我之所以要做习题是因为Think Python那本书里面的实例其实非常少，知识点也不是真的全部都涵盖了。融会贯通这种东西完全靠做习题去达成。近段时间，我在写博客导出数据的转换脚本。的确，一些功能性的东西，我还是得去搜索，边学边用，但那些最基础的思路，是在我做习题的时候印到我脑子里的。比如我要筛选标签，正常人的第一个反应肯定是找筛选的函数，如果标签关键词只有一个，用find就好，但如果多个，那就得用正则了。我一开始也是怎么干的，但后来我发现这样会带入一些莫名其妙的路人甲，我需要准确匹配关键词，所以先建立列表，然后用if str in list就能完美解决的问题。如果标签数量多，还可以用字典替换列表，in在字典里的索引速度杠杠的。如果我不曾在字符串、列表和字典那里下过功夫，我怎么可能会有这种思路。习题的确折磨了我好段时间，但那都是值得的。

过去的纠结，让我现在顺畅。

标签：python, Think Python, 习题, 刷题, 回忆录, 基础, 思路, 条件反射, 烂日记, 练习, 英语

评论关闭

« 1 2 3 4 5 6 7 8 9 10 »

我的天

喜欢VS Code

改进

DIY python脚本实现静态网站生成

为什么慢

过去的纠结开花了

戳这只鬼

随机日志

我的天

喜欢VS Code

改进

DIY python脚本实现静态网站生成

为什么慢

过去的纠结开花了

戳这只鬼

标签云了

随机日志