2020-03
23

选择我的语言

By xrspook @ 10:34:20 归类于: 烂日记

现在我到底比10年前进步了多少,我不知道,但显然,10年前我还不认识正则这种东西。后来的很多抓取需要让我不得不学习了这个。一开始,我是在PHP上面用的,而昨天,我要把这个用在Notepad++上面,正则类似,但不同地方的细则又有所不同。正则这个东西让我在Notepad++上完成了我觉得这软件可能完成不了的事情。我太低估Notepad++的实力了!简单的替换或者新增这段,对它来说毫无压力,尤其是纯粹字段的东西。昨天之前我有想过要不要这次之后我也学习一下Python。语言类的东西学习了不少,但是我的电脑里没有配置一个环境可以让某个语言做到输入输出文件。如果把Excel算上,估计那是唯一OK的。我之前用的PHP实际上在编程方面我几乎没接触过。

学习编程语言,学习什么样的编程语言,很多时候都不是由我自己说了算。遇到什么问题,看到别人用什么解决,然后我就会觉得那个东西很有用。如果现在要用一种语言去定义我自己的话,我甚至说不出来。我不需要所有语言都懂,我只需要有一个我非常懂的东西就可以了。但显然,现在我还没做到,所以接下来我需要做的是找到这种语言,然后深入的研究。无论哪种语言,深入进去以后都可以无比强大,起码我想实现的那些小愿望全部不成问题了。其实我也不能说我完全不懂PHP,我还是有点懂的,但主要还是用在一些前端方面。因为我会认识这种语言是从网页与CSS配合开始的。一直以来,我都没有深入进去。我没有在电脑上长期安装一个运行环境。每次我要测试开发WordPress模板又或者其它内容的时候,我也是到需要时才安装,不需要的时候又把它卸载掉。需要PHP的运行环境,意味着可以实现很多计算,但我并不需要一定在本地部署。我把脚本放在网上一个免费的地方,我那些小不点功能其实就可以做到。以前,我是这么干的。现在估计我依然可以这么干。我为什么要配置PHP环境而不配置其他东西呢?其他东西可能更方便快捷。我不知道语言与语言之间的差异主要有哪些。从宏观层面上看,判断和循环基本就是它们的全部,但在如何表达参数上面,各家有各家的说法,所以其实一直以来我都很蒙圈。如果你给我一堆代码,要我判断这是哪种语言的。我肯定说不上,除非有一些非常明显的标志。看看他们的声明以及执行部分,很多时候我觉得都一个样。当然这只是我肤浅的觉得,实际上不是这么回事。因为我不熟悉他们,我只是见过他们,有些更加纯粹是一面之缘。

就像我用一个数据透视表能解决几乎Excel的绝大多数问题一样,因为我熟悉它。如果我熟悉公式,我也一样可以单用公式解决Excel的绝大多数问题。我是时候在一种编程语言上下功夫了。

2020-03
22

折腾不同版本的WXR

By xrspook @ 22:09:44 归类于: 烂日记

我只是想把自己从前的东西重新拿出来,原来这也会很难,这是我完全没想到的。要找回那些尘封10年的文档,并不算太难,翻一下电脑也就找到了,虽然有点坎坷,因为当时备份的时候,我没有标注是哪个网站的,xml都放在一起,我以为那都是我主站的,后来,同一个日期不同的文件大小才让我觉得有蹊跷。xml文档找到了,接着要把它转化为WordPress的格式。当年用来转换文档的脚本找不到了,翻遍家里电脑的各个盘都没找到。之所以在家的电脑找不到,是因为当时干这事我是在单位完成的。所以理论上单位的电脑应该有,但是因为换过电脑,我也清理过同步盘,所以会不会也因此清理掉呢?这个我不确定。我觉得,在我转格式的时候,我仍然在用Dropbox,里面的很多东西我的确已经清理了,于是这也很好解释,为什么我家里电脑的Dropbox文件夹里找不到那个脚本。家里的电脑没有,单位的电脑可能有,但还有一种可能性,我把那上传到网盘,于是就把那同步软件里撤掉了。我只会上传到两个地方,一个是百度,一个是115。115打开很麻烦,我也懒得下载打开它的工具。百度上果然就有我要找的东西,但当我想把整个文件夹下载回来的时候,问题严重了,那里居然有4000多个文件。下大文件的时候度娘就很慢,下小文件的时候度量更慢,那是直接10KB以下的速度。我直接去网页版的度娘找到我要的东西,不在客户端里等它慢慢下载了。

东西下载回来以后,我再翻查我的日志,我需要安装一个Python。我默认安装的是现在最新的版本3.7.7,但运行脚本以后却发现才刚刚开始读取脚本,就马上报错。查找原因,原来是版本之间的语法差异。才刚刚开始就错,要运行完整个脚本,我真不知道还得修改我根本不懂的语法。所以,我把最新的Python卸载掉了,重新安装当时我就在那个版本下转换的2.6.5。2.6.5是一个什么概念?这意味着时光倒流10年。

出乎我意料,软件装好以后,我几乎没遇到困难就可以把BlogBus的文档成功转为了WordPress的格式。在下载Python的时候,我顺便下载了XAMPP,同样下载的是最新的版本。前段时间我才刚用过,觉得挺爽。我也下载了最新版的WordPress的5.3.2。同时把导入插件也装。当我试图上传,已经转过格式的xml是,上传报错。原来这才是噩梦的开始!不同版本的WordPress里的xml格式各不相同,几乎可以这么说,越往后越严格越来越严格了。于是我又安装了WordPress 3.9和2.8。3.9的WordPress在PHP 7之下马马虎虎可以运行,2.8是直接连数据库都连不上…… 于是我甚至不能从通过低版本的WordPress N轮导入导出拯救世界……

没办法,我只能研究我手头上的xml,看看和现在的标准版差多少。首先,必备填写一个WXR的版本号。在旧版本里,这条规则是这是不存在的,所以要手动加入。同样需要手动加入的就是,即文件类型,因为现在的WordPress把文章分成了post和page。把这些搞定以后,基本上正文就可以导进去了,但是分类和标签还是不行。因为现在的分类和标签,WordPress使用的是一个叫做nice name的东西,你必须在分类和标签那里,加上这个标注0才能识别的出来。评论那里,当年就试过在2.8的版本里面评论正常,但是在2.9里面,有评论的话会只剩下一条评论。研究发现,那是因为评论有了一个id号。BlogBus转码过来的东西没有id号,所以大概东西就自动覆盖了。除了这些BlogBus和WordPress之间的格式问题以外。我的文章里还有格式的=问题,因为有些东西,不完全是我自己的东西,好些是我从网络上搜集回来的。当时我保存了网页,在BlogBus发布的时候直接复制到可视化编辑器,所以格式也带入了。如果当时我懂得先把东西贴到记事本,然后再剪切粘贴一次,就不会存在这种问题。除了格式以外,从前的blog里还有图片,但经过这么多年,图片都已经失效了,链接摆在那里只会浪费加载时间和访客的期待,所以我要把图片链接也尽可能去掉。有些图片链接是我没办法去掉的,因为用正则筛选的时候会遇到一些很屌丝的句子,到了某个点,就卡住了,但实际上那并不是这个标签的结束。

搞清那些规则,总结出我的对策。一次又一次查找替换,一次又一次导入删除再导入。花了一整个下午加半个晚上的时间,我总算搞定了从前BlogBus上的BLF!文章238篇齐全,评论56条也齐全!!!其中可能会有一些小格式上毛病,但是那并不是共性的问题,后续还得靠运气慢慢修改。

非常有必要记录一下我在Notepad++上做的WordPress不同版本xml转换操作

/*操作开始*/

普通替换《channel》为《channel》《wp:wxr_version》1.1《/wp:wxr_version》 /*WP XML共性问题*/
普通替换《category domain=”category”》为《category domain=”tag”》
普通替换《dc:creator》《/dc:creator》
为《dc:creator》《![CDATA[xrspook]]》《/dc:creator》《wp:post_type》《![CDATA[post]]》《/wp:post_type》《category domain=”category”》《![CDATA[回到过去——Betty迷的独白]]》《/category》 /*《/wp:post_type》前是WP XML共性问题*/
普通替换《BR》《BR》为《BR》
普通替换《!–msnavigation–》为无
普通替换[summary_of_BLF]为[summary_of_BLF(from_rincondebetty)]
普通替换[summary_of_EcoModa]为[summary_of_EcoModa(from_rincondebetty)]
普通替换《category domain=”tag”》《![CDATA[(from_rincondebetty)]]》《/category》为无
普通替换[Yo soy Betty, la Fea]为[Yo_soy_Betty,_la_fea]
普通替换[JEA’s Writting]为[JEA’s_Writting]
普通替换”博主”为”xrspook”
普通替换《i》为无
普通替换《/i》为无

正则替换category\”》《\!\[CDATA\[(.*?)\]为category\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换tag\”》《\!\[CDATA\[(.*?)\]为post_tag\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换《[TDSFHI].*?》为无
正则替换《/[TDSFHI].*?》为无
正则替换《P.*?》为《P》
正则替换《(table|tbody|tr|td|div|span|img|script|font|hr).*?》为无
正则替换《/(table|tbody|tr|td|div|span|img|script|font).*?》为无

《wp:comment》《/wp:comment》中增加《wp:comment_id》1《/wp:comment_id》,id数字递增 /*WP XML共性问题*/

/*操作结束*/

注:请自行替换《》为<>,用尖括号那是全部都挂掉无法显示的节奏啊啊啊

这个是一次死去活来的经历啊啊啊啊啊啊啊啊啊啊啊啊!奇怪的知识又增长了不少……

2020-03
20

偶遇VSCode

By xrspook @ 9:27:33 归类于: 烂日记

昨天晚上但我吃完饭回到宿舍,拖完地要去办公室之前,我跟书桌上的外婆说,今晚总算没那么多板上的任务,我会早点回来。结果我还是很晚才回宿舍,甚至比平时还要晚,因为我洗完澡的时候已经超过了晚上11点。昨天跟之前几天不一样,因为昨天单位有卸船作业,所以我还得在手提电脑上忙一阵单位的事情。我很痛恨自己的拖延症,跟之前几晚相比,昨晚我的确是很闲的,但正是因为我很闲,所以我就去看了一下自己订阅的东西,结果就发现一个,很好玩的跨平台,出自微软,轻量级的编程软件。之前基本上可以这么说,我没用过编程软件,一直用的最多的是Notepad++,但那只是个代替Windows记事本的工具。的确很便携,而且在处理代码的时候也有高亮显示,字体大小和格式很自由,体积很小,我已经用了很多年,一直觉得很爽,因为用那个东西,有后悔药。即便我按了保存,还是可以后退很多步,至于一共能后退多少,我还真没研究过,装上插件以后,可以有跟多形式的自动保存,比如当光标离开软件以后,东西就自动保存了。又或者我可以设置,多少时间就保存一次。写代码这种东西,最慌的就是改完以后才发现,没改之前更好,但是软件不能后退,没有后悔药。跟Office软件比起来,Notepad++的后悔药好用多了。因为Office软件一旦按了保存,之前的东西就后退不了了。而且Notepadd++打开文件的速度非常快,即便是很大的数据文件也没有问题,比如说,几十MB的XML文件。为什么会有那种东西?其实那个就是我WordPress导出的数据,是我10多年来blog的日志数据。我不知道如果那些东西拿去出书的话,那本书得有多少页。其实我还真有想过会不会有一天无聊地把自己的blog拿去出书。但为什么要出纸质版的书呢?电子书其实也行。把我的blog静态打包下来,就是一本电子书。

回到Notepad++加上,虽然那个东西可以用来写代码,但跟专业的写码软件比起来,还是挺不方便的。虽然其实Notepadd++也有不少插件,但是跟别人的插件比起来,好像还是欠缺点什么。如果纯粹是文字,不是代码的话,我觉得它非常优秀了。比如说我经常用来核对字幕哪里修改了。之前我并不觉得Notepad++不适合用来写代码,直到昨天我看到了那个VSCode以后。在那里保存一个后缀为HTML的文件以后,你只需在那里输入一个东西,之前之后的那些格式全部都自动生成了,而且全部都已经标记好颜色,做好了缩进。那个东西自带了emmet功能,快速写码变得易如反掌,因为只需要写一点点东西,一大串成对的代码就出来了,于是,妈妈再也不用担心我丢三落四,因为成对的代码会自动出来,代码可以出来,我觉得自动缩进不会有啥状况。一直我都在搞blog,我一直都只是在做前端的设计,看到这些功能以后,我简直震惊了,用这个东西写码,只要你有思路。只要你有灵感,写一个网页相当快捷简单。不过绝大多数时候,我觉得前端设计还是需要一些脑洞的,比如说你根本没想到可以那样做的话,你怎么可能写得出来。

因为看到那个让我兴奋的软件,而且还是便携的,直接解压使用,无需安装(但是很大,解压后200多MB),所以洗澡的时候我考虑过要不要再写一个WordPress模板,那个blog用来存放我从前做过的那些blog。那些不是我主站的blog,比如说BLF的、JEA的、以及ADR的。那里的东西有些不是我的,但是很大一部分都是我磨出来的。曾经,我在那里倾注了非常多心血。那是我曾经的兴趣所在。那些东西是我人生的一部分,但是,他们以前的家已经消失了。BlogBus没有了,点点也没有了……我觉得我应该让他们重生。

写一个网站的前端需要灵感,但网站的核心是内容。首先,我要考虑怎么把BlogBus和点点导出来的数据转化为WordPress可以理解的内容。

2018-01
24

爱Notepad++

By xrspook @ 10:10:24 归类于: 烂日记

好长一段时间以来都用Notepad++写blog,因为曾经数次因为Windows的记事本歇菜,我的txt没了!所以虽然文件保存格式依然是txt,但打开编写的用的是Notepad++。写完全没有格式可言的txt用Notepad++,编写各种脚本也用它,因为这个东西写各种脚本会自动高亮,检查语法的时候实在太方便了,尤其是已经写了满屏的代码,需要找上一个代码对应的结束符的时候。跟系统自带的记事本相比,Notepad++的搜索功能非常强大,支持各种语法,你甚至可以用正则搜索,最爽的我觉得莫过于高亮显示搜索结果。但有些时候呢,跟Word的搜索比起来,貌似Word在实现某些替换上会得心应手一点。之所以有这样的见解非常有可能因为我还没有完全发掘出Notepad++的厉害之处,不是人家没有,是我不会用。做字幕翻译的时候我也会用Notepad++,屏幕并排垂直自动滚动两个文件,一个放原文,一个放我翻译的中文,爽得很啊,再也不怕因为我删掉了一句话再去翻译而要重新撤销找回。当然了,Notepad++的对比功能也很强大,直接从不同颜色的轴就能看到差异在哪里,人家都用不同底色给你标注出来了好吗。一开始用Notepad++是因为用记事本写blog的时候没有保存或突然断电导致写了好长好长的东西丢失,Notepad++这好家伙还有自动保存的插件,虽然设置保存规则选择很多,但在敲着敲着键盘自动保存会突然失去了焦点,或者焦点不知道滚到哪里去了也是个很烦的事,但起码你能在标签那里看到蓝色是已保存,红色是未保存,这样的可视化操作比觉得在记事本里用了快捷方式保存实际上没有来得靠谱。记事本写错了也有后悔药,但后悔药的次数有限而且还原给你的东西可能不是你想要的,Notepad++的后悔药相对而言好用多了,可以回滚好多次,至于到底最多能多少我还真没试过,因为根本没用到。综上所述,为什么我还要用记事本而不用Notepad++敲键盘呢?

Notepad++我觉得有点烦的是它的升级,当然你也可以选择不升级,但如果你选择了提醒你升级就烦了,因为每次升级都会来个重新安装的界面,虽然你之前保存设置好的东西还是会默认存在,但是他们就能不展示整个覆盖安装的升级界面吗?从前呢,在软件里查询下载Notepad++的插件是很简单的,但不知道从什么时候开始那个东西就变得几乎连不上,于是你只能人工去他们的网站下载。天知道Notepad++的插件到底得罪了谁,我们不过想让非常好用的软件更加得心应手而已。这是一个纯粹的敲键盘工具,当然用来做查找替换也很爽歪。打开大文件用Notepad++要比用记事本快得多。从前我就试过开自己网站到导出的数据文件,记事本崩溃,但Notepad++貌似我没遇到过。

还记得大学的时候写blog是我是在BlogBus上完成的,遇到网络有问题好几次我写好的东西全没了,真是欲哭无泪啊啊啊~~~ 于是呢,后来我就变成了在BlogBus上写,然后先贴到txt上,然后再提交,再往后嘛,我把顺序倒了过来。现在我都是txt上写好再往自己的WordPress上粘,我的WP比当年的BlogBus靠谱多了,只要不是网络的确有问题,东西都能发出去,但即便发不出去过一段时间它就会自动保存,不能保证自动保存的东西一定就是最后的版本,但起码还有东西存在啊。

十几年下来,坚持每天都写blog的我不知道这个世界上有多少人,我觉得这个人数应该比通过精英门槛直接取得广马资格的人要少。

2016-03
11

跟上节奏

By xrspook @ 22:39:36 归类于: 烂日记

老是对着个电脑的时候不知道要做些什么,一天到晚都没得对着电脑的时候反而回到电脑旁更加带劲了。生活中一样东西开挂了很多东西也会同样挂起来。那些平时觉得很繁琐的东西在挂打开了以后一切都变得非常简单。不是因为我们真的变强了,而是因为我们的基础节奏加快了,所以做其它事也变得非常带劲。有些人这边好了那边就焉了,但我显然不是那种人,我经常的状态是遇强越强。曾经试过扫了一天的地,已经走超过3W步了,晚上居然还可以照样跑个9K。从前更牛,跑的是10K,但当时没有戴小米手环,无法用大概步数来估算,在那种状态下我还可以把我的10K跑得比平时还要快,我也给自己一个大写的“服”字。就好象我做事调用的可以是完全不同的东西,所以我左脑用得很多了,但我可以做一些右脑的事,又或者做一些完全不怎么需要用脑只需要条件反射的事,比如说跑步。

写完上面那段就是时候下班走人了,准确来说早就下班了,但搭顺风车的同事还没好,所以我居然可以悠哉地把水壶和杯子洗了,然后再写下上面一大段话。

再次开始坐到电脑前敲已经是晚上10点多的事。接近晚上8点才回到家,吃完饭已经8点半,和个做馒头的面然后拿去发酵再吃两个核桃已经晚上9点。洗个澡后已经快9点半,稍微收拾了一下明天跑步的腰包快9点45了,该把一次发酵好的面拿出来。今天的面好神奇,之前完全不粘我的硅胶袋子,但今天却略粘,可能跟我今天水放多了有关。称了350g干粉,我却放了200g的水,应该是2:1才对了,虽然后来我又加了一勺面进去,但可能还是不够,所以一次发酵出来的东西略粘,但粘我也没再往里加干粉了。本来手指就因为近期一直在赤手做稻谷而毛糙,粘上面粉洗的时候还用百洁布结果就更毛糙了。这个时候我就会想那些天天做手术,每次之前都要洗手半小时的医生是怎么做到不把手洗渣的呢?说起医生,现在都已经3月中旬了,GA也该回归了吧。GA没看,这周两集(周二和周四)的Nike Women原创剧我也没看。每天我的脑子里就只有做样!做样!做样!

昨晚无论如何都整不了Notepad++的插件Auto Save,今天去Google搜索,居然没有搜到有跟我类似出现插件无法验证的事,其他人在装Notepad++其它插件的时候有遇到过,但装Auto Save的时候没有。我认真看过将Auto Save和Auto Save 2怎么用的教程,感觉我都知道啊。无奈之下寻求网友的帮助。通常,就在这个时候我就会灵感大爆发!这次也不例外!!!我一直都把Auto Save选项里面的Name Files设置为Ignore/do nothing,但如果这么设置的话我装了Auto Save插件等于禁止其使用,因为我都在用Notepad++编辑已存在的文件。Named Files的选项我应该选择Overwrite existing file。当我选择了这个并保存以后我焦点离开Notepadd++或者自动间隔1分钟以后Auto Save终于能让我正在编辑未保存的文件从红色变成蓝色了,泪奔~~~妈妈再也不怕我因停电而丢掉刚写完的一大篇blog了,呜呜呜~~~

是时候睡觉鸟~

© 2004 - 2020 我的天 | Theme by xrspook | Power by WordPress