2020-03
22

折腾不同版本的WXR

By xrspook @ 22:09:44 归类于: 烂日记

我只是想把自己从前的东西重新拿出来,原来这也会很难,这是我完全没想到的。要找回那些尘封10年的文档,并不算太难,翻一下电脑也就找到了,虽然有点坎坷,因为当时备份的时候,我没有标注是哪个网站的,xml都放在一起,我以为那都是我主站的,后来,同一个日期不同的文件大小才让我觉得有蹊跷。xml文档找到了,接着要把它转化为WordPress的格式。当年用来转换文档的脚本找不到了,翻遍家里电脑的各个盘都没找到。之所以在家的电脑找不到,是因为当时干这事我是在单位完成的。所以理论上单位的电脑应该有,但是因为换过电脑,我也清理过同步盘,所以会不会也因此清理掉呢?这个我不确定。我觉得,在我转格式的时候,我仍然在用Dropbox,里面的很多东西我的确已经清理了,于是这也很好解释,为什么我家里电脑的Dropbox文件夹里找不到那个脚本。家里的电脑没有,单位的电脑可能有,但还有一种可能性,我把那上传到网盘,于是就把那同步软件里撤掉了。我只会上传到两个地方,一个是百度,一个是115。115打开很麻烦,我也懒得下载打开它的工具。百度上果然就有我要找的东西,但当我想把整个文件夹下载回来的时候,问题严重了,那里居然有4000多个文件。下大文件的时候度娘就很慢,下小文件的时候度量更慢,那是直接10KB以下的速度。我直接去网页版的度娘找到我要的东西,不在客户端里等它慢慢下载了。

东西下载回来以后,我再翻查我的日志,我需要安装一个Python。我默认安装的是现在最新的版本3.7.7,但运行脚本以后却发现才刚刚开始读取脚本,就马上报错。查找原因,原来是版本之间的语法差异。才刚刚开始就错,要运行完整个脚本,我真不知道还得修改我根本不懂的语法。所以,我把最新的Python卸载掉了,重新安装当时我就在那个版本下转换的2.6.5。2.6.5是一个什么概念?这意味着时光倒流10年。

出乎我意料,软件装好以后,我几乎没遇到困难就可以把BlogBus的文档成功转为了WordPress的格式。在下载Python的时候,我顺便下载了XAMPP,同样下载的是最新的版本。前段时间我才刚用过,觉得挺爽。我也下载了最新版的WordPress的5.3.2。同时把导入插件也装。当我试图上传,已经转过格式的xml是,上传报错。原来这才是噩梦的开始!不同版本的WordPress里的xml格式各不相同,几乎可以这么说,越往后越严格越来越严格了。于是我又安装了WordPress 3.9和2.8。3.9的WordPress在PHP 7之下马马虎虎可以运行,2.8是直接连数据库都连不上…… 于是我甚至不能从通过低版本的WordPress N轮导入导出拯救世界……

没办法,我只能研究我手头上的xml,看看和现在的标准版差多少。首先,必备填写一个WXR的版本号。在旧版本里,这条规则是这是不存在的,所以要手动加入。同样需要手动加入的就是,即文件类型,因为现在的WordPress把文章分成了post和page。把这些搞定以后,基本上正文就可以导进去了,但是分类和标签还是不行。因为现在的分类和标签,WordPress使用的是一个叫做nice name的东西,你必须在分类和标签那里,加上这个标注0才能识别的出来。评论那里,当年就试过在2.8的版本里面评论正常,但是在2.9里面,有评论的话会只剩下一条评论。研究发现,那是因为评论有了一个id号。BlogBus转码过来的东西没有id号,所以大概东西就自动覆盖了。除了这些BlogBus和WordPress之间的格式问题以外。我的文章里还有格式的=问题,因为有些东西,不完全是我自己的东西,好些是我从网络上搜集回来的。当时我保存了网页,在BlogBus发布的时候直接复制到可视化编辑器,所以格式也带入了。如果当时我懂得先把东西贴到记事本,然后再剪切粘贴一次,就不会存在这种问题。除了格式以外,从前的blog里还有图片,但经过这么多年,图片都已经失效了,链接摆在那里只会浪费加载时间和访客的期待,所以我要把图片链接也尽可能去掉。有些图片链接是我没办法去掉的,因为用正则筛选的时候会遇到一些很屌丝的句子,到了某个点,就卡住了,但实际上那并不是这个标签的结束。

搞清那些规则,总结出我的对策。一次又一次查找替换,一次又一次导入删除再导入。花了一整个下午加半个晚上的时间,我总算搞定了从前BlogBus上的BLF!文章238篇齐全,评论56条也齐全!!!其中可能会有一些小格式上毛病,但是那并不是共性的问题,后续还得靠运气慢慢修改。

非常有必要记录一下我在Notepad++上做的WordPress不同版本xml转换操作

/*操作开始*/

普通替换《channel》为《channel》《wp:wxr_version》1.1《/wp:wxr_version》 /*WP XML共性问题*/
普通替换《category domain=”category”》为《category domain=”tag”》
普通替换《dc:creator》《/dc:creator》
为《dc:creator》《![CDATA[xrspook]]》《/dc:creator》《wp:post_type》《![CDATA[post]]》《/wp:post_type》《category domain=”category”》《![CDATA[回到过去——Betty迷的独白]]》《/category》 /*《/wp:post_type》前是WP XML共性问题*/
普通替换《BR》《BR》为《BR》
普通替换《!–msnavigation–》为无
普通替换[summary_of_BLF]为[summary_of_BLF(from_rincondebetty)]
普通替换[summary_of_EcoModa]为[summary_of_EcoModa(from_rincondebetty)]
普通替换《category domain=”tag”》《![CDATA[(from_rincondebetty)]]》《/category》为无
普通替换[Yo soy Betty, la Fea]为[Yo_soy_Betty,_la_fea]
普通替换[JEA’s Writting]为[JEA’s_Writting]
普通替换”博主”为”xrspook”
普通替换《i》为无
普通替换《/i》为无

正则替换category\”》《\!\[CDATA\[(.*?)\]为category\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换tag\”》《\!\[CDATA\[(.*?)\]为post_tag\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换《[TDSFHI].*?》为无
正则替换《/[TDSFHI].*?》为无
正则替换《P.*?》为《P》
正则替换《(table|tbody|tr|td|div|span|img|script|font|hr).*?》为无
正则替换《/(table|tbody|tr|td|div|span|img|script|font).*?》为无

《wp:comment》《/wp:comment》中增加《wp:comment_id》1《/wp:comment_id》,id数字递增 /*WP XML共性问题*/

/*操作结束*/

注:请自行替换《》为<>,用尖括号那是全部都挂掉无法显示的节奏啊啊啊

这个是一次死去活来的经历啊啊啊啊啊啊啊啊啊啊啊啊!奇怪的知识又增长了不少……

2020-03
21

坚果云减肥

By xrspook @ 17:17:48 归类于: 烂日记

花了半个下午的时间,我整理出了自己坚果云上面很多其实现在已经用不着的东西。那些文件通常都是已经不用的文件,或者下载回来以后我就没看过几眼的。我只是把东西放在那里。所以,把那些东西扫地出门以后,我的坚果云不算共享数据的部分,就只剩2GB不到,里面有些东西我还可以继续继续删除,所以即便加上共享的部分,理论上我也可以把文件控制在2GB以内。2GB以内那是一个什么概念呢?坚果云的免费账号同步是要算流量的,上传流量每月1GB,下载流量每月3GB。如果我要在一台新的电脑上同步坚果云。如果完全靠下载,我在坚果云上的文件就必须要小于3GB。显然那样对从前的我来说太难了。以前我就从来没想过可以这样,因为在使用坚果云之前,我用的是Dropbox。我的Dropbox空间很大,因为做了很多任务,我不再用那个服务之前,我的空间有10GB以上。当然,在我不用Dropbox以后,貌似他们改变了一些策略,所以我的空间应该已经没有那么多了,但也无所谓,因为在我停止使用Dropbox同步我的文件之前,我已经把那些东西像蚂蚁搬家一样慢慢的挪到坚果云。

我已经使用了多少年的坚果云呢?我已经无法算清。之所以开始的时候要蚂蚁搬家,是因为我要同步的内容远远大于1GB。把东西都拿到坚果云以后,使用过程中,我又不断地往里面放东西。在我记得的时候,大的文件我是不会往里面放的,但一些我觉得还可以接受的东西,就没有挪走。就因为这样,我的坚果云越来越大,到我今天突然觉得要清理的时候,里面已经有超过7GB的东西。开始用坚果云之后我也换过电脑,但之所以还能同步的过来,是因为每次我都是手动把那些文件复制到U盘上,然后再拷贝到新电脑的某个地方。接着把坚果云的同步连接设置到那里。只有这样才能减少同步消耗的流量。如果我路径设置正确,这样的挪动几乎不消耗坚果云流量,因为坚果云启动以后就只是核对一下那些文件而已,但我也搞不懂,为什么即便是这样,有些文件还是会有冲突,尤其是office类的文件。图片和普通的txt通常不存在这种问题,Excel出现这种问题的概率最大。我把坚果云上的东西减肥,就意味着我在新电脑上同步又方便了好多。虽然即便这样,我还是不会在新电脑上登陆坚果云,让他们从零开始,帮我把文件同步过来。在局域网下,同步其实是很快的,但问题是,我何必浪费那些流量呢。

今天在给文件减肥的时候,我一边减肥一边用MindManager做思维导图,说清楚我减掉的是哪个文件夹里面的哪些文件。这样翻查的时候,我还可以找得到。其实我并不是把那些文件删掉了,我只是把那些文件挪到一个坚果云同步以外的地方。挪动完毕以后,我爸挪走的文件连同思维导图,以及思维导图导出的图片专门做了个压缩包,然后丢到另外一个别的地方。同时也把这份大的压缩包上传到网盘。对一些我拿走了的,但可能会直接用到,我不想把整个包下载回来才使用的东西,我单独上传了一些文件夹。确保我可以直接到达那些东西。家里的电脑现在用的是双硬盘,我两个硬盘里都放了一份,一个是用7z压缩包,另外一个则纯粹是嵌套的文件夹。除了这两个完全一样的东西以外,电脑其中一个硬盘到某个位置还有我大概一年多以前的坚果云内容,因为那时我在新硬盘上装系统,但旧硬盘的系统我没有删掉,里面的内容也没有修改,所以坚果云的东西还在那里。

定期减肥是个好习惯啊~

2020-03
20

偶遇VSCode

By xrspook @ 9:27:33 归类于: 烂日记

昨天晚上但我吃完饭回到宿舍,拖完地要去办公室之前,我跟书桌上的外婆说,今晚总算没那么多板上的任务,我会早点回来。结果我还是很晚才回宿舍,甚至比平时还要晚,因为我洗完澡的时候已经超过了晚上11点。昨天跟之前几天不一样,因为昨天单位有卸船作业,所以我还得在手提电脑上忙一阵单位的事情。我很痛恨自己的拖延症,跟之前几晚相比,昨晚我的确是很闲的,但正是因为我很闲,所以我就去看了一下自己订阅的东西,结果就发现一个,很好玩的跨平台,出自微软,轻量级的编程软件。之前基本上可以这么说,我没用过编程软件,一直用的最多的是Notepad++,但那只是个代替Windows记事本的工具。的确很便携,而且在处理代码的时候也有高亮显示,字体大小和格式很自由,体积很小,我已经用了很多年,一直觉得很爽,因为用那个东西,有后悔药。即便我按了保存,还是可以后退很多步,至于一共能后退多少,我还真没研究过,装上插件以后,可以有跟多形式的自动保存,比如当光标离开软件以后,东西就自动保存了。又或者我可以设置,多少时间就保存一次。写代码这种东西,最慌的就是改完以后才发现,没改之前更好,但是软件不能后退,没有后悔药。跟Office软件比起来,Notepad++的后悔药好用多了。因为Office软件一旦按了保存,之前的东西就后退不了了。而且Notepadd++打开文件的速度非常快,即便是很大的数据文件也没有问题,比如说,几十MB的XML文件。为什么会有那种东西?其实那个就是我WordPress导出的数据,是我10多年来blog的日志数据。我不知道如果那些东西拿去出书的话,那本书得有多少页。其实我还真有想过会不会有一天无聊地把自己的blog拿去出书。但为什么要出纸质版的书呢?电子书其实也行。把我的blog静态打包下来,就是一本电子书。

回到Notepad++加上,虽然那个东西可以用来写代码,但跟专业的写码软件比起来,还是挺不方便的。虽然其实Notepadd++也有不少插件,但是跟别人的插件比起来,好像还是欠缺点什么。如果纯粹是文字,不是代码的话,我觉得它非常优秀了。比如说我经常用来核对字幕哪里修改了。之前我并不觉得Notepad++不适合用来写代码,直到昨天我看到了那个VSCode以后。在那里保存一个后缀为HTML的文件以后,你只需在那里输入一个东西,之前之后的那些格式全部都自动生成了,而且全部都已经标记好颜色,做好了缩进。那个东西自带了emmet功能,快速写码变得易如反掌,因为只需要写一点点东西,一大串成对的代码就出来了,于是,妈妈再也不用担心我丢三落四,因为成对的代码会自动出来,代码可以出来,我觉得自动缩进不会有啥状况。一直我都在搞blog,我一直都只是在做前端的设计,看到这些功能以后,我简直震惊了,用这个东西写码,只要你有思路。只要你有灵感,写一个网页相当快捷简单。不过绝大多数时候,我觉得前端设计还是需要一些脑洞的,比如说你根本没想到可以那样做的话,你怎么可能写得出来。

因为看到那个让我兴奋的软件,而且还是便携的,直接解压使用,无需安装(但是很大,解压后200多MB),所以洗澡的时候我考虑过要不要再写一个WordPress模板,那个blog用来存放我从前做过的那些blog。那些不是我主站的blog,比如说BLF的、JEA的、以及ADR的。那里的东西有些不是我的,但是很大一部分都是我磨出来的。曾经,我在那里倾注了非常多心血。那是我曾经的兴趣所在。那些东西是我人生的一部分,但是,他们以前的家已经消失了。BlogBus没有了,点点也没有了……我觉得我应该让他们重生。

写一个网站的前端需要灵感,但网站的核心是内容。首先,我要考虑怎么把BlogBus和点点导出来的数据转化为WordPress可以理解的内容。

2020-03
19

突发卡机

By xrspook @ 9:40:49 归类于: 烂日记

前天才刚刚搞定了blog模板的问题,昨天我又遇到了新状况,而这一次是电脑,而且是我办公的电脑。情况很突然,我根本搞不懂是为什么,中午的时候还好好的,因为我中午没有休息,一直在改某篇狗屁不通的岗位职责,几乎可以这么说,那里的每一句话都是有问题的,要不就是那句话自己有状况,比如说动宾结构有问题,又或者是措辞不当,也有可能是前后不搭调,又或者同一个意思等那句话不断重复。该说的东西没说,但一些鸡毛蒜皮的东西、点点滴滴都写在上面,毕竟那是个岗位职责,而不是个工作清单。即便是工作清单,也要分场合展开,岗位职责实际上就是一些很大条的东西。之所以这样,首先原因是空间有限,其实是因为把东西的范围扩大一些,那么在工作中开展的方向也可以广一些,不应该把一些琐碎的东西摆上桌面,别人拿着这个岗位职责去挑剔你的时候你就容易呵呵了。岗位职责应该是岗位的亮点,如果这个岗位没有存在的意义,你当然就没必要存在了。所以呢,那必须体现出你的工作量,体现你的重要性,但同时也要做到可以保护好自己,不那么容易被路人甲拿着条文去挑刺。当然,绝大多数情况下,那些东西都只是墙上的文字,只是用来应付检查,让别人知道你有制度上墙了而已。

做了那么多年的统计,我居然不知道现存那个版本的岗位职责到底是谁写的,又或者那是从哪里抄回来的。居然可以抄得这么狗屁不通!好不容易我在电脑里居然翻出了2009年和2012年我们单位的管理条例,里面也有统计的岗位职责,对比那个我花了一个中午去修改的那个版本,通顺多了。虽然里面写到的有些东西有些不符合我们单位的实际,应该适当修改,但即便怎么修改,都不会修改得像我中午遇到那篇东西那样无厘头。几乎可以那么说,那篇东西是某个人完全凭借着他的感觉写出来的。我也不知道他那个是什么感觉,但可以肯定的是,实际上他看到的东西是错觉,因为他连最简单的逻辑和分类都搞错了。

花了一个中午的时间,我还是没办法改好那篇东西改好,因为要改的太多了,还不如让我直接重新写一个,而且我还一边改一边纠结应该用什么格式。我改了大半天之后,我的领导才告诉我要用审阅模式去改。一开始我就有想过要不要用审阅,但是想到,我们的人会不会太低端,看不懂审阅,所以我就用了普通的格式去改。

一个中午,没什么结果,下午又要开会,开了大概两个小时的会,回到办公室,却发现电脑打开东西非常慢。平时顶多一两秒就能打开的Excel表格我居然花了15秒钟以上才终于打开,打开之后,操作的时候可能会慢一些,但还是可以操作的。打开一个文档以后,再打开另外一个,打开的速度会快一点,但是跟平时相比还会有些慢。开Excel的速度会比开Word慢非常多。不只是Office软件,整个系统都感觉很卡,我实在不明白这到底是为什么。我唯一能想到的就是中午在修改那篇狗屁的时候,屏幕中间弹出了flash的广告。正常情况下大概一两秒之内360杀毒就会把那个弹窗干掉,但因为当时我正在处理文件,所以在360动手之前我就已经咔嚓掉了两个窗口,但是那两个到底是什么窗口,我其实没看清。我感觉那应该是一些IE插件的窗口,但为什么flash的弹窗广告会有那些东西呢?正常来说。那些窗口会在我们打开一些莫名其妙网站的时候出现,非常有可能是我咔嚓掉flash弹窗广告的时候不小心按到了某些真正是广告的东西。

接下来,我就在纠结那个慢到无法忍受的Office,以及其它东西也会莫名卡顿的系统。晚上我甚至找了微软的客服,他们告诉我了一些方法,但还是不太行,最终普通在线客服让我留下电话和姓名,说1~8个小时之内工程师会联系我,但我拒绝了,因为那时已经不早,我不想把一整个晚上都耗在那里。我觉得那应该是系统的问题,而不是Office软件自己的问题。回到宿舍后,我试了一下自己荣耀magic box上的Office 365,一切正常顺畅。当我测试过自己手提电脑上的Office系统以后,我才再次明白到,单位那台办公台式机上的软件是慢到了一个什么程度。

几乎可以这么说,今天我首先要把电脑系统的问题解决掉,要修复一下系统漏洞,杀一下毒,查一下木马。甚至要整理一下系统的碎片之类。如果真的是硬盘的问题的话,大概只能换一个了。

2020-03
18

全屏搜索大功告成

By xrspook @ 20:04:21 归类于: 烂日记

昨天,我把COLOR3模板的搜索功能终于做上去了。从前的搜索都非常简单,就是在网页上做一个输入框,然后再加一个提交按钮,搜索都这样。我有想过要不要在WordPress里形成一个搜索的页面,然后要搜索的话就到那里输入内容然后提交,最后返回搜索结果。这样做显然就绕了一圈,我在任何一个页面想搜索,就必须先到达那里,于是网站就要在那两个地方跳转。对于我来说这个体验肯定是不好的。因为这就意味着又要重新把网页加载一次。直接在任何一个页面就能提交搜索然后反馈得出答案跟多绕一圈差别很大,起码我个人觉得这样很折腾。

现在跟10年前的区别大概在于搜索的花样多了很多,比如现在终于可以通过CSS做出比较好看的效果,从前那只是CSS的一个美好梦想。CSS的改进让我印象深刻的是鼠标悬停时的过渡效果以及半透明的展示。从前要展示半透明,每个浏览器出来的东西还不一样,所以写一个效果还得备着多个浏览器的不同选择版本。如果是Chrome和Firefox还好一点,版本兼容性还不错。如果遇到不同版本的IE,出来的东西千差万别。我没有去研究过现在主流的浏览器都有哪些,但可以肯定的是,非常大一部分用户是的是智能设备,而不是传统的PC电脑,所以即便是看到主流浏览器的使用比例,参考性也不大。

从前,当我有了自己的网站,又或者说我有了自己的blog以后,即便blog在BSP上,我已经试图在做网站优化,尽量的让搜索网站能找到我的东西。但现在我已经完全不在乎那些东西了。所以,我连Google的SEO插件也直接删掉。百度也好,Google也好,其它搜索引擎也好,收不收录,收录多少我根本无所谓,搜索得到,搜索不到,我没兴趣去知道,从前我隔一段时间就会神经病地在搜索网站上找自己,但现在我完全不这么干了。那对我来说毫无意义。比如说我在B站上有了账号,而某些视频的点击率又很高。非常有可能,在搜索网站输入我的网名出来的大都是那些点击率很高的东西,不知道看到多少条才看到我自己的blog,但什么重要,什么不重要,哪些有价值,哪些才是我的代表作,我心里明白,我不需要知你们觉得,我不需要知道网页爬虫觉得。之所以要把网站搞好,是因为我要对自己负责。首先网站要让我自己觉得顺眼好看,我自己用得舒服,其次才是别人的浏览体验到底如何,或者我是否应该根据访客的需求进行改进。这么多年以来,我已经习惯了网站一直都冷冷清清。对我来说,有人评论是稀罕事,没人评论是再正常不过的常态,但因为我每天都会写blog,所以即便没有评论,我也要去那里去看一眼,但非常有可能一天就只看那么一眼。

回到搜索功能这个话题上,这一次我给网站配置的搜索是一个全屏搜索。因为我把链接做在版头的导航栏上,所以blog里任何网页都能到达,但是连接我做得有点隐晦,不是正常人所熟知的那种放大镜,所以要找到那个功能,可能会有点难。搜索很简单,就是点击一个像链接一样东西,然后就会有个全屏的搜索框,把需要搜索的关键字敲进去,回车就能得到结果。那个全屏搜索的界面很简洁,甚至没有提交按钮,只有右上角的一个X,作为关闭窗口。会不会有人不知道如何提交搜索内容,有没有人找不到右上角的X把这个搜索界面关掉呢?我不知道,但我相信,可能会有这种存在。这个炫酷的搜索功能是CSS和JS的配合,但是JS只用了非常简单的两条语句。我在CSS那里用了半透明的句子,从前这种东西在浏览器可能行不通,但现在无论是IE还是非IE,效果都很好。因为我是一个懒到了极点的人,所以在做这种全屏搜索的时候,我并没有加其它特效,比如说渐变。那的确很好看,但意味着要加载更多的语句。现在我已经很满意搜索界面的效果了,我把字体搞得很大。能摸到那个搜索入口,试用过以后,估计会觉得很爽,起码我自己是这么觉得的。

过去几天我就像一个少年一样,改进自己的东西,这种专心致志的感觉非常好。

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress