2020-03
22

折腾不同版本的WXR

By xrspook @ 22:09:44 归类于: 烂日记

我只是想把自己从前的东西重新拿出来,原来这也会很难,这是我完全没想到的。要找回那些尘封10年的文档,并不算太难,翻一下电脑也就找到了,虽然有点坎坷,因为当时备份的时候,我没有标注是哪个网站的,xml都放在一起,我以为那都是我主站的,后来,同一个日期不同的文件大小才让我觉得有蹊跷。xml文档找到了,接着要把它转化为WordPress的格式。当年用来转换文档的脚本找不到了,翻遍家里电脑的各个盘都没找到。之所以在家的电脑找不到,是因为当时干这事我是在单位完成的。所以理论上单位的电脑应该有,但是因为换过电脑,我也清理过同步盘,所以会不会也因此清理掉呢?这个我不确定。我觉得,在我转格式的时候,我仍然在用Dropbox,里面的很多东西我的确已经清理了,于是这也很好解释,为什么我家里电脑的Dropbox文件夹里找不到那个脚本。家里的电脑没有,单位的电脑可能有,但还有一种可能性,我把那上传到网盘,于是就把那同步软件里撤掉了。我只会上传到两个地方,一个是百度,一个是115。115打开很麻烦,我也懒得下载打开它的工具。百度上果然就有我要找的东西,但当我想把整个文件夹下载回来的时候,问题严重了,那里居然有4000多个文件。下大文件的时候度娘就很慢,下小文件的时候度量更慢,那是直接10KB以下的速度。我直接去网页版的度娘找到我要的东西,不在客户端里等它慢慢下载了。

东西下载回来以后,我再翻查我的日志,我需要安装一个Python。我默认安装的是现在最新的版本3.7.7,但运行脚本以后却发现才刚刚开始读取脚本,就马上报错。查找原因,原来是版本之间的语法差异。才刚刚开始就错,要运行完整个脚本,我真不知道还得修改我根本不懂的语法。所以,我把最新的Python卸载掉了,重新安装当时我就在那个版本下转换的2.6.5。2.6.5是一个什么概念?这意味着时光倒流10年。

出乎我意料,软件装好以后,我几乎没遇到困难就可以把BlogBus的文档成功转为了WordPress的格式。在下载Python的时候,我顺便下载了XAMPP,同样下载的是最新的版本。前段时间我才刚用过,觉得挺爽。我也下载了最新版的WordPress的5.3.2。同时把导入插件也装。当我试图上传,已经转过格式的xml是,上传报错。原来这才是噩梦的开始!不同版本的WordPress里的xml格式各不相同,几乎可以这么说,越往后越严格越来越严格了。于是我又安装了WordPress 3.9和2.8。3.9的WordPress在PHP 7之下马马虎虎可以运行,2.8是直接连数据库都连不上…… 于是我甚至不能从通过低版本的WordPress N轮导入导出拯救世界……

没办法,我只能研究我手头上的xml,看看和现在的标准版差多少。首先,必备填写一个WXR的版本号。在旧版本里,这条规则是这是不存在的,所以要手动加入。同样需要手动加入的就是,即文件类型,因为现在的WordPress把文章分成了post和page。把这些搞定以后,基本上正文就可以导进去了,但是分类和标签还是不行。因为现在的分类和标签,WordPress使用的是一个叫做nice name的东西,你必须在分类和标签那里,加上这个标注0才能识别的出来。评论那里,当年就试过在2.8的版本里面评论正常,但是在2.9里面,有评论的话会只剩下一条评论。研究发现,那是因为评论有了一个id号。BlogBus转码过来的东西没有id号,所以大概东西就自动覆盖了。除了这些BlogBus和WordPress之间的格式问题以外。我的文章里还有格式的=问题,因为有些东西,不完全是我自己的东西,好些是我从网络上搜集回来的。当时我保存了网页,在BlogBus发布的时候直接复制到可视化编辑器,所以格式也带入了。如果当时我懂得先把东西贴到记事本,然后再剪切粘贴一次,就不会存在这种问题。除了格式以外,从前的blog里还有图片,但经过这么多年,图片都已经失效了,链接摆在那里只会浪费加载时间和访客的期待,所以我要把图片链接也尽可能去掉。有些图片链接是我没办法去掉的,因为用正则筛选的时候会遇到一些很屌丝的句子,到了某个点,就卡住了,但实际上那并不是这个标签的结束。

搞清那些规则,总结出我的对策。一次又一次查找替换,一次又一次导入删除再导入。花了一整个下午加半个晚上的时间,我总算搞定了从前BlogBus上的BLF!文章238篇齐全,评论56条也齐全!!!其中可能会有一些小格式上毛病,但是那并不是共性的问题,后续还得靠运气慢慢修改。

非常有必要记录一下我在Notepad++上做的WordPress不同版本xml转换操作

/*操作开始*/

普通替换《channel》为《channel》《wp:wxr_version》1.1《/wp:wxr_version》 /*WP XML共性问题*/
普通替换《category domain=”category”》为《category domain=”tag”》
普通替换《dc:creator》《/dc:creator》
为《dc:creator》《![CDATA[xrspook]]》《/dc:creator》《wp:post_type》《![CDATA[post]]》《/wp:post_type》《category domain=”category”》《![CDATA[回到过去——Betty迷的独白]]》《/category》 /*《/wp:post_type》前是WP XML共性问题*/
普通替换《BR》《BR》为《BR》
普通替换《!–msnavigation–》为无
普通替换[summary_of_BLF]为[summary_of_BLF(from_rincondebetty)]
普通替换[summary_of_EcoModa]为[summary_of_EcoModa(from_rincondebetty)]
普通替换《category domain=”tag”》《![CDATA[(from_rincondebetty)]]》《/category》为无
普通替换[Yo soy Betty, la Fea]为[Yo_soy_Betty,_la_fea]
普通替换[JEA’s Writting]为[JEA’s_Writting]
普通替换”博主”为”xrspook”
普通替换《i》为无
普通替换《/i》为无

正则替换category\”》《\!\[CDATA\[(.*?)\]为category\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换tag\”》《\!\[CDATA\[(.*?)\]为post_tag\” nicename=\”\1\”》《\!\[CDATA\[\1\] /*WP XML共性问题*/
正则替换《[TDSFHI].*?》为无
正则替换《/[TDSFHI].*?》为无
正则替换《P.*?》为《P》
正则替换《(table|tbody|tr|td|div|span|img|script|font|hr).*?》为无
正则替换《/(table|tbody|tr|td|div|span|img|script|font).*?》为无

《wp:comment》《/wp:comment》中增加《wp:comment_id》1《/wp:comment_id》,id数字递增 /*WP XML共性问题*/

/*操作结束*/

注:请自行替换《》为<>,用尖括号那是全部都挂掉无法显示的节奏啊啊啊

这个是一次死去活来的经历啊啊啊啊啊啊啊啊啊啊啊啊!奇怪的知识又增长了不少……

2020-03
20

偶遇VSCode

By xrspook @ 9:27:33 归类于: 烂日记

昨天晚上但我吃完饭回到宿舍,拖完地要去办公室之前,我跟书桌上的外婆说,今晚总算没那么多板上的任务,我会早点回来。结果我还是很晚才回宿舍,甚至比平时还要晚,因为我洗完澡的时候已经超过了晚上11点。昨天跟之前几天不一样,因为昨天单位有卸船作业,所以我还得在手提电脑上忙一阵单位的事情。我很痛恨自己的拖延症,跟之前几晚相比,昨晚我的确是很闲的,但正是因为我很闲,所以我就去看了一下自己订阅的东西,结果就发现一个,很好玩的跨平台,出自微软,轻量级的编程软件。之前基本上可以这么说,我没用过编程软件,一直用的最多的是Notepad++,但那只是个代替Windows记事本的工具。的确很便携,而且在处理代码的时候也有高亮显示,字体大小和格式很自由,体积很小,我已经用了很多年,一直觉得很爽,因为用那个东西,有后悔药。即便我按了保存,还是可以后退很多步,至于一共能后退多少,我还真没研究过,装上插件以后,可以有跟多形式的自动保存,比如当光标离开软件以后,东西就自动保存了。又或者我可以设置,多少时间就保存一次。写代码这种东西,最慌的就是改完以后才发现,没改之前更好,但是软件不能后退,没有后悔药。跟Office软件比起来,Notepad++的后悔药好用多了。因为Office软件一旦按了保存,之前的东西就后退不了了。而且Notepadd++打开文件的速度非常快,即便是很大的数据文件也没有问题,比如说,几十MB的XML文件。为什么会有那种东西?其实那个就是我WordPress导出的数据,是我10多年来blog的日志数据。我不知道如果那些东西拿去出书的话,那本书得有多少页。其实我还真有想过会不会有一天无聊地把自己的blog拿去出书。但为什么要出纸质版的书呢?电子书其实也行。把我的blog静态打包下来,就是一本电子书。

回到Notepad++加上,虽然那个东西可以用来写代码,但跟专业的写码软件比起来,还是挺不方便的。虽然其实Notepadd++也有不少插件,但是跟别人的插件比起来,好像还是欠缺点什么。如果纯粹是文字,不是代码的话,我觉得它非常优秀了。比如说我经常用来核对字幕哪里修改了。之前我并不觉得Notepad++不适合用来写代码,直到昨天我看到了那个VSCode以后。在那里保存一个后缀为HTML的文件以后,你只需在那里输入一个东西,之前之后的那些格式全部都自动生成了,而且全部都已经标记好颜色,做好了缩进。那个东西自带了emmet功能,快速写码变得易如反掌,因为只需要写一点点东西,一大串成对的代码就出来了,于是,妈妈再也不用担心我丢三落四,因为成对的代码会自动出来,代码可以出来,我觉得自动缩进不会有啥状况。一直我都在搞blog,我一直都只是在做前端的设计,看到这些功能以后,我简直震惊了,用这个东西写码,只要你有思路。只要你有灵感,写一个网页相当快捷简单。不过绝大多数时候,我觉得前端设计还是需要一些脑洞的,比如说你根本没想到可以那样做的话,你怎么可能写得出来。

因为看到那个让我兴奋的软件,而且还是便携的,直接解压使用,无需安装(但是很大,解压后200多MB),所以洗澡的时候我考虑过要不要再写一个WordPress模板,那个blog用来存放我从前做过的那些blog。那些不是我主站的blog,比如说BLF的、JEA的、以及ADR的。那里的东西有些不是我的,但是很大一部分都是我磨出来的。曾经,我在那里倾注了非常多心血。那是我曾经的兴趣所在。那些东西是我人生的一部分,但是,他们以前的家已经消失了。BlogBus没有了,点点也没有了……我觉得我应该让他们重生。

写一个网站的前端需要灵感,但网站的核心是内容。首先,我要考虑怎么把BlogBus和点点导出来的数据转化为WordPress可以理解的内容。

2020-03
12

找到凶手了!!!

By xrspook @ 9:07:38 归类于: 烂日记

最上一次大型自己blog的模板可能已经是10年前的事了,具体什么时候回去我还得查一下自己的日志。因为时间太久远,所以根本不记得。可以确定的是,大概在2010年之前,我还没用WordPress整blog,当时我用的BlogBus,根本没想过几年后我会和BlogBus缘尽。之所以这两天我突然想起要折腾,是我发现原来不只是在后台,在前台评论我自己的文章的时候也会出现网站发生致命错误的提示。我不明白这到底是什么鬼,反正当我把WordPress从4.0升级到5.0的时候,就发生了这种事。因为从4.0升到5.0问题太多,所以我根本没有把这个当做回事,比如说我每天都要碰到的撰写的编辑框,从一开始,那个传说中的区块编辑器就不可用,所以升到5.0以后,我不得不使用插件,继续使用经典的编辑器,但是,经典的编辑器什么时候会不支持,这非常难说。区块链编辑器从他们的介绍看来,相当的牛逼。当然把WordPress 4.0升级到5.0还需要PHP以及数据库等东西协同升级。WordPress进行了大升级,支持WordPress的东西也进行了很多高级别的升级,所以我真不确定之前做的模板以及使用的插件还兼不兼容。发生一系列状况的时候。我就有想过是那些东西不兼容。因为还在用4.0的时候,我从来没遇到过这种状况。那种奇怪的现象是发布文章的时候。会突然间跳出404页面。这种事404不一定会发生,但说不准什么时候会发生,但即便发生了,其实文章也是正常成功发布的。可以肯定一定会发生的是评论的时候,一定会有红色字体弹出,告诉我发生致命错误。

为了搞清到底这是怎么回事,所以我又在电脑上装了个XAMPP,从前我就是用这个软件单机测试WordPress插件以及创作我自己的模板的。对上一次用这个软件已经是在另外一台电脑上。总感觉安装这个东西有点麻烦,虽然用的时候很方便。现在的WordPress和从前的WordPress最大的区别在于在中国如果不爬梯子的话没办法访问到WordPress的官方网站。他们说并不是他们故意把我们墙了,而是因为某些其它的原因,到底是故意还是不是,谁知道呢。从中国这边访问WordPress官网出现429开始,已经过去快半年了,情况依旧。所以对那些把WordPress部署在国内服务器的人来说,升级WordPress和升级WordPress的插件都相当痛苦。几乎可以这么说。如果他们无法访问自己的FTP的话,或者手动安装一些据说很有风险的插件的话,是无法升级的。我在自己的电脑上单机部署WordPress,也会存在升级这个烦恼。大概因为我使用的梯子不是全局起作用的,所以无法访问官网,会出现429的错误,所以升级的时候我就得手动,访问插件的官网地址,然后把那下载回来,用zip的方式安装。

新部署的WordPress后,当我把自己内容都放回去以后,所有插件默认是禁用状态的。我启用第1个插件以后,就找到了问题。因为在启用之前,评论是正常的,启用之后就傻瓜了。我相信凶手就是它!当我把十几个插件都试了一遍以后,最终敲定,的确那就是凶手。抓到凶手以后,我还顺便找出了自己为什么没办法用区块编辑器。结论是,不是因为我的插件有冲突,也不是因为我很多年前写的模板太低端,而是因为我没有启用可视化编辑器。自我开始使用WordPress以来,我就从来没有启动过可视化编辑器,泪奔~~~ 这些年我都是怎么熬过来的啊啊啊啊啊啊啊啊啊啊!

接下来我会花点时间修改一下很多年以前设计的模板,主要做的是简化,会合并一些功能,然后再改一改门面。从前我觉得很有必要堆砌起来的东西,现在看来无所谓了。

不同的时代有不同的特点,我是时候做一些改变了。

2019-07
5

我搜我

By xrspook @ 9:02:04 归类于: 烂日记

还记得刚开始上网的时候,我过一段时间就会搜索一下自己的网名,看一下出来什么信息,但这种事我已经很多年都没干过了,准确来说估计10年以上都没干过这种事了,昨天我又无聊地搜索了一下,出来的结果挺让人惊讶。

首先,我去度娘那里搜索,出来的第1条记录是我的B站主页,这很正常,但让我有点吃惊的是B站居然超越了我全部的网上驻留地,实际上,我大概是2017年才开始在B站活跃起来的,在那之前我一直在用的土豆跟优酷合并了,变成了一个残废的东西,很多视频都转码失败或者审核不通过,即便通过了,也不知道会不会过一段时间又被打下来,让人很痛心是从前我的视频几乎都在土豆,但是在改制以后,我很多视频都变成无法播放。那个时候,我急需一个替代方案,当时我选择的是B站。因为他们的视频完全没有广告,而且清晰度也很好。虽然据说那是个二次元的东西,我做的东西一点都不二次元,但我也明白那些沉迷于二次元的人有些很牛。相对于其他视频网站的打开速度和点击量,B站貌似还可以。当我决定要在那里开号的时候,却遇到了注册困难。因为如果没有高级会员的邀请。我就要回答100道题,而且其中很多是二次元的,我根本就不知道他们在说什么。答题要达到一定的分数才可以注册,这实在太为难我了。有些题目,我靠常识回答,有些完全搞不懂是什么的,就去度娘搜索,但还是有一些找不到答案。我从来没有试过注册一个网站需要这么努力。入会的时候很艰难,但是之后的经历我觉得挺不错。虽然在网络繁忙的时候,他们的审核需要很长时间。网络通畅的时候可能十几分钟就可以了,但如果网络非常不通畅,可能得花上6个小时以上。至今为止,B站给我的感觉都很好,因为起码没有给我飘广告。他们的管理界面没有广告,他们的视频播放界面也没有。但毕竟那个地方通常都是一些二次元的聚集地,所以无论是弹幕还是评论,总会有一些完全超乎我意料的东西。浏览量、评论数、弹幕数这些东西的确可以鼓舞人,但显然我不是为那些而活的。如果我只为了那些流量去做,我根本不可能有动力做下去。一直以来,我都是自己跟自己较劲,我觉得那个东西我喜欢,我希望别人也看到,那么我就去做了。视频的制作需要花心思,视频的信息也一样。在B站,除了发布视频以外,我也会发布一些翻译的文章,之所以把东西都放在那里,是因为我觉得可能看的人会多一点,而且他们的后台和前台界面我都比较喜欢。度娘的搜索结果除了B站的链接以外,还有我blog的链接,豆瓣的链接,还有一些我说不上到底是什么东西。反正总体来说,从度娘出来的第1页结果看来,我貌似是个挺文艺的人。

然后我又用了必应的国内版国际版以及G老师去搜索。必应出来的结果最让人无语,我不知道为什么会搜索出十几年前我某个老blog的网址,那个东西居然还没死,实在太让人惊讶了。G老师的结果也有点出乎我意料,我觉得那有点重点错。

总的来说,度娘、必应和G老师三个搜索引擎居然是度娘更能反映当下的我,难道这是因为我很久都没去外语网站混了吗?

2019-06
14

单机blog梦

By xrspook @ 8:46:14 归类于: 烂日记

昨天blog终于恢复了。在域名那里重新绑定服务器以后,一切终于恢复正常。从6月3号起发现上不了,到6月13号终于恢复整整10天时间,我落下了非常多的东西。虽然中间的那些东西我都有记录,所以只要耐心一点,我都可以补上,但显然一次性补17篇东西也是非常痛苦的一件事。经历过这一次以后,我有了自己在电脑上也保留一份存档的念头。是否有什么软件可以充当简单的数据库,实现blog的效果呢?对我来说,我并不需要界面漂亮,最重要的是记录下文字本身,需要的时候能足够快到达。需要记录的关键信息无非是文章标题、文章正文、记录的时间,文章的分类,以及关键词。

我可以通过标题、时间、正文或者关键词进行搜索,而文章的分类列表允许我把所有那个目录上的文章以某种排序方式展示出来。理论上说,WordPress的数据库结构大概也就这个样子。对我自己个人来说,界面不重要,所以等于无需进行前台版面的设计。要用什么东西实现这个功能呢?在正文里,我需要进行一些格式的设置,通常来说纯文本就足够了,但是某些词句如果能用到加粗和加入超连接会更好。这个东西也必须得默认可以插入图片和视频,图片是内部引用,视频其实就是一个超链接,但是可以在正文展示播放。

我不知道我的这个构想是不是实际上就是一个WordPress的后台结构。这其中没有非常严密的逻辑关系,用不到计算。Office的Wordd能实现格式的功能,而且我觉得格式个功能过于丰富了。Office有他们的数据库软件Access可以实现任何我想到想不到的数据存储及查询,但问题是即便我把数据存储进去,我查询正文出来的东西可能只是代码本身,而不能把某些代码转化为可见的格式。

在我WordPres的后台管理界面,有数据导出功能,但到现在为止,在这个我用了9年多的系统里,我还没试过做数据导出。这让人有点心惊肉跳,因为从2004年高考结束以后,加上在BlogBus的数据,我已经有15年的东西了。我已经不记得从BlogBus搬出来的时候我带着多少数据走人,也不知道在过去投奔WordPress的这几年我又积累了多少。可以预知的是即便全部都是脚本和文字,也一定内容相当丰富。如果导出的只是文字,而且又经过压缩,我估计数据的大小应该不会超过100MB。我不知道,如果我用导出功能会有什么后果。因为理论上,数据库的某个存储单元是有大小限制的,比如我的blog,附件大小最多2MB,所以如果那个导出的数据是一个超过50MB的东西,导出的时候会有什么后果呢?

前几年当Dropbox还能在中国不爬梯子使用的时候,我的网友每天都会把数据库备份,然后自动同步到我的Dropbox账号,但不知道从什么时候开始,已经不这么干了。我的房东是一个IT人士,所以他肯定知道数据备份的重要性,即便他不把那个同步到我的Dropbox,肯定他自己也会同步到某个地方。我不担心在他的管理下,我的东西会有什么问题,而且即便某天真的出状况了,其实每天blog的正文我都是有保存的,缺失的只是每天我发布上去时才写的分类、关键词以及网友的评论。

我总觉得应该有软件又或者有几个软件的联合体能实现我想要的功能。如果真的没有,或许以后某天我会自己整一个。

© 2004 - 2020 我的天 | Theme by xrspook | Power by WordPress