2018-06
12

图片文字识别

By xrspook @ 8:59:18 归类于:烂日记

因为很懒,不想把小说里面的东西一页一页地通过键盘输入。所以我想找一个可以拍照然后转化为数字格式文字的软件。其实文字识别这种东西,很久以前在PDF里已经可以,但问题是识别的效果有时真的很糟糕。尤其是遇到纯图片的PDF,从前的识别软件几乎无解。即便某些文献里不是图片的文字有时也会识别错误。十几年过去了,这些技术难道就没有发展吗?手机上安装了个Google Translate,他们有一个很屌丝的功能:当你把要翻译的东西放在他们镜头底下某个区域,他们就可以把那里的文字直接翻译成你需要的语言,毫无PS痕迹。这种效果是动态的,虽然很炫酷,但只对词语有效,而且我觉得只能停留在玩一年玩的水平。我需要的东西不是翻译,而是直接把汉字给我识别为汉字就可以了。

据说小米的系统MIUI 8扫一扫就隐藏了这个功能,我迫不及待了试了一下,结果让人很失望,因为识别出来的东西简直就是乱码一般狗屁不通。WPS也有这个功能,但他们识别出来的效果也不好,虽然那个功能,对非VIP来说只能用几次,但即便是这种VIP的功能其实也不好。我不想在手机里再安装其它软件,于是继续搜索,结果发现原来QQ的扫一扫也有这个功能。既然QQ扫一扫可以,所以我觉得微信的扫一扫应该也差不多吧,然后呢,我发现微信的扫一扫貌似只对二维码感兴趣,对文字识别无感。但是QQ的扫一扫就很强大,可以识别文字,也可以识别图片里那个是谁。这很方便,突然看到某个人的照片,尤其是明星类的,想不起他叫什么名字,拿QQ过去扫一扫就可以了。虽然他们说可以这样,但是我没试过拿QQ对着明星扫一扫。我的确拿QQ往书上扫一扫了,结果实在让人太惊喜,QQ识别的速度很快,而且只要你拍照恰当,光源合适,出来的效果相当好。有了这个神器,基本上遇到纸质的书本我们就不用烦了,但是因为这种扫一扫需要配合一定的条件,得出的文字才会准确。如果只是一两页纸扫一扫那是相当的爽,但如果你得想搞一本书,那就真的很痛苦了,不如在网上找一找有没有电子版的比较快捷。我想到的是既然他们可以通过这样的扫一扫识别文字,估计也有软件可以针对PDF里的图片识别出文字,而且速度要比这个快很多,之前我也的确干过这种事,因为当时要把PDF版本的东西放到kindle里阅读。虽然用kindle直接打开PDF也可以,但是阅读会非常辛苦,所以我通过某个软件把PDF转化为kindle专用的mobi。PDF里像图片一样的文字被识别为数字格式,但问题是那是本英语书。有些单词被分在两行,识别会把那当作两个东西,于是阅读的时候你就头大了。你必须具备神一般的单词合并能力进行脑补。既然英语可以识别,中文估计也没问题,但中文的复杂程度要比英语高很多。前晚本打算十点多就睡觉,结果因为这个扫一扫,扫了十几页纸,于是折腾到了11点多才睡觉。

科技进步,人活得越来越爽。

2017-09
10

单个图片mp3生成mp4

By xrspook @ 18:01:41 归类于:烂日记

今天花了好多个小时去研究怎么把一个图片和一个mp3合并一起生成一个mp4文件。从理论上说这很简单,不过是把图片的展示的时间等长于mp3。直觉告诉我,应该有一些很简单的脚本能实现这个功能。因为从油管下载回来的音频和视频可以通过一键完成合并。我不知道油管上面的视频和音频的长度是不是完全一致,反正对一张图片来说,那不过是跟音频等长而已,没什么设置的难度。我希望直接用我手头上的工具就实现这个功能。但实际上,貌似有点难度。如果不是要求那一定是视频文件,如果只需要展示,我们可以用PowerPoint。把图片设置为背景,把音乐设置为预览文件时自动播放,然后把文件封装。这种功能肯定非常容易实现,但问题是我要生成一个单独的视频文件,avi也好wma也好mp4也好mkv也好,反正那个视频文件,必须能被做字幕的软件识别。我就一连纠结了好多个小时。因为我觉得这是一个很容易实现的功能,所以一开始我去找一些能在线实现这个的网站。我第一次找的那个网站的确可以实现我想要的功能,但问题是那个网站生成的视频有好大的水印。如果要去掉水印就必须给钱,显然我是肯定不会做的。往后的一些网站,要不根本上传不了,要不速度非常慢,要不只能生成一个几秒钟没有音频的mp4。在尝试了几个小时之后,我已经被逼疯到装软件就装软件,只要能实现功能,我就接受的地步了。我是用过绿色版的格式工厂以及狸窝转换,但一个并不能实现我的功能,另外一个要做到那个功能是要给钱的。我也下载过一个外国的软件,需要安装,简单模式非常麻烦,高级模式也就是运用脚本的模式却无论如何都运行不了。其实在折腾这些之前,我就看到Google Code这有一个叫做imutube的项目。那个东西非常轻量级,只要你装好了脚本软件以及解码器以后,就可以轻松实现这个功能。但问题是,解码器我前天刚刚装了新的,脚本软件今天也装了新的,但是把东西却无论如何识别不了我的mp3以及图片文件。我差一点点就成功了,但是我无论如何都到不了那一步。

于是我只有回到最开始,一直以来我都觉得MeGUI应该可以实现这个功能。但是如果用AVS Script Creator选择视频的时候,我无论如何都不能选择图像文件。即便我选择了图片文件,确定以后,还是会告诉我出错,因为使用的解码器不对。视频的解码器无法识别图片。为什么我觉得MeGUI能实现这个功能呢?因为要把图片和mp3结合起来,只需要做一个设置,就是设置图片的帧速率,然后设置图片的帧数,让图片和mp3有相同的长度。我回到一开始,引领我去找imutube的那个页面,发现里面的确有人说通过编写脚本,可以用MeGUI实现这个功能,只是今天较早时候我没看清,错过了那段话。我把那段脚本复制下来,形成一个脚本文件,果然MeGUI能识别出来。这证明了MeGUI能识别的脚本,不一定得用那个脚本生成器,如果你够牛逼,纯粹可以自己写代码,而且那个更自由。按照我设定的帧数以及帧速率,果然那个图片的播放时长就是我目标的那个。接着,我把这个图片视频和mp3结合起来,生成一个mp4,成功了!但是,图片视频的时长实际上比mp3短,所以第二次在压制前,我在音频那里又加入了一个剪切的脚本,把mp3的长度调节为跟视频一样。因为那个mp3最后结束的时候其实是有好几秒钟空白时间的。现在回想起来,我真的有点傻,为什么我要把帧速率设置为25呢?!其实我完全可以设置为1,那么需要的帧数就只是mp3的秒数而已,我也不需要做更多的计算,当然生成出来的视频体积也不会那么大。但是别人看这个视频参数的时候,估计就会有点O了。

兜了一大个圈,最终,我还是用我手头上的软件就实现了我想要的功能。不得不说,写脚本写代码这些苦逼事,实在很强大,我还有很多很多的东西需要学习!

载入单个图片的AVS脚本如下:

1
2
ImageSource("单个图片的绝对路径", end = 5600, fps = 25, use_DevIL = true)
ConvertToYV12()

说明:end = 5600为视频帧数,fps = 25为帧速率,如果某首歌为3分钟,帧速率为25,帧数就填写3*60*25=4500

音频视频的剪切脚本:

1
2
3
4
5
6
7
8
9
10
11
< ?xml version="1.0"?>
<cuts xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
  <framerate>25</framerate>
  <style>NO_TRANSITION</style>
  <allcuts>
    <cutsection>
      <startframe>0</startframe>
      <endframe>5600</endframe>
    </cutsection>
  </allcuts>
</cuts>

说明:如果这是个配到视频的音频用的,设置为和视频相同的帧数和帧速率即可。

2016-06
5

后PC时代的WWE.COM

By xrspook @ 12:41:14 归类于:烂日记

以前我一直觉得WWE.COM的网站做得很好,他们的网站也一直在得奖。他们的网站完全是由他们的技术工程师编写出来,不像很多其它网站那样是在用某个内核,不过是披挂了不同的外皮而已。6年前当我第一次接触WWE.COM网站的时候我觉得那很合我的口味,内容很丰富、层次很清晰,大概因为我和他们工程师的思路有时是在同一频道上。我跟他们的网站打了接近5年的交道。在那5年里他们曾对网站进行改版,比如说让网站显示的标准宽度更大以适应大伙越来越大,大到堪比电视屏幕那么大的显示屏,虽然进行了那样的改版,但宽版和从前窄版的网站基础架构还是差不多的,用我的语言去描述的话,那不过是换了张包在骨架上的“皮”而已。跟WWE.COM打交道,我玩得最多的是批量抓取他们的组图。还记得一开始的时候他们的组图是用xml的调用方式,后来呢,变成了直接在一个页面上加载全部,只要看源文件就能在一个网页里提取到组图的所有代码。在我们“关系密切”的5年里,只有1年不到的时间他们在用xml的调用模式,后来就变成了我说的那种单网页赤裸裸放置了。

昨晚因为要去找某几张高清图,所以我又去逛WWE.COM了。在我几乎彻底离开的一年时间里(准确来说我数月前去的时候还不是这样的),网站发生了重大变化!他们现在的网页再也不是基于大家用老爷PC去浏览的,所有东西都变得很大,没什么美感可言,渐变圆角神马更加是滚一边去了。整体风格一看就知道那是基于方便智能平板设备浏览的套路,毕竟控制平板设备的是很粗的手指而不是精准度极高的小箭头,要是在平板上触控还好一点,在5寸的正手机上触点太小那真的要人命。我没试过在智能手机上打开WWE.COM,但我估计在PC机上看很笨拙粗大的网页在智能设备上比例会刚好。为什么我会这么觉得?因为他们现在的组图板块网页在浏览图片的时候除了按左右按钮前进后退以外还可以用鼠标拖放滑动,那显然就是智能设备的标准浏览法。再看他们的源代码,head部分有非常多的“facebook”和“twitter”标签,也有非常多德语、西班牙语以及其它语言的兼容选择。以前WWE非英语的网站是挂靠在各国的某些大型门户上的,比如说如果是西班牙语的话就是TERRA,如果是中文的话就是搜狐(最开始的时候是土豆),但现在从源代码看来,他们要在WWE.COM上用一个网站就兼容好几种主流语言以及让PC和智能设备都能跨平台无缝浏览。这是个非常正路的思路,因为这正是现在的趋势所在,但要实现这个显然没那么简单。这样做能省掉很多挂靠的额外开销,也能省下很多专门制作基于智能设备顺畅体验的APP,让PC端浏览舒服的美工活儿也能省下非常多。跨平台最核心的就是把最最基础的数据分类罗列得很好,在不多的设备上按照既定的模板在恰当的地方正确输出。我不知道现在WWE.COM的浏览数据如何,大概他们发现用智能设备看他们网站的人比用传统PC多,主流趋势已经发生改变,所以他们做了这样的彻底改版。这绝对不是头脑发热,根据WWE.COM多年来他们工程师基于事实的预见性和潮流触觉,他们不会出错。对PC端来说,现在WWE.COM的改版从美观上来说是个巨大的倒退,我这个依然严重依赖PC浏览的人当然觉得很不是滋味,但是这种事不由我说了算,我唯一能做的只是适应这种新常态。

从前写的批量提取组图代码在改版后的WWE.COM上已经失效,我是时候脑洞大开和WWE.COM的工程师来一场新的斗智斗勇大战了!

2015-07
17

全身心

By xrspook @ 13:34:51 归类于:烂日记

在过去的4天里,我其中3天都是午夜12点才睡觉。对夜猫子来说这没什么,还很早呢,但对我来说,过去一年多以来我几乎没试过频率这么高的晚睡了。我不是学生我没有暑假,我有工作且近期都没有什么假期,12点睡觉,早上530或600起来,中午甚至没有小息,这种日子我很久都没试过。通常来说,我每天晚上会睡7-8小时,中午再来个0.5-1小时。睡眠充足做什么都好,现在的xrspook就如行尸走肉一般,跑步的时候,尤其是前几K觉得肌肉酸,这意味着跑不快。早上刚起来过了大概个把小时又困了。最要命的是晚睡就意味着还没睡着,准备到床上或者躺在床上的时候我就饿了。该修复代谢的工序没机会完成,白天为了把睡意驱赶走还得多吃东西。这根本就是个恶性循环。

我很清楚这个,因为每当我开始狂热沉迷某种东西的时候我经常就会这般不顾一切。这个不顾一切的项目到今天为止将告一段落,因为今天将发贴,然后我就解脱了,所有的东西已经准备就绪,其中包括了百度云和迅雷快传的私密分享链接(你知道我把36部电影从百度云人肉转移到迅雷快传用了多少时间吗?!),那是个体力活,是我和迅雷服务器的战斗。接着搜索海报,虽然我已经从某个BT种子那里下载回来一堆,但图片太小或者我觉得那个图不代表电影本身,所以我又得去自己找。豆瓣上的电影大多有海报,但我对海报的大小和内容有苛刻的要求你知道吗!如果能找到更大更清晰更能反映电影内容的我不会将就随便用小的顶数,这就意味着我需要在这上面花费大量的时间,比转移超过36GB的电影还耗人。海报搜集是一个斗智斗勇的过程,我需要和单位比乌龟还慢的网速作斗争,我需要和好不容易打开G老师作斗争。海报呢,我是2个搜索引擎一起来的,用两个不同的服务器,bing用Chrome打开,Google用Firefox打开,一个翻墙一个不翻墙。Google的好处是搜索到图片后下载超方便,bing的好处是同类的图片它只会给你一个结果,然后你按进去,就可以看到样子差不多但大小分辨率个不同的版本了,不得不说,bing的图片下载比较麻烦。二者各有各好。一直以来,搜图我大多用的是Google,但这次bing的使用让我大开眼界。搜索神马我是很有耐心的,但我的耐心不应该浪费在等待网页打开方面有没有!!!我越来越不喜欢这个单位的其中一个原因是怎么一到晚上连打开个新浪围脖都相当困难呢!!!!!!!!!海报的搜索,其实准确来说应该是封面的搜索没有我预料的那么简单,那些十几二十年前的电影海报真的太难找了,只要求小图的话,那挺简单,但我无论如何接受不了大小只有大概200*300像素的东西啊啊啊!有一些图很好,但当眼处烙印着某个网站的网址,我那个去!昨晚12点才睡觉就是因为我一直在找海报,晚上9点多开始,一直干到了快12点,下午3点多开始其实我已经在干了,干到接近5点。下午的是第一次收集,晚上的是对不满意的再次搜索。今天早上对海报进行了裁剪与合并,36部电影的36张海报全部以长宽1:1的方式裁剪缩放为300*300像素,然后以6*6的模式拼接为1800*1800的大图。我脑子比较简单,所以我选择了这种等大小的方式。至于海报的排序是按照电影上映年份的,从左上到右下,Aamir Khan从1984年到2009年的大部分电影就这般以海报墙的方式展示。

我在这里放个640*640的前瞻小图哈~

36_640

我不知道那些视频的质量怎样,因为我下载过其中的Tum Mere Ho,1.46GB的大小(反倒不如我550MB的大和清晰!),但分辨率却是大概300多*200多的样子,直接把我看O了。其它的电影我没有下载来体验过,希望不会这样。我能做到的就只是在其它方面让这块资源蛋糕看上去很靠谱有诚意。估计很少有人会像我这般不计成本地投入了。

如果不是被要求要发贴,我不会现在就疯狂地去找海报的。找海报是个痛并快乐着的过程,我虽然仍不能把电影的名字、年份和海报的图案完全对应好,但起码AK传记里提到的那些名字,说到的那些角色定位在看到海报后我大大加深了印象。当时我就纯粹只是靠想象力去发挥那到底是怎么一个角色设置,但现在,虽然还没有看过电影本身,但我已经有了些头绪鸟。

如果你是认真做事的话,真的把心扔进去的话,会有回报的。

2014-06
9

十年

By xrspook @ 15:39:37 归类于:烂日记

2004-06-09至2014-06-09,3652天,或许这个表达方式会让你更容易理解——十年!从18岁到28岁,每个人一辈子都只有这么一次黄金的青春十年,我非常幸运地,这十年,我每天用起码一blog的方式记录了下来。

WordPress的仪表盘概览显示,算上这篇我一共写了3947篇blog,这仅仅是这十年间我写在“我的天”的,还有一些写在别处的不计算在内。尼玛的,xrspook真能写!!!以平均每篇1000字计算,这里有395万字。如果打印出来做成书,这得是多厚的一本?!!!!!我一点都不后悔我选择的是在博客上写十年而不是在本子上写十年。我写的是很私人的东西,但我喜欢和别人分享,尤其是教程类的东西,不分享那东西也就没有任何意义了。选择电子版而不是纸质版当然不是为了我能更方便地Ctrl+C和Ctrl+V,我生平最讨厌的行为就是抄袭,我怎么会愿意老是做摘录工呢,哪怕只是摘录我自己的东西!你有否想过,写在纸上就不能图文并茂了,而很多东西,写那么一大堆文字不如放一个图能说明问题。

跟小时候被家长强迫着写日记不同,我的天是完全自愿形成的,我想写所以我去写。青涩又有点积累,不很成熟但却有不少专业。里面记录了我很多很认真的花痴行为。认真,那是相当的认真,认真到我读书那么多年都从未试过那么认真,比如说写网页、做翻译、观后感/读后感、各种教程、DIY做衣服、DIY做LED灯牌、做橡皮章、玩减肥、玩跑步……我不是作家,我甚至不是一个业余的作家,而且我很懒、超级懒!所以可以不写的话我绝对不会写些什么,但blog的出现,blog的坚持在我的人生画卷上画上了相当浓重的一笔。虽然在开blog的时候很傻很天真的我曾经说过我要blog到我死的那天,只要BlogBus不倒,我就会一直在那里blog下去,但现在,BlogBus还在,我却已经整体转移到独立的WordPress继续。就像很多人所期待爱情一样,当然臆想那可以一生一世,但很多人甚至熬不过七年之痒,十年二十年金婚银婚钻石婚什么更是飘渺不可及之物。如果在虚拟世界我可以自定义性别的话,我一定选male,那么我的blog呢?是male还是female?

2004-06-09,那一天,我完成了高考。和现在参加高考的孩子们不同,虽然我们同是6月7日开始,但我当年持续的时间是3天,而他们2天就搞定了。高考完成后,我直奔天河南方书城(早已消失了,位置是现在的广百中怡店),为的是找加西亚·马尔克斯的书,虽然没找到《百年孤独》,但找到了一些短篇集,那天回家后,我迫不及待,在我早已摩拳擦掌观察多时的BlogBus上开始了“我的天”,开始了我的第一篇blog。不是去睡一觉,不是去撮一顿,没有家人朋友在考点门口迎接解放了的我,从书海奋斗十多年终于完成高考的我居然又主动把自己送进了书海。那个少年真够文艺的!!!10年前,书店是我的大爱,一遍又一遍地在各大书店书城晃悠我才有可能在第一时间找到我想找的书。10年后的今天,我都不记得我上一次去书店找书看书是什么时候了,取而代之的是我在网上书城不时乱转,纸质书还是我的最爱,但近期我也会在手机上看电子书。10年前,我明明已经知道加西亚·马尔克斯曾经说过他有生之年都不会把他作品的版权卖给中国书商,7-8年后,中国书商终于用非常非常高的价格买下了加西亚最著名小说《百年孤独》的版权,并在接下来的几年里,连续出了好几本他的书。就在我的blog即将10周年的时候,加西亚·马尔克斯去世了(2014-04-18),享年87岁。NEVER SAY NEVER. 但如果当人离开了这个世界,那就真的是永远了……

十年磨一利剑,偏偏我那把只是街边2元钱买回来的小水果刀,好用不好用,用过的人自然会知道,都用了那么多年了,即便不好用,早就习惯了。

Page 1 of 6123456»
COPYRIGHT @ 我的天 | Theme by xrspook | Power by WordPress | Valid XHTML 1.1 and CSS 3 Go to top