2019-05
30

调调错

By xrspook @ 9:11:41 归类于: 烂日记

昨天领导突然跟我说单位要搞个10周年的活动。我觉得这种事情是应该的,但听完他的一番陈述以后,我觉得那肯定又是一件相当无聊的事。因为从构思已经决定了那根本逃不出老套,而重点是,这个框架反映出来的东西很多都是我一点兴趣都没有的。但他硬要把我拉过去,说我在这里的时间很长,见过的东西很多,所以筛选图片的时候我会有印象。我觉得很纳闷,我在这里这么长时间,我到底见过什么世面呢?当他们接待高层的时候,我不知道在哪个角落。我知不知道那些高层到底是谁,也不知道他们具体在工程的哪些地方出现过,因为我根本没有陪同过。甚至可以这么说,在这个单位这么长时间,我还没有完全地走遍过我们的地盘。有些地方是新增的,而有些地方一般人无需到达。所以筛选图片的时候,我能辨认出些什么呢?10年的照片那是一个相当大的量。即便你要做厚厚一本,像字典一样的图册,你也用不着那么多照片。理论上,一页纸顶多放两张照片。如果你一定要在每页纸放下6张照片的话,我建议你不如别放算了。如果要把照片做得够意思、有美感的话,我觉得一页纸只能放一张。以200页纸计算,也就顶多400张照片而已,分摊到10年,每年40张,但实际上,不可能出一本200页的图册,那个图册如果有100页已经很了不起了,也就是200张照片,最终下来就是每年20张。有大领导光临的,肯定要来一些,有工程开工或者完工的,也要来一些,最后当然少不了那些年会、安全会议或者到哪里活动。所以实际上,用年去选图片就太死板了,我觉得应该以一个事件、非常大的事件为重点去筛选照片。于是最终照片是如何筛选呢?肯定得从事件入手,而不是打开照片的文件夹一个一个去搜索,而且是人肉搜索。

每年的重大事件有哪些呢?那必须是要找每个月的大事记啊!每个月的大事记大概就一张纸,一年下来就12张纸,这么多年下来就120张纸,很多东西都是可以一闪而过的,但也有可能在某张纸上会有多件很重要的事,而昨天领导说的那个寻找资料的架构就像在写一篇流水帐,所以听他说的时候,我的心里一直呵呵。他没见过那个框架以外的东西,就没办法想象出别人到底是如何做事的,而他又觉得一直都活在这种调调里没有问题。我觉得这就是他们最大的问题!当他说每一个技术管理人员都要写一篇心得的时候,我更加觉得这简直是超级搞笑。难道你还要让一个你根本不重视的普通人讲他的故事,而你又会真的用心的去听吗?不要浪费大家的时间了好吗?坐在那里的人,如果你觉得我们很重要,我们是元老,我们知道这里的一切,为什么我们之中的绝大多数都只是科员呢?!嘴上说你很重要,实际上到升官发财的时候却没你的事。平时我不会考虑这种事,但当他说那些无聊事的时候,我感到莫名的愤慨。

明明是值得开心伟大的时刻,居然可以被他们弄得我感觉不屑一顾,醉了。

当他们把题目定为,我和这个单位共同成长的时候,我觉得,实际上,你们有在乎我们个人的成长吗?你们到底在帮助我们成长,还是在一直压制着不让我们施展所长。

2018-06
12

图片文字识别

By xrspook @ 8:59:18 归类于: 烂日记

因为很懒,不想把小说里面的东西一页一页地通过键盘输入。所以我想找一个可以拍照然后转化为数字格式文字的软件。其实文字识别这种东西,很久以前在PDF里已经可以,但问题是识别的效果有时真的很糟糕。尤其是遇到纯图片的PDF,从前的识别软件几乎无解。即便某些文献里不是图片的文字有时也会识别错误。十几年过去了,这些技术难道就没有发展吗?手机上安装了个Google Translate,他们有一个很屌丝的功能:当你把要翻译的东西放在他们镜头底下某个区域,他们就可以把那里的文字直接翻译成你需要的语言,毫无PS痕迹。这种效果是动态的,虽然很炫酷,但只对词语有效,而且我觉得只能停留在玩一年玩的水平。我需要的东西不是翻译,而是直接把汉字给我识别为汉字就可以了。

据说小米的系统MIUI 8扫一扫就隐藏了这个功能,我迫不及待了试了一下,结果让人很失望,因为识别出来的东西简直就是乱码一般狗屁不通。WPS也有这个功能,但他们识别出来的效果也不好,虽然那个功能,对非VIP来说只能用几次,但即便是这种VIP的功能其实也不好。我不想在手机里再安装其它软件,于是继续搜索,结果发现原来QQ的扫一扫也有这个功能。既然QQ扫一扫可以,所以我觉得微信的扫一扫应该也差不多吧,然后呢,我发现微信的扫一扫貌似只对二维码感兴趣,对文字识别无感。但是QQ的扫一扫就很强大,可以识别文字,也可以识别图片里那个是谁。这很方便,突然看到某个人的照片,尤其是明星类的,想不起他叫什么名字,拿QQ过去扫一扫就可以了。虽然他们说可以这样,但是我没试过拿QQ对着明星扫一扫。我的确拿QQ往书上扫一扫了,结果实在让人太惊喜,QQ识别的速度很快,而且只要你拍照恰当,光源合适,出来的效果相当好。有了这个神器,基本上遇到纸质的书本我们就不用烦了,但是因为这种扫一扫需要配合一定的条件,得出的文字才会准确。如果只是一两页纸扫一扫那是相当的爽,但如果你得想搞一本书,那就真的很痛苦了,不如在网上找一找有没有电子版的比较快捷。我想到的是既然他们可以通过这样的扫一扫识别文字,估计也有软件可以针对PDF里的图片识别出文字,而且速度要比这个快很多,之前我也的确干过这种事,因为当时要把PDF版本的东西放到kindle里阅读。虽然用kindle直接打开PDF也可以,但是阅读会非常辛苦,所以我通过某个软件把PDF转化为kindle专用的mobi。PDF里像图片一样的文字被识别为数字格式,但问题是那是本英语书。有些单词被分在两行,识别会把那当作两个东西,于是阅读的时候你就头大了。你必须具备神一般的单词合并能力进行脑补。既然英语可以识别,中文估计也没问题,但中文的复杂程度要比英语高很多。前晚本打算十点多就睡觉,结果因为这个扫一扫,扫了十几页纸,于是折腾到了11点多才睡觉。

科技进步,人活得越来越爽。

2017-09
10

单个图片mp3生成mp4

By xrspook @ 18:01:41 归类于: 烂日记

今天花了好多个小时去研究怎么把一个图片和一个mp3合并一起生成一个mp4文件。从理论上说这很简单,不过是把图片的展示的时间等长于mp3。直觉告诉我,应该有一些很简单的脚本能实现这个功能。因为从油管下载回来的音频和视频可以通过一键完成合并。我不知道油管上面的视频和音频的长度是不是完全一致,反正对一张图片来说,那不过是跟音频等长而已,没什么设置的难度。我希望直接用我手头上的工具就实现这个功能。但实际上,貌似有点难度。如果不是要求那一定是视频文件,如果只需要展示,我们可以用PowerPoint。把图片设置为背景,把音乐设置为预览文件时自动播放,然后把文件封装。这种功能肯定非常容易实现,但问题是我要生成一个单独的视频文件,avi也好wma也好mp4也好mkv也好,反正那个视频文件,必须能被做字幕的软件识别。我就一连纠结了好多个小时。因为我觉得这是一个很容易实现的功能,所以一开始我去找一些能在线实现这个的网站。我第一次找的那个网站的确可以实现我想要的功能,但问题是那个网站生成的视频有好大的水印。如果要去掉水印就必须给钱,显然我是肯定不会做的。往后的一些网站,要不根本上传不了,要不速度非常慢,要不只能生成一个几秒钟没有音频的mp4。在尝试了几个小时之后,我已经被逼疯到装软件就装软件,只要能实现功能,我就接受的地步了。我是用过绿色版的格式工厂以及狸窝转换,但一个并不能实现我的功能,另外一个要做到那个功能是要给钱的。我也下载过一个外国的软件,需要安装,简单模式非常麻烦,高级模式也就是运用脚本的模式却无论如何都运行不了。其实在折腾这些之前,我就看到Google Code这有一个叫做imutube的项目。那个东西非常轻量级,只要你装好了脚本软件以及解码器以后,就可以轻松实现这个功能。但问题是,解码器我前天刚刚装了新的,脚本软件今天也装了新的,但是把东西却无论如何识别不了我的mp3以及图片文件。我差一点点就成功了,但是我无论如何都到不了那一步。

于是我只有回到最开始,一直以来我都觉得MeGUI应该可以实现这个功能。但是如果用AVS Script Creator选择视频的时候,我无论如何都不能选择图像文件。即便我选择了图片文件,确定以后,还是会告诉我出错,因为使用的解码器不对。视频的解码器无法识别图片。为什么我觉得MeGUI能实现这个功能呢?因为要把图片和mp3结合起来,只需要做一个设置,就是设置图片的帧速率,然后设置图片的帧数,让图片和mp3有相同的长度。我回到一开始,引领我去找imutube的那个页面,发现里面的确有人说通过编写脚本,可以用MeGUI实现这个功能,只是今天较早时候我没看清,错过了那段话。我把那段脚本复制下来,形成一个脚本文件,果然MeGUI能识别出来。这证明了MeGUI能识别的脚本,不一定得用那个脚本生成器,如果你够牛逼,纯粹可以自己写代码,而且那个更自由。按照我设定的帧数以及帧速率,果然那个图片的播放时长就是我目标的那个。接着,我把这个图片视频和mp3结合起来,生成一个mp4,成功了!但是,图片视频的时长实际上比mp3短,所以第二次在压制前,我在音频那里又加入了一个剪切的脚本,把mp3的长度调节为跟视频一样。因为那个mp3最后结束的时候其实是有好几秒钟空白时间的。现在回想起来,我真的有点傻,为什么我要把帧速率设置为25呢?!其实我完全可以设置为1,那么需要的帧数就只是mp3的秒数而已,我也不需要做更多的计算,当然生成出来的视频体积也不会那么大。但是别人看这个视频参数的时候,估计就会有点O了。

兜了一大个圈,最终,我还是用我手头上的软件就实现了我想要的功能。不得不说,写脚本写代码这些苦逼事,实在很强大,我还有很多很多的东西需要学习!

载入单个图片的AVS脚本如下:

1
2
ImageSource("单个图片的绝对路径", end = 5600, fps = 25, use_DevIL = true)
ConvertToYV12()

说明:end = 5600为视频帧数,fps = 25为帧速率,如果某首歌为3分钟,帧速率为25,帧数就填写3*60*25=4500

音频视频的剪切脚本:

1
2
3
4
5
6
7
8
9
10
11
< ?xml version="1.0"?>
<cuts xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
  <framerate>25</framerate>
  <style>NO_TRANSITION</style>
  <allcuts>
    <cutsection>
      <startframe>0</startframe>
      <endframe>5600</endframe>
    </cutsection>
  </allcuts>
</cuts>

说明:如果这是个配到视频的音频用的,设置为和视频相同的帧数和帧速率即可。

2016-06
5

后PC时代的WWE.COM

By xrspook @ 12:41:14 归类于: 烂日记

以前我一直觉得WWE.COM的网站做得很好,他们的网站也一直在得奖。他们的网站完全是由他们的技术工程师编写出来,不像很多其它网站那样是在用某个内核,不过是披挂了不同的外皮而已。6年前当我第一次接触WWE.COM网站的时候我觉得那很合我的口味,内容很丰富、层次很清晰,大概因为我和他们工程师的思路有时是在同一频道上。我跟他们的网站打了接近5年的交道。在那5年里他们曾对网站进行改版,比如说让网站显示的标准宽度更大以适应大伙越来越大,大到堪比电视屏幕那么大的显示屏,虽然进行了那样的改版,但宽版和从前窄版的网站基础架构还是差不多的,用我的语言去描述的话,那不过是换了张包在骨架上的“皮”而已。跟WWE.COM打交道,我玩得最多的是批量抓取他们的组图。还记得一开始的时候他们的组图是用xml的调用方式,后来呢,变成了直接在一个页面上加载全部,只要看源文件就能在一个网页里提取到组图的所有代码。在我们“关系密切”的5年里,只有1年不到的时间他们在用xml的调用模式,后来就变成了我说的那种单网页赤裸裸放置了。

昨晚因为要去找某几张高清图,所以我又去逛WWE.COM了。在我几乎彻底离开的一年时间里(准确来说我数月前去的时候还不是这样的),网站发生了重大变化!他们现在的网页再也不是基于大家用老爷PC去浏览的,所有东西都变得很大,没什么美感可言,渐变圆角神马更加是滚一边去了。整体风格一看就知道那是基于方便智能平板设备浏览的套路,毕竟控制平板设备的是很粗的手指而不是精准度极高的小箭头,要是在平板上触控还好一点,在5寸的正手机上触点太小那真的要人命。我没试过在智能手机上打开WWE.COM,但我估计在PC机上看很笨拙粗大的网页在智能设备上比例会刚好。为什么我会这么觉得?因为他们现在的组图板块网页在浏览图片的时候除了按左右按钮前进后退以外还可以用鼠标拖放滑动,那显然就是智能设备的标准浏览法。再看他们的源代码,head部分有非常多的“facebook”和“twitter”标签,也有非常多德语、西班牙语以及其它语言的兼容选择。以前WWE非英语的网站是挂靠在各国的某些大型门户上的,比如说如果是西班牙语的话就是TERRA,如果是中文的话就是搜狐(最开始的时候是土豆),但现在从源代码看来,他们要在WWE.COM上用一个网站就兼容好几种主流语言以及让PC和智能设备都能跨平台无缝浏览。这是个非常正路的思路,因为这正是现在的趋势所在,但要实现这个显然没那么简单。这样做能省掉很多挂靠的额外开销,也能省下很多专门制作基于智能设备顺畅体验的APP,让PC端浏览舒服的美工活儿也能省下非常多。跨平台最核心的就是把最最基础的数据分类罗列得很好,在不多的设备上按照既定的模板在恰当的地方正确输出。我不知道现在WWE.COM的浏览数据如何,大概他们发现用智能设备看他们网站的人比用传统PC多,主流趋势已经发生改变,所以他们做了这样的彻底改版。这绝对不是头脑发热,根据WWE.COM多年来他们工程师基于事实的预见性和潮流触觉,他们不会出错。对PC端来说,现在WWE.COM的改版从美观上来说是个巨大的倒退,我这个依然严重依赖PC浏览的人当然觉得很不是滋味,但是这种事不由我说了算,我唯一能做的只是适应这种新常态。

从前写的批量提取组图代码在改版后的WWE.COM上已经失效,我是时候脑洞大开和WWE.COM的工程师来一场新的斗智斗勇大战了!

2015-07
17

全身心

By xrspook @ 13:34:51 归类于: 烂日记

在过去的4天里,我其中3天都是午夜12点才睡觉。对夜猫子来说这没什么,还很早呢,但对我来说,过去一年多以来我几乎没试过频率这么高的晚睡了。我不是学生我没有暑假,我有工作且近期都没有什么假期,12点睡觉,早上530或600起来,中午甚至没有小息,这种日子我很久都没试过。通常来说,我每天晚上会睡7-8小时,中午再来个0.5-1小时。睡眠充足做什么都好,现在的xrspook就如行尸走肉一般,跑步的时候,尤其是前几K觉得肌肉酸,这意味着跑不快。早上刚起来过了大概个把小时又困了。最要命的是晚睡就意味着还没睡着,准备到床上或者躺在床上的时候我就饿了。该修复代谢的工序没机会完成,白天为了把睡意驱赶走还得多吃东西。这根本就是个恶性循环。

我很清楚这个,因为每当我开始狂热沉迷某种东西的时候我经常就会这般不顾一切。这个不顾一切的项目到今天为止将告一段落,因为今天将发贴,然后我就解脱了,所有的东西已经准备就绪,其中包括了百度云和迅雷快传的私密分享链接(你知道我把36部电影从百度云人肉转移到迅雷快传用了多少时间吗?!),那是个体力活,是我和迅雷服务器的战斗。接着搜索海报,虽然我已经从某个BT种子那里下载回来一堆,但图片太小或者我觉得那个图不代表电影本身,所以我又得去自己找。豆瓣上的电影大多有海报,但我对海报的大小和内容有苛刻的要求你知道吗!如果能找到更大更清晰更能反映电影内容的我不会将就随便用小的顶数,这就意味着我需要在这上面花费大量的时间,比转移超过36GB的电影还耗人。海报搜集是一个斗智斗勇的过程,我需要和单位比乌龟还慢的网速作斗争,我需要和好不容易打开G老师作斗争。海报呢,我是2个搜索引擎一起来的,用两个不同的服务器,bing用Chrome打开,Google用Firefox打开,一个翻墙一个不翻墙。Google的好处是搜索到图片后下载超方便,bing的好处是同类的图片它只会给你一个结果,然后你按进去,就可以看到样子差不多但大小分辨率个不同的版本了,不得不说,bing的图片下载比较麻烦。二者各有各好。一直以来,搜图我大多用的是Google,但这次bing的使用让我大开眼界。搜索神马我是很有耐心的,但我的耐心不应该浪费在等待网页打开方面有没有!!!我越来越不喜欢这个单位的其中一个原因是怎么一到晚上连打开个新浪围脖都相当困难呢!!!!!!!!!海报的搜索,其实准确来说应该是封面的搜索没有我预料的那么简单,那些十几二十年前的电影海报真的太难找了,只要求小图的话,那挺简单,但我无论如何接受不了大小只有大概200*300像素的东西啊啊啊!有一些图很好,但当眼处烙印着某个网站的网址,我那个去!昨晚12点才睡觉就是因为我一直在找海报,晚上9点多开始,一直干到了快12点,下午3点多开始其实我已经在干了,干到接近5点。下午的是第一次收集,晚上的是对不满意的再次搜索。今天早上对海报进行了裁剪与合并,36部电影的36张海报全部以长宽1:1的方式裁剪缩放为300*300像素,然后以6*6的模式拼接为1800*1800的大图。我脑子比较简单,所以我选择了这种等大小的方式。至于海报的排序是按照电影上映年份的,从左上到右下,Aamir Khan从1984年到2009年的大部分电影就这般以海报墙的方式展示。

我在这里放个640*640的前瞻小图哈~

36_640

我不知道那些视频的质量怎样,因为我下载过其中的Tum Mere Ho,1.46GB的大小(反倒不如我550MB的大和清晰!),但分辨率却是大概300多*200多的样子,直接把我看O了。其它的电影我没有下载来体验过,希望不会这样。我能做到的就只是在其它方面让这块资源蛋糕看上去很靠谱有诚意。估计很少有人会像我这般不计成本地投入了。

如果不是被要求要发贴,我不会现在就疯狂地去找海报的。找海报是个痛并快乐着的过程,我虽然仍不能把电影的名字、年份和海报的图案完全对应好,但起码AK传记里提到的那些名字,说到的那些角色定位在看到海报后我大大加深了印象。当时我就纯粹只是靠想象力去发挥那到底是怎么一个角色设置,但现在,虽然还没有看过电影本身,但我已经有了些头绪鸟。

如果你是认真做事的话,真的把心扔进去的话,会有回报的。

© 2004 - 2026 我的天 | Theme by xrspook | Power by WordPress