2021-07
12

白描,挺好的

By xrspook @ 10:32:08 归类于: 烂日记

前两天看到介绍软件的网站说白描正在搞特价,所以就搞了个黄金会员。白描这个东西我感觉跟大家用得很多的全能扫描王差不多,但问题是白描跟全能扫描王的价格差很多。几乎可以这么说,全能扫描王一个月的价格等于是白描的黄金会员价格了,而白描的会员是永久有效的。我不知道为什么一直以来大家都在用全能扫描王。通常看到的那些扫描件。基本上右下角都会有全能扫描王的水印。这是因为大家没有付费使用,但问题是急需用那个APP的时候,想要用到的是它的付费功能。财务科经常要对那些凭证拍照什么的的。尤其是审计的时候,用全能扫描王拍拍照,然后排序整理之类的更加是再平凡不过的操作。每当他们要用到这个功能的时候,就会找一个手机,看看哪个账号便宜就用哪个账号买会员。与其这样不如在价格合适的时候直接入手一个白描。毕竟白喵的黄金会员也不过是一杯咖啡的价格,如果只是买普通会员,那更加是一杯柠檬茶的价格。甚至可以说,贵的时候一个牛油果都不止那个价,但是他们依然会选择现在我用不着,所以我不买。

虽然我在财务科,但是因为工种的关系,所以我不像他们那样在某段时间要扫描一大堆东西,我扫描的东西都是很有规律性的。比如一个月要扫描多少次,一个星期要扫描多少回。之前我会用一体机的扫描仪的自动进纸器,但某一次上面的人跟我说,因为我盖章和扫描的间隔时间太短,经过那个静止器以后,扫描出来的那个章会显得拖得很长,虽然完全不影响扫描出来的数据,但是别人觉得那不太好,所以那次以后。我就选择了手动一页一页的来,把A4纸摊在玻璃板上扫。这的确有点麻烦,但是一个月也就那几张纸了,如果我真的要扫描很多的话,还不如直接去找那些有直接快扫机器的人帮忙。现在我入手了白描,只要光线充足,我完全可以用手机APP实现这个功能,再也不需要为了一两页纸。去把A4纸摊在扫描仪的玻璃板上。

我这个周末回家,我用扫描仪扫了某本书的一些节选片段。之前我一直都想做这种事,但是好像都不太顺手,所以没有做。尽管可以用做OCR识别的APP已经很多了。小米自带的可以这么做,坚果云可以这么做,语记可以这么做,QQ也可以。但虽然大家都可以做,但是识别出来的效果还是很有区别的。一开始我用的是白描的文档识别,结果发现。扫书本的某一页纸实在太累人了,结果我尝试着用图片识别效果,居然非常好。因为用文档自动识别的话,它会做自动边界测试,但自动边界反而会导致扫描出来的东西稀奇古怪。如果我用的是图片识别,那张照片怎么照我说了算,对焦好了,内容都在里面,也就可以了,只要照出来的相片靠谱,识别出来的命中率相当高。如果单纯是中文,一点问题没有,如果只是几个英文单词也没有毛病,但如果某页纸是中英文混排,扫描出来的东西需要编辑的部分会挺多。而之所以编辑的东西多是因为他们好像无法界定出如何分段。所以段落该怎么整就得靠自己。

书本的扫描,我建议大家用两个大夹子夹住书本的上下,那么页面就可以比较平了,用手或其他东西去按压,通常是不太行的。而之所以要把书的页面搞平是因为只有那样页面才不会弯曲,照出来的图片才不会。有各种你意想不到的歪斜,然后导致识别出来的东西稀奇古怪,比如断句搞错,也比如说分段不靠谱。

测试扫描十几页书本以后,我发现白描的识别能力非常不错,特别是中文的识别能力。只要照片照得好,无论是文字还是标点符号,都识别得非常精准。所以25块钱的入手价是绝对值得。

唯一我觉得郁闷的是他们的网页版只能通过帐密登录,我觉得那个东西有点不安全。既然他们的账号可以绑定微信,我建议他们网页的登录直接只能通过白描自己的扫码,或者通过微信扫描登录。这样既可以方便用户。也可以提高账号的安全性。

东西刚买回来会用得比较兴冲冲,之后呢,肯定会慢慢冷却。

2018-06
13

再谈文字识别

By xrspook @ 9:20:11 归类于: 烂日记

突然发现语记升级以后也可以进行文字识别了,但问题是那个功能以后会变成收费项目,因为现在显示的是限时免费。语记的文字识别准确率挺高,问题只是步骤相对来说略多,要多页纸整的话会比较慢,而且往后要收费,相比于免费的QQ。显然后者会更适合大众多一些,但是如果本来对语记就有很强的依赖性,这个功能绝对会让大家更爱上这款app。说来也奇怪,语记从前是有离线语音包的,但现在我翻遍整个app都没找到,但是如果我下载的是讯飞输入法,我的确可以设置下载离线语音包。虽然,离线语音包其实作用不大,因为没有联网,识别出来的东西还是比较不靠谱的,但总比什么都不能识别强那么一点点。可能如果我开通了语记的VIP功能,那东西也会有离线语音包的设置。作为一个收费项目,我觉得很奇怪的是为什么语记没有把收费和不收费的对比优缺点展示出来呢?别人不知道你的收费项目以后有什么好处,自然不会给钱。以前我也试过一段时间不用语记,改用讯飞输入法的语音输入。输入法的语音输入没什么问题,问题在于它的键盘输入实在太反人类了,无论我怎么输老错。这种事情在谷歌、搜狗和百度手机输入法里面都从未发生过。语音输入是讯飞的特色,但如果其他输入法很弱爆,别人没办法依存这个输入法,因为有些时候,语音是不凑效的,在准确校对的时候,语音是不行的,所以用过一段时间讯飞输入法以后,我又换回了我心爱的谷歌输入法,继续用语记进行我的语音输入。

以前的文字识别用的应该不是云数据,用的应该只是字库里面的东西,但现在什么都说云,什么都说AI人工智能,估计现在那种技术也用在了文字识别上面。相对于语音识别,我觉得文字识别可能会简单一点。这两种东西都可以大大地解放人类,不过实际上我对这两种都一窍不通。我只知道用什么软件可以让我免费且质量好,做到我想做的事作为一个普通地球人这也就够了,毕竟我不是一个开发者。说来也奇怪,科大讯飞在语音识别方面已经好多年了,为什么直到近期的语记更新他们才开始加入文字识别的功能呢?不过需要一赞的是他们首次推出这个功能就非常强大。即便照片有点模糊,但是还是可以精确地把文字识别出来。相比之下,小米的那个文字识别,真心太恐怖了,难怪他们一直把那个只当作隐藏功能,没有在推广系统的时候作为亮点做宣传。的确,那样的技术根本不值得一提。甚至应该在某次版本更新的时候悄悄地把文字识别功能下架。

文字识别这种事在中国,有很多个厂商都在做,有中文的也有英文的,但是某些小语种的文字识别,Google都没碰过,比如说我想用拍照的方式文字识别印地语然后翻译为英语。软件会告诉我,无法图片识别我选择的语种。于是这就让人非常头大了,我只能很苦逼地在手机上抄写我看到的印地语,画画一般,但问题是其间如果有一丝停顿,那个画就作废了。在PC的网页上没有这种烦恼,但如果用PC网页,就得用鼠标画画了,那个也不容易。我们的技术员如果能攻克我们自己的语言,同时还可以把外国的语言也识别一下,那将功德无量。世界那么大,语言那么多,能赚钱的机会大把大把。识别了语言以后,然后读出来,就可以解决很多地方文盲的问题。这种事情尤其在不发达国家非常有用。不过话说回来,不发达国家估计买不起这些……

每天,科技都在带给我们很多快乐。

2018-06
12

图片文字识别

By xrspook @ 8:59:18 归类于: 烂日记

因为很懒,不想把小说里面的东西一页一页地通过键盘输入。所以我想找一个可以拍照然后转化为数字格式文字的软件。其实文字识别这种东西,很久以前在PDF里已经可以,但问题是识别的效果有时真的很糟糕。尤其是遇到纯图片的PDF,从前的识别软件几乎无解。即便某些文献里不是图片的文字有时也会识别错误。十几年过去了,这些技术难道就没有发展吗?手机上安装了个Google Translate,他们有一个很屌丝的功能:当你把要翻译的东西放在他们镜头底下某个区域,他们就可以把那里的文字直接翻译成你需要的语言,毫无PS痕迹。这种效果是动态的,虽然很炫酷,但只对词语有效,而且我觉得只能停留在玩一年玩的水平。我需要的东西不是翻译,而是直接把汉字给我识别为汉字就可以了。

据说小米的系统MIUI 8扫一扫就隐藏了这个功能,我迫不及待了试了一下,结果让人很失望,因为识别出来的东西简直就是乱码一般狗屁不通。WPS也有这个功能,但他们识别出来的效果也不好,虽然那个功能,对非VIP来说只能用几次,但即便是这种VIP的功能其实也不好。我不想在手机里再安装其它软件,于是继续搜索,结果发现原来QQ的扫一扫也有这个功能。既然QQ扫一扫可以,所以我觉得微信的扫一扫应该也差不多吧,然后呢,我发现微信的扫一扫貌似只对二维码感兴趣,对文字识别无感。但是QQ的扫一扫就很强大,可以识别文字,也可以识别图片里那个是谁。这很方便,突然看到某个人的照片,尤其是明星类的,想不起他叫什么名字,拿QQ过去扫一扫就可以了。虽然他们说可以这样,但是我没试过拿QQ对着明星扫一扫。我的确拿QQ往书上扫一扫了,结果实在让人太惊喜,QQ识别的速度很快,而且只要你拍照恰当,光源合适,出来的效果相当好。有了这个神器,基本上遇到纸质的书本我们就不用烦了,但是因为这种扫一扫需要配合一定的条件,得出的文字才会准确。如果只是一两页纸扫一扫那是相当的爽,但如果你得想搞一本书,那就真的很痛苦了,不如在网上找一找有没有电子版的比较快捷。我想到的是既然他们可以通过这样的扫一扫识别文字,估计也有软件可以针对PDF里的图片识别出文字,而且速度要比这个快很多,之前我也的确干过这种事,因为当时要把PDF版本的东西放到kindle里阅读。虽然用kindle直接打开PDF也可以,但是阅读会非常辛苦,所以我通过某个软件把PDF转化为kindle专用的mobi。PDF里像图片一样的文字被识别为数字格式,但问题是那是本英语书。有些单词被分在两行,识别会把那当作两个东西,于是阅读的时候你就头大了。你必须具备神一般的单词合并能力进行脑补。既然英语可以识别,中文估计也没问题,但中文的复杂程度要比英语高很多。前晚本打算十点多就睡觉,结果因为这个扫一扫,扫了十几页纸,于是折腾到了11点多才睡觉。

科技进步,人活得越来越爽。

© 2004 - 2022 我的天 | Theme by xrspook | Power by WordPress