2021-07
12

白描,挺好的

By xrspook @ 10:32:08 归类于: 烂日记

前两天看到介绍软件的网站说白描正在搞特价,所以就搞了个黄金会员。白描这个东西我感觉跟大家用得很多的全能扫描王差不多,但问题是白描跟全能扫描王的价格差很多。几乎可以这么说,全能扫描王一个月的价格等于是白描的黄金会员价格了,而白描的会员是永久有效的。我不知道为什么一直以来大家都在用全能扫描王。通常看到的那些扫描件。基本上右下角都会有全能扫描王的水印。这是因为大家没有付费使用,但问题是急需用那个APP的时候,想要用到的是它的付费功能。财务科经常要对那些凭证拍照什么的的。尤其是审计的时候,用全能扫描王拍拍照,然后排序整理之类的更加是再平凡不过的操作。每当他们要用到这个功能的时候,就会找一个手机,看看哪个账号便宜就用哪个账号买会员。与其这样不如在价格合适的时候直接入手一个白描。毕竟白喵的黄金会员也不过是一杯咖啡的价格,如果只是买普通会员,那更加是一杯柠檬茶的价格。甚至可以说,贵的时候一个牛油果都不止那个价,但是他们依然会选择现在我用不着,所以我不买。

虽然我在财务科,但是因为工种的关系,所以我不像他们那样在某段时间要扫描一大堆东西,我扫描的东西都是很有规律性的。比如一个月要扫描多少次,一个星期要扫描多少回。之前我会用一体机的扫描仪的自动进纸器,但某一次上面的人跟我说,因为我盖章和扫描的间隔时间太短,经过那个静止器以后,扫描出来的那个章会显得拖得很长,虽然完全不影响扫描出来的数据,但是别人觉得那不太好,所以那次以后。我就选择了手动一页一页的来,把A4纸摊在玻璃板上扫。这的确有点麻烦,但是一个月也就那几张纸了,如果我真的要扫描很多的话,还不如直接去找那些有直接快扫机器的人帮忙。现在我入手了白描,只要光线充足,我完全可以用手机APP实现这个功能,再也不需要为了一两页纸。去把A4纸摊在扫描仪的玻璃板上。

我这个周末回家,我用扫描仪扫了某本书的一些节选片段。之前我一直都想做这种事,但是好像都不太顺手,所以没有做。尽管可以用做OCR识别的APP已经很多了。小米自带的可以这么做,坚果云可以这么做,语记可以这么做,QQ也可以。但虽然大家都可以做,但是识别出来的效果还是很有区别的。一开始我用的是白描的文档识别,结果发现。扫书本的某一页纸实在太累人了,结果我尝试着用图片识别效果,居然非常好。因为用文档自动识别的话,它会做自动边界测试,但自动边界反而会导致扫描出来的东西稀奇古怪。如果我用的是图片识别,那张照片怎么照我说了算,对焦好了,内容都在里面,也就可以了,只要照出来的相片靠谱,识别出来的命中率相当高。如果单纯是中文,一点问题没有,如果只是几个英文单词也没有毛病,但如果某页纸是中英文混排,扫描出来的东西需要编辑的部分会挺多。而之所以编辑的东西多是因为他们好像无法界定出如何分段。所以段落该怎么整就得靠自己。

书本的扫描,我建议大家用两个大夹子夹住书本的上下,那么页面就可以比较平了,用手或其他东西去按压,通常是不太行的。而之所以要把书的页面搞平是因为只有那样页面才不会弯曲,照出来的图片才不会。有各种你意想不到的歪斜,然后导致识别出来的东西稀奇古怪,比如断句搞错,也比如说分段不靠谱。

测试扫描十几页书本以后,我发现白描的识别能力非常不错,特别是中文的识别能力。只要照片照得好,无论是文字还是标点符号,都识别得非常精准。所以25块钱的入手价是绝对值得。

唯一我觉得郁闷的是他们的网页版只能通过帐密登录,我觉得那个东西有点不安全。既然他们的账号可以绑定微信,我建议他们网页的登录直接只能通过白描自己的扫码,或者通过微信扫描登录。这样既可以方便用户。也可以提高账号的安全性。

东西刚买回来会用得比较兴冲冲,之后呢,肯定会慢慢冷却。

2018-06
12

图片文字识别

By xrspook @ 8:59:18 归类于: 烂日记

因为很懒,不想把小说里面的东西一页一页地通过键盘输入。所以我想找一个可以拍照然后转化为数字格式文字的软件。其实文字识别这种东西,很久以前在PDF里已经可以,但问题是识别的效果有时真的很糟糕。尤其是遇到纯图片的PDF,从前的识别软件几乎无解。即便某些文献里不是图片的文字有时也会识别错误。十几年过去了,这些技术难道就没有发展吗?手机上安装了个Google Translate,他们有一个很屌丝的功能:当你把要翻译的东西放在他们镜头底下某个区域,他们就可以把那里的文字直接翻译成你需要的语言,毫无PS痕迹。这种效果是动态的,虽然很炫酷,但只对词语有效,而且我觉得只能停留在玩一年玩的水平。我需要的东西不是翻译,而是直接把汉字给我识别为汉字就可以了。

据说小米的系统MIUI 8扫一扫就隐藏了这个功能,我迫不及待了试了一下,结果让人很失望,因为识别出来的东西简直就是乱码一般狗屁不通。WPS也有这个功能,但他们识别出来的效果也不好,虽然那个功能,对非VIP来说只能用几次,但即便是这种VIP的功能其实也不好。我不想在手机里再安装其它软件,于是继续搜索,结果发现原来QQ的扫一扫也有这个功能。既然QQ扫一扫可以,所以我觉得微信的扫一扫应该也差不多吧,然后呢,我发现微信的扫一扫貌似只对二维码感兴趣,对文字识别无感。但是QQ的扫一扫就很强大,可以识别文字,也可以识别图片里那个是谁。这很方便,突然看到某个人的照片,尤其是明星类的,想不起他叫什么名字,拿QQ过去扫一扫就可以了。虽然他们说可以这样,但是我没试过拿QQ对着明星扫一扫。我的确拿QQ往书上扫一扫了,结果实在让人太惊喜,QQ识别的速度很快,而且只要你拍照恰当,光源合适,出来的效果相当好。有了这个神器,基本上遇到纸质的书本我们就不用烦了,但是因为这种扫一扫需要配合一定的条件,得出的文字才会准确。如果只是一两页纸扫一扫那是相当的爽,但如果你得想搞一本书,那就真的很痛苦了,不如在网上找一找有没有电子版的比较快捷。我想到的是既然他们可以通过这样的扫一扫识别文字,估计也有软件可以针对PDF里的图片识别出文字,而且速度要比这个快很多,之前我也的确干过这种事,因为当时要把PDF版本的东西放到kindle里阅读。虽然用kindle直接打开PDF也可以,但是阅读会非常辛苦,所以我通过某个软件把PDF转化为kindle专用的mobi。PDF里像图片一样的文字被识别为数字格式,但问题是那是本英语书。有些单词被分在两行,识别会把那当作两个东西,于是阅读的时候你就头大了。你必须具备神一般的单词合并能力进行脑补。既然英语可以识别,中文估计也没问题,但中文的复杂程度要比英语高很多。前晚本打算十点多就睡觉,结果因为这个扫一扫,扫了十几页纸,于是折腾到了11点多才睡觉。

科技进步,人活得越来越爽。

© 2004 - 2022 我的天 | Theme by xrspook | Power by WordPress