2018-05
14

五分之一

By xrspook @ 10:52:06 归类于: 烂日记

《地球上的星星》制作篇时长62分钟我用了半个月(准确来说是19天,2015-11-30至2015-12-18),而且是有官方粗粗的时间轴,但Dangal幕后花絮时长45分钟只有内嵌英文,没有轴,我只用了4天(2018-05-10至2018-05-13)。这里我说的是为两个电影的幕后花絮纪录片内嵌配上中文字幕。TZP一共1098条字幕,Dangal则是835条。昨晚我没有非常精准翻查自己数据的时候写的是TZP的制作篇我用了2个月。的确,最初提取出来的英文字幕是放了两个月,但在制作篇之前我先做了预告篇和删减篇,所以具体制作篇的开干时间我必须得翻查自己的日志才能得出最终数据。两个月和半个月相比的确有点过于夸张,如果真的整那么久肯定是因为期间我不知道干嘛去了。不过,4天和19天,这个5倍的差别是实打实的。现在我已经无论如何都记不起当年TZP整出来以后我校对了多少次,但可以肯定昨天做出来的Dangal我翻译了1次,粗打轴了1次,校对了5次(前三次是边看视频边校对,主要核对字幕和声音是否对上,有没有出现有声音无字幕的缺漏。最后两次校对是把字幕以纯文本的方式导出,然后用软件朗读文字的方式核对我翻译出来的语句是否通顺,是否有错别字,以及是否符合逻辑。第一次视频校对的时间是最长的,因为要精细调节粗粗打出来的时间轴,几乎每句话都要调整。往后的部分你说不准修改的东西会有多少,因为不断看就会不断发现新问题。)Dangal的这种翻译、校对我沿用了做《古拉姆》时的方法,《古拉姆》也是校对了5次。3次视频2次纯文字的方式我觉得挺合理。从前我不用纯文字的方式,那是因为我没想过居然可以这样,但如果只有我一个人去做全家桶,加入这样的校对模式能让我尽可能地少犯低级错误。

关于时间轴,我一直都挺纠结。如果完全按照音频的开始结束去做字幕的显示和消失观众看起来会不舒服,因为太突然太着急了。如果句前和句后都留固定时长的反应时间也不完全合适。因为有些很短的句子,尤其是语速很快的句子不应该在后面留那么多时间,会让人觉得字幕怎么还不消失,反应迟钝的节奏。但如果遇到一些语速慢,意味深长的句子,用一般的句末预留时间显然就会觉得太着急了。我觉得遇到那些句子在声音结束之后你还得预留说话人一次呼吸的时间才比较合适。所以呢,如果平时句末预留的是30-40ms,那些句子就得再多加10-30ms。这些东西理论上是很随意的,但做出来的字幕能不能让人看得舒服却不是随意就能实现。但如果你要我总结出一套方法吧,我又真的暂时提炼不出来。估计我还要更长时间的磨练,又或者得有高人指点。

到底专业做字幕的人是怎么处理的呢?

PS:【中文字幕】Dangal幕后花絮制作特辑(45分钟完整版)

2016-03
14

初探语音识别

By xrspook @ 22:14:08 归类于: 烂日记

今天的blog我本想用语记(科大讯飞的一个把语音转化为文字的手机app)去写,但我还是放弃了,因为说话太快,但我脑子转得太慢。我脑子的转速只和我敲键盘的匹配,所以虽然是输出同样的东西,拿着个手机说啊说我就乱套了,该说的没说,莫名其妙的停顿和错误一堆。平时说话的时候我不那样,因为在没想好之前我不会说,我开始的时候肯定脑子里已经有东西了,但显然我写blog的时候不是那么回事,我是边构思边输出的好吗!说一句话容易,但要说一大段之前完全没编排好的内容是另一回事。但其实如果一直要我一句话一句话地录音,可能我也会非常不习惯,我几乎就没用过微信的那种短语音功能。为什么我的语言障碍在我打电话和普通交流的时候不显露,在我录音的时候却会糟糕呢?大概是因为我很紧张吧。

很久以前我就已经听说过科大的讯飞,因为小米的语音助手一直都基于那个。语音助手好不好玩呢,我玩过,纯粹测试性质,觉得不怎么好玩。一直以来我都没有用过讯飞的产品,他们有做语音识别的,也有做字幕的。手机上的应用主要是语音输入法和录音类产品。搞不懂为什么他们在PC机上不提供,但在手机app里却有。今天下载了他们PC客户端的“字幕大师”,那是按时长收费的!有30分钟的试用时间,往后是字幕轴制作40元/小时,中文音频自动识别为字幕文字40元/小时,暂无法提供英文音频的字幕文字识别。我那个去!我赶紧删了,因为我的目的是用来识别英文。为什么要这么折腾呢?因为我想做TZP DVD正片附带的导演评论,那是AK在说英文,AK有浓重的口音,有人说他说的是标准的英式英语,但我怎么听怎么觉得怪怪的。在TZP的DVD bonus里所有视频都有CC字幕可提取,但在正片里可提取的字幕只是电影本身的,导演评论的音频不配有字幕,泪奔~~~ 既然讯飞能做中文语音识别,外国,尤其是英语的语音识别应该更加成熟才对有木有!否则烂果的siri怎么玩起来?!!!在度娘输入speech to text时出来的结果几乎都是text to speech的,尽管已经绝大部分是英文资源,但这显然不靠谱啊!所以呢,这种时候必须请教G老师。G老师出来的东西主要就是speech to text!我那个去,我一直都很嫌弃度娘,若不是G老师被墙需要翻,我绝对不会将贪图方便用度娘!在外语资源搜索方面,度娘简直就是渣渣之中的战斗机!!!关于speech to text,主要需要解决的是引擎问题,有IBM的,也有Google Speech的,据说G老师的已经很不错,而且提供开放的API,但我要的只是个软件啊,不过实际上只要联网连软件都不用,光是利用G老师API的网页工具就足够了。今天我播放了一段AK评论,分别用讯飞的语记和基于Google API的网页工具语音识别。识别的两段话不同,所以没有绝对的可比性,但显然用Google API的网页工具出来的东西更靠谱符合逻辑,起码呢,人家的语句是基本通顺的,思路也不会太跳跃,讯飞识别出来的某些段落云里雾里完全不知道在瞎掰些什么。当然了,基于Google API的网页工具选择的语言在英语之后还能选择英语所使用的国家的!我当然必须一定得选India啊!但讯飞认为英语就是一种,和普通话、粤语、四川话等列为不同的类别,我那个去!讯飞针对的是中文识别,外国人针对的是多种外语的识别,当然不一样了!如果我要把印度人说的英语听写出文字来,我理所当然得信赖外国人的东西,说不定Google Speech的印度英语真是印度码农开发的呢。

无论是用讯飞还是Google Speech,摆在我面前的是我都必须把2小时42分钟时长的音频完全播一遍,想想都觉得这不是一般的疯狂啊……

一座大山横在我前面,但山再大,也比我自己纯粹靠听译来得稍微靠谱……

2016-03
5

TZP DVD bonus,DONE!

By xrspook @ 21:50:28 归类于: 烂日记

我做到了!我在规定时间里实现了自己的愿望!!!

2015-06-23我从美亚下单,理论上到货时间还没收到包裹后我打电话给亚马逊海外淘的中国客服,因为包裹到底去哪里了、是不是丢了,他们自己也查不到,所以他们免费又给我发了一个用最高级快递的包裹。2015-08-20,我收到了高级版的包裹!2015-08-30我收到了那个大家都以为丢了已经没办法找回的初次包裹。直到现在,初版包裹还在我这里,没有拆,因为摸上去DVD的盒子已经严重变形,里面的碟片完全废掉是非常有可能的,亚马逊也没找我要回去,所以就没有然后了。第一次海淘后我明白到美亚的东西若是发最便宜的快递,大概会走美国邮政+中国邮政,结果是很久很久很久,不知道去哪里了,不知道是不是被卡关了,各种不知道,而且到手的东西不怕磨不怕压还没什么大问题,最多品相糟糕,若是易碎品那是只有收尸的节奏。美亚最高级的快递发的是DHL,期间会发邮件给你让你提供清关资料,现在我连清关资料怎么写都知道了好吗!漫长的等待,这样那样的准备,相比而言,花出去的那个钱真的不算什么。如果有人能保证品相质量而且几天就能送到,我愿意多花钱。麻烦和时间有些时候可以用钱换来,不过这个貌似不可以。后来,当我在TB上看到有人在卖别人给AK写的I’LL DO IT MY WAY传记的时候我毫不犹豫入手,虽然那个价格比美亚贵,但时间呢!运费呢!

然后,我买了新硬盘也学了新技能开始把DVD的bonus内容拷贝下来,并开始做字幕。一张DVD光盘的内容,我把它分为4个部分:预告篇、论坛篇、制作篇和论坛篇。都以1800Kbps的恒定码率压制,合计视频时长02:18:19,合计大小1981MB。我等于是制作了一部印度电影那么长的字幕出来了啊亲!!!里面有歌舞,所以有中印双语字幕,有斋talk印地语和英语印地语混合,那些我只放上翻译出来的中文字幕。谢天谢地的是我不需要从视频里转制sub字幕,因为这个DVD是美国迪斯尼发行的,是个一区的DVD,所以他们有针对听障人士制作的字幕,提取CC字幕比折腾sub字幕好太多了!!!!!虽然时间轴不太精准,每句话的时间我都需要细调,但我真的已经很感恩了。

TZP DVD bonus的4大视频的数据明细:

名称,大小,持续时间,发布时间
预告篇,103MB,00:07:15,2015-10-25(实际上国庆假期时已做好)
删减篇,368MB,00:25:49,2015-10-25(纠结要不要等4个全了一起发)
制作篇,896MB,01:02:50,2015-12-18(xrspook 1220生日前)
论坛篇,614MB,00:43:05,2016-03-05(AK 0314生日前)

我想都没想过能在1年内把这个TZP DVD bonus的4大视频全部都弄出来,但我真的做到了!因为一次又一次硬着头皮迎难而上让我越往后越得心应手。我为SubtitleEdit,Aegisub和MeGUI头大过无数个小时,但那些技术上的东西是可以战胜的,只要你肯给时间。一帧帧递进确定字幕的插入和抽离时间,看着可视化波频精确到0.01秒的时间轴调节。现在回想起来我也不知道我自己是怎么这般耐得住寂寞的。相比之下,一开始对着英文字幕翻译出中文居然算是最简单的步骤。漫长的时间轴调整,一遍又一遍没有尽头的重看进行语法、语句、错别字检查。我学生时代任何一门学科考试都不曾让我如此认真过。之所以这么不顾一切、奋勇向前也正是因为这不是考试,我的最优不需要靠别人口中的“100分”体现。我心目中的完美永远高高在上,我得尽我所能、超水平发挥才能接近那个地方。

我还会这么笨蛋吗?肯定还会!

2016-02
19

苏醒

By xrspook @ 9:35:59 归类于: 烂日记

昨天我还在问自己那些懒洋洋到底什么时候才能散去,但昨天中午开始我觉得那已经有点退散,主要表现是中午睡着睡着我醒来居然觉得自己睡够了。要把懒洋洋退散掉最直接的方法是让自己忙起来。我近期懒洋洋的境界比较高,连运动都打不起兴趣,所以应该从让自己专注在一些需要动脑筋的事上。于是我选择了把丢荒多时的TZP最后一个论坛篇继续完成。视频长度约43分钟,到昨天为止我已经精确校对时间轴到20分钟了。每天扔进去2个小时,应该可以有每天10分钟的进度。因为我有些电脑可以做Aegisub的时间轴校对有些不可以,所以我必须在可以的电脑上做,在不可以的电脑上校对翻译。论坛篇的翻译啊,我在2016开始前就已经做好了,但往后时间轴校对的事一直在拖,一直不去做。这其中有工作忙的因素,有打不起精神的因素,也有天气太冷坐着冻僵的因素。各种原因叠加起来让我在完全把东西放下1个多月后才终于打起精神重新启动这个项目。我的计划是在314(AK生日)前完成。那么TZP DVD bonus的4个部分我就算是有始有终地全部搞定了。往后怎样,2016年还要做些什么,现在我不敢做宏大的计划,因为2016年我的工作将相当的忙,到底一个月能回家多少次也是个问题,尤其是上半年,从单位的计划看来这个2016上半年我要完成去年全年两倍以上的工作,想想都觉得不可思议,我还能活着吗?但有种事叫做“船到桥头自然直”,随遇而安吧。因为这样,所以我不能保证2016年我能做出什么AK相关的电影/其它视频翻译。做一个3小时的电影字幕需要很多很多时间,翻译的时间还稍微可控,无底洞的是时间轴的炮制。翻译和时间轴都精确校对好以后还有无数次视频回放查缺补漏。每一个视频制作都是一个心力交瘁的过程,如果没有要去牺牲的心理准备最终只会让自己一次次地失望落空完成不了自己既定的任务。在不能保证时间和精力都前提下我不接任务,情况就像AK每次只会接一部电影一样。

今年我不打算参加任何路跑比赛,5K也好10K也好半马也好,都不玩了。我要定义自己到底想成为怎么样的跑者。我觉得自己应该是fun runner而不是serious runner,我不为比赛而生,我不为PB而生。一开始我之所以参加比赛是因为别人说参加了比赛才会让自己更加有奔头有更明确的目标,事实证明那些根本不是我最想要的啊啊啊。我想通过运动得到的是健康和快乐,为了达到跑量而逼得自己不健康,把每一次跑步都觉得是深仇大敌不是我想要的。既然我喜欢游泳也喜欢全面发展地玩各种HIIT,kickboxing,舞蹈,普拉提,瑜伽之类的我就应该把那个不是唯一的运动的跑步份量减少,少吃多滋味。不是每项运动都会适合自己,但我是一个很图新鲜的人,所以我每一项都想试都想玩,只是玩一玩都需要时间和精力啊!

今天据说要集体行动去完成5个仓的扦样,所以现在也就只能在办公室里严阵以待了。雨下个不停,虽然算不上很大。

2015-12
25

爆发怒

By xrspook @ 12:45:31 归类于: 烂日记

我经常在blog里吐槽,但我不会经常地和别人面对面抱怨。我会选择输出方式,光有输入没有输出是不行的,但面对面地抱怨只会把负能量的东西传递开去,我自己尚且不希望被别人这样,我又怎么可以以这种方式“强奸”别人呢!但有些情况,别人已经开始吐槽,遇到某些点我实在按捺不下去无法再有意无意地左耳入右耳出地忽略掉了,在那个时候我就会爆发式地吐槽,比所有人都激动、比所有人都猛烈。昨晚睡觉前和室友的交流就发生了这种事。通常来说,对一些不公的东西,我只是不语,但昨晚我实在忍不住了。到底什么是公平!什么是正义!什么是好!什么是优秀!谁该被重用提拔!这些东西绝大多数时候我即便觉得很不满都只是憋在心里,但既然她说起了,难道这个鬼单位有任何让人信服正义的地方?!我不说,不等于我就不在乎不等于我就不知道不清楚,我只是懒得去做无谓的挣扎罢了。昨晚我很生气,她估计也听得出来,所以我说完一堆后她就没再说。正因为睡觉前来了这么一发激动,所以我昨晚很久都没睡着。睡觉前过于兴奋是非常不好的,无论那是因为好事还是坏事。这些年来的经验告诉我,睡觉前什么话都不说,躺到床上之前1个小时都处于一个人静处的状态入睡就不会有什么难度,当然了,前提是之前你别一个人打游戏打得相当的兴起。睡觉之前聊天,而且是聊得热火朝天通常会影响睡眠,尤其是关灯了躺在床上说,一方面,那样根本不知道聊了多久,很随便就会超过1个小时;另一方面,人的大脑不是说刹车就能刹住的,所以即便是结束了以后还得有好长一段时间的缓冲期。

孤独不等于抑郁。我觉得孤独是个中性词,从好的一方面考虑,那是一个非常好的静修环境,人的心态最容易在纯粹自我对话中达到平衡;从坏的一方面考虑,如果某人太悲观,越想越是陷入黑暗的泥潭那就挺惨。孤独是个主观行为,有些人是因为抑郁逃避别人而选择孤独,但从我的角度看来,孤独是一个让我舒服平和的状态。和很多人在一起不是不好,但我需要有自己的思考,没有斟酌就无法输出,而那种深入透彻的冥想只能在一个人的时候才能做到。在进行小组讨论之前每个人都应该做好充分的准备,为思维碰撞打好基础,否则那就只是在浪费大家时间。

这几天在翻译TZP DVD Bonus里的最后一部分——论坛篇。这东西是AK做主持,邀请了几位教育界人士和医生来共同探讨儿童生理心理问题。对我来说这是个极好的学习机会!如果看视频,我绝对看不下去,720*480的画面,颜色惨淡,专业人士不是专业演员颜值不高,一直都是几个人说说说的状态,如果看视频的话我肯定会几秒钟拉一下然后关掉。但我在进行翻译,对象只有文字,无论画面多么精彩或多么不堪一个样。考验我的只是怎么沉得住气把接近1000条的英文字幕翻译成中文。画面是糟糕的,但内容是精彩的。我是越翻译越带劲的赶脚。专业人谈专业事也会出现个问题——我不懂专业术语肿么破,整得不对会让大家笑掉大牙。好彩的是说的都是印地语,我英语翻译成中文了偏颇了别人也不会在听印地语的时候发现什么问题 XDDD

今天说好要下雨的,但实际上早上到下午都艳阳高照,也像昨天那样入黑了才下雨吗?

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress