2020-04
27

随机应变

By xrspook @ 9:06:39 归类于: 烂日记

python的习题我已经习惯了他们不给参考答案,又或者是参考答案里有一些超纲的东西。既然这样,如果我可以用我学过的东西得出答案,我会努力地那么干,但如果我实在没办法,就会请教搜索引擎,然后我也会用上一些超纲的函数解决问题。现在我只学到了一些很入门的东西,所以实际上现在很困扰我的问题实际上已经有现成的函数可以秒杀掉。秒杀是很简单的,你知道使用范围,然后把东西丢进去就可以了,但如果全部都这样拼凑,跟直接在Excel的系统函数里玩有什么区别呢。知其然,也要知其所以然。经常让我纠结的东西我会想到一些很特殊的情况,我该怎么把那些特殊情况也处理掉呢?当然我想到的特殊情况可能并不算太特殊,又或者还有很多特殊的东西我没有考虑到。内置的函数里,很多东西都固定了取值范围。比如说针对字符串的函数很多东西,你只能在里面填字符或字符串,你不能把列表、元组或者字典丢进去,所以这就很烦恼了,如果我要处理的不只是我能列举的那些字符呢?比如说我要处理的是32个半角的标点符号,我要把他们替换掉,它们32个是以一个字符串的形式放在一个函数里的,你可以直接的把它们引用出来,但是,如果你要把它们替换掉呢?我遇到的问题是,我需要把它们全部删掉。为了实现这个,我写了个循环,历遍了字符串里面的32个元素。然后把它们逐一替换为空字符串。后来我认识了一个比较高大上的函数,叫translate,而在translate之前,又有一个制定翻译规则的函数maketrans。Python3中,maketrans已经被列为内置函数,不需要再引入模块才能使用。Python3的maketrans有一个相当牛逼的功能,就是在创造翻译规则的时候,我可以引入字典。这是一个非常妙的点子!因为在创造翻译词对的时候,强制规定前者跟后者,必须是等长的,而字典的键与键值一定会成对出现。一开始我用那个函数的时候,被翻译的是32个字符,然后我手动数了32个空格进去。后来我为这32个字符建立了一个字典,然后优雅的把字典丢给了maketrans,最终让translate秒杀完事。

关于分隔出一段话里的每个单词这种事,正常人的思路是筛选出那些0-9以及大小写字母。但是,在一开始的时候,我被暗示要用减法。首先,把整段话都变成小写,然后剔除掉里面的标点符号。最终根据分隔符把单词切开。如果一开始,我就想到用限定字符的话,我会从正则方面考虑,但貌似我的做法跟正则出来的效果有点不一样。因为正则之下,居然星号、逗号和杠都没有去掉。这让我非常惊讶。当我对比我的方法提取出来的词和用正则方法提取出来的词以后,我发现在那个排版有点过分的emma文件里,我的提取效果要比网友的正则好。虽然总的来说两种方法算出来的单词量没插多少个,但实际上但把差异打印出来以后,效果还是差得挺远的。

我还是比较习惯自己先琢磨一下,得出自己的方法,然后再去跟别人比较。

2020-04
11

到底要做些什么

By xrspook @ 18:18:23 归类于: 烂日记

昨天我在完成Think Python 2的试题的时候,发现了一个非常严重的问题——我不知道那道题到底我在叫做什么!

造成这样,原因有很多方面。首先有可能因为翻译的人只是把单词从英文变成中文,语序没有调整。我不知道,他那样表述,他自己知不知道自己在说些什么,他真的能够根据他自己的描述把习题解答出来吗?我做翻译的时候,如果遇到一些我搞不懂的东西,我会在那里纠结,先是自己纠结,然后是找各种资料,还是不行的话,我会求助于别人。如果这些方法都没能解决问题的时候,可以的话,我会把那一段跳过。跳过这种事只能用在纯文字翻译的时候,视频翻译是根本不可能做到的。我会跟朋友商量出一个我们都觉得可行的方式,把那东西表达出来。有可能那不是作者的原意,但是按照我们的翻译,联系上下文,语义是通的,没有逻辑问题,没有理解缺陷。所以非常有可能看我翻译出来的东西,你会被我的思路带乱了,但非常有可能你察觉不到原来原文是另外一个意思。所以别人看过我的翻译后,觉得那很顺,至于好不好,我不敢包。

我遇到的Think Python 2的翻译不这样。于是就像我之前所描述的那样,我不知道翻译的人知不知道自己在表达些什么。当然,也存在这么一个可能性,翻译的人知道自己在说什么,在他的专业圈圈里,他们的话就是这么讲的。我跟他们不是一路的人,所以他们的脑洞我无法理解。这也就是虽然我们说的是同一种语言,受的也就是那几本教材的教育,但是我们想象出来的东西是不同的。

如果是翻译上的问题,大概我把原文看一看,也就懂了。之所以让我觉得那些东西羞涩难懂的另外原因是数学这种东西我已经放下好久了。虽然我每天都还在用的数学,但并不是那种高端的模式。我想都没想过用简单几句编程语言就能实现那些定理。那些我知道又或者不知道的定理。当我还是学生,仍然必须面对那些东西的时候,我都不知道原来定理是这么定义出来的。虽然我知道那东西怎么用。或者那说的是一种我已经很早就知道的东西,但表述的那个方式刚好跟我一直以来认识的的方式完全不同。情况就像是,虽然我们要到达的是同一个山峰,但是我之前是从南面上的,他们却是从北面上的,我从来都没走过那条路。所以,光从路上的风景,以及登山的难度,我根本想象不出原来那座山就是那座山。但我又知道那座山就是那座山,因为从坐标位置看来,山顶就是我熟悉的那个地方。过去好长时间,编程的时候老师都不会丢出定理,叫我们去实现。通常我遇到的题目是一些隐含着定理,但更多的看上去是现实的应用题。在没有抓手的时候,我莫名地觉得有点慌。

我要冷静沉着去应对。

2020-04
10

判断a是不是b的幂

By xrspook @ 23:59:43 归类于: 扮IT

Think Python 2第六章的某道原题是这样的:

Exercise 4: A number, a, is a power of b if it is divisible by b and a/b is a power of b. Write a function called is_power that takes parameters a and b and returns True if a is a power of b. Note: you will have to think about the base case.

版本A的中文翻译

练习4:一个数字a为b的权(power),如果a能够被b整除,并且a/b是b的权。写一个叫做is_power 的函数接收a和b作为形式参数,如果a是b的权就返回真。注意:要考虑好基准条件。

版本B的中文翻译

习题6-4:当数字a能被b整除,并且a/b是b的幂时,它就是b的幂。编写一个叫is_power的函数,接受两个参数a和b,并且当a是b的幂时返回True。注意:你必须要想好基础情形。

研究这道题到底在说什么,我纠结了起码1个小时。什么叫做权?幂来幂去,还有“它”,你真的知道那指代的是什么?我相信翻译这本书的人都一定是编程老手,但你们真的有琢磨过中文表述是否恰当吗?幸好我没买人民邮电出版社出版的Think Python 2中文版,貌似从某些页面看来,翻译也会让我非常吐槽。

还是直接看英文原文比较好懂,那段话我会这么翻译:

如果a能被b整除,且a/b是b的幂,那么a是b的幂(例如:2**3=8,即2的3次幂等于8,a=8, b=2)。编写一个名叫is_power的函数,以a和b为形式参数接收数据,如果a是b的幂,返回True。注意:要考虑好基准条件。

研究这道题在说什么研究了好长时间,随便输入几个显而易见的测试数据也挺顺利, 但要把情况想周全貌似很不简单。a == 0的情况有人想到了,但万一作死的写了b == 0呢!测试过好几个网友的编程,b == 0几乎全部挂了…… 我承认,这样测试过分了。

1
2
3
4
5
6
7
8
9
10
11
12
def is_power(a, b):
    if a == 0 or b == 0 or a%b != 0: # a和b的特殊情况先杀死
        return False
    elif a == 1 or a == b: 
        return True
    else:        
        return is_power(a/b, b) # 被除数a为0会死循环,除数b不能为0
a = 4 # int(input('a is '))
b = 2 # int(input('b is '))
print('a =', a)
print('b =', b)
print(is_power(a, b))
2020-01
28

又见面了,老马

By xrspook @ 17:32:03 归类于: 烂日记

这个春节假期我已经连续好多天都待在家里,重新看完了加西亚·马尔克斯的《番石榴飘香》,然后莫名地让我再次觉得,我之所以喜欢他的作品,一定程度上是因为我们有一些相似点,又或者其实这些不能算是相似点,而是我能明白的某些东西,那是我在其他作家那里无法得到的。我不知道为什么,在看其他作家的作品的时候,某些情况下,我会觉得自己无论如何都很难看下去。越是欧美那边越是有名的,我越会有这种感觉,大概是因为我内心深处一直在抗拒他们吧。于是,我有时会想,翻译的那个到底是如何完成他们的工作的呢?如果遇到某个翻译的人根本不喜欢的作品,他要如何才能开展工作呢?对我这种普通人来说,没有兴趣我就不会主动接受那个任务,但是对那些专业的人来说,那是他们的工作。进行不带情绪的翻译有可能吗?起码对我来说,这是不可能的。哪怕我翻译的是一本科技书籍。还记得读大学的时候,我跟过一个教微生物学的老师做实验。他曾经给我们每人都发了一章英文原版的微生物学,让我们翻译。现在我已经不记得为什么他要这样,是考验我们的专业水平,还是考验我们的英语水平我不知道。反正,我不仅把正文翻译了,而且也把里面的图片都全部截图下来,然后把里面的单词PS成中文。很多科技类的书籍会把正文翻译成中文,但图片仍然是原文的。我这种连图片也PS掉,也要翻译为中文的,属于神操作。当时我没想过不这么做,因为我觉得一套东西全部翻译才叫做完了,只有把图片都翻译了,读者才不会在看图片和看正文的时候一脸懵逼。翻译那本专业书籍的时候,其实我是有点喜欢上的。翻译得好不好是我能力的问题,但我这种的做法让微生物老师大吃一惊,因为这样的态度显然不是逼出来的,而是发自内心的认真。

在看完马尔克斯的《番石榴飘香》以后,我开始看另外一本我还没拆掉塑封的,名叫《蓝狗的眼睛》。看之前我根本不知道这本书讲的是什么。我只是看着一堆还没被拆封的书,随便挑了一本,挑了一本不算厚的,而且从书名也看不出到底是什么的,同时,我也没有看封面的那些介绍。看了两个短篇以后我才发现,原来这本书可能说的都是一些比较神奇的东西。科学一点,那里形容的是人的一些感觉,有可能是实体的,也有可能纯粹是幻想。那里讲的是与死亡相关的故事。说得玄乎一点,这本书整本都在说鬼怪。当我看完第一个故事以后,我就觉得这本书有点像《变形记》。前几个故事都是马尔克斯在四十年代的作品。据说他老人家开始写小说也是因为看到了《变形记》后灵感爆发。之所以喜欢马尔克斯,可能是因为他能把人的那种感觉写的特别真实。不是通过语言,而是通过内心活动,有些作家很喜欢把非常大的篇幅用在描写景物上,但是那些完全是描写死物自己。马尔克斯的各种描写最终都是为了表达人物。我觉得马尔克斯作品的镜头感非常强,看他的书的时候,我眼前根本就是一幕幕的电影画面,大概正是因为这样,所以我欲罢不能,但是,也会有例外,比如《族长的秋天》就看得我很憋闷。那是一本一整本书只有一个句号的作品。之所以有这样的感觉,大概是因为里面很多俚语之类的东西我没读懂,翻译的人也未必都搞清楚了。

我喜欢跟物打交道,但我喜欢知道人的故事。

2019-06
22

一年磨一戏

By xrspook @ 18:30:59 归类于: 烂日记

其实我已经不记得《情侣风尘》这部电影我是什么时候开始翻译的了。文件夹写的是2018年,但是我已经找不到一开始另存为然后开始翻译的文件。所以姑且算那是去年年末开始干的吧。用了大概9个月的时间,我终于完成了全部,其中包括对白、歌舞的翻译、时间轴的调整,以及审核与压制。我记得非常清楚的是,去年台风山竹袭击的时候,我正在翻译《情侣风尘》。外面狂风大作、暴雨连连,我窝在家里,先是把文字部分全部翻译完了,山竹来袭的那一天,我躺在床上,看着打印出来的歌词,把歌舞部分也翻译了出来。查看资料发现原来台风山竹是2018年9月登陆的。我用了大半年的时间完成一整部电影,的确拖得够长的。之所以这样,原因有很多个,比如去年11月底开始我就着手准备几篇统计分析,还有就是准备秋普以及年终考核。去年总的来说,从5月开始到9月我比较闲。所以那时我还有心情去翻译《情侣风尘》。当初之所开始其中一个原因是字幕组内部正在分派米叔作品的翻译任务,有些已经分出去了,但是我一口咬定《情侣风尘》我要亲自出马。之所以这样,是因为几年前挂英文字幕看《情侣风尘》的时候我就略有感觉,觉得往后我或许要翻译这部电影。几年前需要我外挂英文字幕又或者是无字幕观看的米叔电影总的来说已经很少了。虽然有一些有中文字幕的,翻译或者时间轴挺糟糕,但还算是有中文,还算是可以看明白一点。

《情侣风尘》比较特殊,因为很多年以前,中国就引进过这部电影,当时是上译厂制作的。具体什么时候上映已经不知道了,但是肯定有过。所以在某个视频里,有上译厂的音轨,但那只是音轨,没有字幕。在那个版本里,歌舞部分配了外挂的中文字幕,至于那是谁翻译的我就不知道了,反正比较文艺。跟上译厂的风格比较类似,因为对比过英文字幕和我的翻译以后就可以发现,上译厂经常对很多句子进行再创造。如果你只是听他们的翻译,不会觉得有什么问题,但实际上,有些东西他们是直接按照画面编故事。编的故事变很完美,你完全看不到有什么破绽,这就是他们的厉害之处。在这方面,我是自愧不如,现在我做不到,往后估计也不行。对我这些很容易词穷的人来说,遇到这种,编到一定程度我就会觉得自己没办法再编下去了。

相对于后续的操作来说,其实翻译的过程算是比较快的,但是翻译只是其中一个步骤,只是一个一开始的步骤,往后的调整时间轴用的时间更长。2019年初,我又发现了一个清晰的版本,但问题是那个视频是偏色的。网友说那可能是有录像带转制而成的,他们用了特殊的转制工具,录像带理论上可以放大无数倍,所以转制出来的画面清晰度要比DVD好很多,但问题是由于年代久远,录像带本身已经有一些不可逆转的老化。在纠正颜色方面,我曾经努力过,但是最后我还是放弃了。之前我已经翻译以及时间轴校对完成的版本放在那个偏色的清晰版里面相差了5分钟。这5分钟的来源有两个,二者的码率不一样。所以首先第一步,我把25帧的码率调整为24。这样时间就缩短了一些。发现这个,我是对前面几十句对白记录下开始时间,然后对比两个版本,发现平均来说他们相差了4%。但是,这不是两个版本的全部差别。全部调整4%很好处理,但是后面的差别就得人肉的一点一点去挪动了。理论上如果里面没有剪辑的话,是完全可以对应上的,但问题是剪刀手下了无数次剪刀,有些相差几十毫秒,有些相差几秒,又或者几十秒。那些时间不只是在几个点里发生,而是遍布了整部电影。在调整时间轴方面,我花了很长时间和很多精力,如果不是有足够坚定的意志,做不出来,但最后我总算做出来了。一开始我就知道这样做会非常艰难,但我还是做了,这种向死而生,连我自己都很佩服。

最后是校对和压制,相对来说没有调整时间轴那么痛苦,但是也要花很多时间,因为我是个新手,所以在音频处理上屡出状况,幸好有高手指点。

网友说我是一年磨一戏,我觉得这再正常不过了,我没什么好着急的,因为我制作的不是要抢先发布的新电影,我做的那些是早就老掉牙的,没人跟我争。我要做的是尽可能的做出让我最满意的版本,我在为质量而战。

2018年是我的元年,我完成的是《古拉姆》。2019年我完成的是《情侣风尘》,而我最想做的电影是米叔的《灰飞烟灭》,可惜现在依然没找到靠谱的视频源。

下载地址:[论坛原创]《情侣风尘》Daulat Ki Jung 1992[翻译:xrspook 校对:老知][审核&压制:xrspook][百度云]

© 2004 - 2020 我的天 | Theme by xrspook | Power by WordPress