2019-07
13

从收集数据开始

By xrspook @ 18:14:00 归类于: 烂日记

在大数据的年代,对大公司来说,收集信息不是难事,怎么把信息经过一番折腾以后,变成他们所要的信息,指导他们的宣传、生产,甚至是发展方向才是目的。但是对一些小公司而言,把最基础的数据收集完全也不容易。之所以这样,是因为他们很多都没有感知到数据的重要性。对很多人来说,工作只是一个应付的行为。应付领导布置下来的任务。做完已经已经很了不起,更不用说你不可能奢望他可以在那基础的上发展些什么。因为这样的态度,所以仅仅收集好任务要求的那些数据对他们来说已经完成任务。他们不会帮你思考实际上还有哪些东西是需要收集整合的。就因为这样,我们经常会错过很多。

我觉得,在大数据的年代重要的并不是具体某一条数据所包含的信息,要把无数条真实的数据放在一起才能得出某些结论。首先,这些数据必须是真实的,而且这些数据的维度必须一致或者类似。如果数据的详细程度不足够,就得通过某些技术手段把数据整合起来。有可能那条数据代表某一个人,又或者那代表某一个工序。我觉得大数据的这种东西除了要求数据的数量够多,也要求每一条数据反映的维度够多。

昨天在和新招回来的小妹妹聊天的过程中我发现,原来她大学所学的金融学和会计学这两个专业跟我所读的食品科学与工程.在毕业论文这个问题上,差别非常大。因为我们完成毕业论文的前提是必须完成毕业实验,然后我们才可以根据那个数据写我们的东西。而她的论文,据说数据完全是通过收集回来的,她自己都觉得不太完整,但她已经尽力了。她要分析搜集回来数据背后的某些规律和原理,而我们要一开始就做好规划,首先设定我们的目标,然后设定如何验证那个结果,最后通过我们的实验发现一些规律,得出一些结论。非常有可能最终我们都没办法把那个毕业实验的东西提升到理论的层次。因为要做到那个的话,有些人可能研究一辈子都做不到,更何况我们只有区区一年的时间。但相对他们而言,我们经历的显然要更完整一些。对我们来说,从一开始我们就必须知道,我们要收集什么数据,以及为什么要收集那些,但是对他们来说,很多数据都是现成拿过来的,他们只能做减法,没办法做加法,但对我们来说却不一样。有可能在设计的时候,老师就觉得这样不完备,我们可以增加一些条件之类的东西,又或者在我们实验的过程中,我们要根据实际情况进行数据收集的调整。从表面上说,我们的论文貌似复杂麻烦一点,但实际上我们的内容更自由。我受过的教育让我觉得白手起家没什么,那些对别人来说是额外麻烦事的东西对我们来说再正常不过了。大概因为这样,所以要一个理工科生去解决某些貌似不是这个专业的问题的时候,会收到神奇的效果。

大概是命中注定,高考的那一次我达不到平时的水平,于是没有去广外,而是去了华农。

2019-03
23

不只是中文

By xrspook @ 19:34:46 归类于: 烂日记

还记得大学的某个专业课的老师跟我们说,认真读书,然后找份好工作是为了以后当我们想吃什么的时候,我们可以随心所欲买,而不会有各种约束。当时我学的那门课叫做感官评价。那是很重要的一门食品专业方面的课程,虽然只是选修课,但是我却从中学到了很多。

这门课不需要进行闭卷考试,但是却要交一份集合了几种感官评价方式的资料收集。这其中就包括了翻译,因为我们收集的资料必须是外语的,然后我们需要把核心部分翻译为中文,不需要全文翻译,只需把核心的部分翻译出来就可以了。那门课之前我们的确已经学过了各大数据库的文献检索,但那是我们第一次真的主动自己找那些我们需要的评价方法。这就需要我们要准确把握关键词。那也是我一次也是主动阅读英语论文,他们的版式和思路让我着迷。这种训练在后续完成毕业论文的时候帮了我大忙。这是一项非常重要的技能。

一直以来我都觉得搜索能力非常重要,虽然我一开始上网的时候已经掌握了这个,这也是我接触的最多的。如果不是Google被墙,大概现在我的生活会很不一样。在学校的时候查阅外语文献我们还有校园网,虽然里面的资源可能会有点旧。离开了大学以后要在找那些东西实在太难了,但实际上不只是专业学者需要知道那些东西,普通人也应该可以查阅得到,只不过是下载的时候可能要额外付费而已。但实际情况是不在校园网,外人甚至连进入那个文件检索的平台,于是离开学校后我们就只能回到一开始那样靠普通搜索引擎里查找我需要的东西。我一直觉得专业的东西跟生活是不脱节的。当然,专业尤其是高精尖的生东西肯定必须源于生活高于生活,但那些东西不是在钻牛角尖,不只是为了写论文去做研究,而是因为我们能看出那真的很有意义。说不准马上能帮助人类什么忙,但是在恰当的时候那一定会起到恰当的作用。起码在我做研究的时候,我是这么觉得的,如果连我自己都觉得那没有意义那只是在浪费时间,那只是在应付式的完成任务,我无论如何都不能打起精神去干那种事。我或许会直接跟老师拍板说我不干这个,的确我也干过这种事。质疑老师布置下来的任务的学生绝对是个神经病。遇到这种学生的时候,老师除了生气还有能力祭出大招让学生心服口服的,那更也是非常厉害的存在。我觉得做大学毕业论文的时候,我和我的导师就是这样。现在回想起来觉得这非常不可思议。正是因为曾经做过这种非常规的事,这样的经历足以让我铭记一辈子。

后来我明白到不一定非得在高精尖层面上突破才算厉害,把一些普通的事做到极致其实也很了不起,对我来说这很重要。比如我看过一部翻译得很一般的好电影,我下定决心把那重新翻译,而且我还真做到了,那成为了我的处女作。作为当事人我不能评价我的翻译一定比我之前看过的那个好多少,实际情况是的确已经好了一些,但具体有多少我不知道,最重要的是我曾经为了那个竭尽全力,我很自信,我不后悔。对别人来说这是微不足道事,但这对我来说,做这种事让我感到很幸福满足。认真地竭尽所能的感觉非常好。

我的世界不只是在中文领域。

2015-09
8

看不惯

By xrspook @ 13:05:34 归类于: 烂日记

养成习惯的过程是痛苦且快乐的。你必然得付出一些代价,你必定会走一些弯路,这就是成长不可避免的过程。我知道必然会遇到那些,所以我不会试图躲避,我会做好心理准备迎上去。谁不曾犯错!我觉得只有真的痛过了才会领会到某种真谛,一切都顺风顺水不现实。可能正是因为有这种心态才让我在各个领域上都具有很强的学习能力,因为怕摔跤就不前进对我来说根本没门。如果连栽跟斗和死都不怕,没什么可以阻挡我的不是吗?除非某件事从一开始就是有违真理的,是错误的。

第一次让我知道别人有畏难心态的是在做本科毕业论文的时候,我的一个同学给了我一句“如果失败怎么办?”你丫的还没做就找后路!就凭那么一句话,我的导师立马决定不接收这个学生。我和我的导师都感到很反感,因为前提是什么都还没开始,只是在规划阶段,将要遇到什么具体问题还属于未知,那人居然已经在退缩了。我不能评价我的那个同学不好,但显然,他不适合做一些创新性、前瞻性、实验性的事,我是不是应该说他缺少某种对未知的渴望和蠢蠢欲动想探索求知的激情呢?直到那个时候我才明白到原来我觉得自己那种与生俱来的对未知的兴奋不是人人都有,或者说不是人人都像我这般反映强烈、欲罢不能。

对我来说,开口让别人帮忙是最困难的事。我宁愿自己埋头苦干花费很多时间去琢磨参透,真的无计可施了才去找人。这种性格不是主流,起码现在的年轻人都不这样。他们获取的方法就是“求助”,一开始就那样。我崇尚的是机械斗智斗勇关键词去搜索,他们崇尚的是希望有人帮忙,利用人肉搜索!他们理所当然地觉得肯定有人会帮忙。我心肠太好,通常如果被点名,我会出手相救,但我蔑视这种不劳而获。他们做这种事的时候怎么就心安理得呢?别人凭什么你要什么就给你什么?!是不是家长在成长过程中过于呵护造成的呢?我跟现在的年轻人有代沟啊~ 虽然,从年龄上算,我无论如何都是一个年轻人。我也有点看不惯现在年轻的家长,自己都还是个大孩子,各种不成熟,这样怎么可能带出靠谱的下一代?!他们不觉得他们有问题,但我这个外人却总觉得他们不是合格的父母。当爸妈不是那样的,责任啊、义务啊、时间啊、耐心啊…… 钱不能解决问题,把孩子塞去各种补习班兴趣班也不能解决问题,毕竟归根到底,那是你的孩子,你不能把教育的责任都推给“专业人士”。家长是孩子最好的老师,孩子所带有的风格应该是家庭氛围给予的,而不是什么班教会的不是么?孩子不应该是流水生产线上千篇一律的程序产物!!!好吧,我承认我激动了。你完全可以嘲笑我这个不当妈的没资格在这里说三道四,但我不当不代表我就不懂得怎么才算一个好妈妈。

世界太大,东西太多,需要愤慨的事情无数。

2015-07
24

那么一丁点的差别

By xrspook @ 12:52:00 归类于: 烂日记

每个星期我都只有一天是早上7点甚至8点过后起床,那就是星期天,而下周,我会连那唯一的一次都没有。因为明天(周六)要去体检,所以周六早上的晨跑得推迟到周日早上了。一周的其余时间我只有2个正式起床时间(我有2轮闹钟,第一轮是提醒开始插温度计量基础体温,第二轮是测温结束,起床鸟,正式起床时间指的是第二轮闹钟),要不540要不610。540用在周一,其它时候610(实际上周六晨跑我用的是500+510+600闹钟,前两个是第一第二轮,最后一个是之前折腾吃完早餐后再歇歇消化顺便睡个觉)。都说600前起床的才算早起,那么559的闹钟,拖延症15分钟后再爬起来那叫做早起?

这让我想起了毕业答辩优秀不优秀的说法,要申请成为优秀毕业论文就得进入优秀答辩组,普通答辩组的老师由某个领域的各种层次的老师组成,而优秀答辩组的老师则是由某个领域最top的老师组成。90分以上就叫做优秀,在普通答辩组你不需一定非常厉害都有可能拿到88或89分,但从毕业论文的设计、实施、论文撰写、答辩准备、答辩表现都极致的情况下你也有差不多一半的概率拿不到90分以上。91分和89分,区别就只是区区2分而已,但为了那个“优秀”的头衔,付出要多得多。至今,我不知道自己的本科毕业论文算不算是优秀,他们好像从来没有确切给我一个yes or no的回复。事隔那么多年,我的记忆已经模糊了,因为那上面的成绩论文撰写是89,答辩表现是93+,还有一个忘记了是什么分,也是90+,就平均分而言,总体来说是在90以上的,但谁知道呢?分数和判定没有一个确切的对应关系吗?还是,只是我自己不知道???之所以不知道是因为当年离开的时候学校还没有给我本科四年的最终各科成绩单,成绩单如果在学校我回去拿也就完事了,但问题是成绩单在我同学手里,她老是说要给我,却一直没给,估计到现在别说我的了,连她自己的了也不知道哪里去鸟。所以,是否90+,我始终不了解。不知道我当年为什么要奔着优秀而去,但如果我不奔优秀奔啥呢?奔随随便便完事毕业?那完全就不是我的作风啊好吗?!好像,当年是为了给老师扬眉吐气一番,但我不需要为老师出什么头啊,因为人家早就是有名的教授,虽然他特立独行,不是传统风格,始终带着他自己的性格。我尊敬他、崇拜他,所以我觉得我应该为他做点什么,这思路很正常,不知道我有没有想多,我应该也是他的得意门徒。他是那种从不虚张声势,但却会在你最需要的时候给你帮助,在不知不觉的小事中让你感到窝心关怀的人。我喜欢这样,我也愿意成为他那样的人。不过我俩有很大区别,他能说半句话不会说一句,我是明明可以一句话结束我可能要说上三句。也许随着时间的延长阅历的丰富我会改变,他比我大24年,足足2个生肖轮回啊亲!有时我是话痨,有时,我甚至不说完整的句子,只是憋出个词语解决问题。在那些时候我就会想,别人看我的时候会觉得我像英叔那般吗?但那么做,我真心不是故意摆款的,只是觉得真没必要说太多。

别人在玩手机玩电脑玩游戏的时候我在浏览网页,看某些领域的消息和新闻,觉得有必要的时候就进行翻译或贴图。这就是我之所以和他们不一样的地方。除了Windows自带的纸牌之类,我的电脑里没有游戏,没有单机游戏,也不会找到我有在网页上曾经打开联机游戏的记录。同样,我的手机里现在一个游戏也没有。从前,是有的,电脑上和手机上都有,但现在都没了,我不需要那些,我有很多很多事可以做,没时间用在游戏上面。睡个觉、看个书、刷刷围脖和微信看看有没有人找我(不是为了消磨时间看各种消息)。人生有那么多事要去做,怎么就有时间玩游戏呢?不是因为我觉得游戏不好,而是我玩的话我会很内疚,因为我本可以用那些时间做些其它事,做一些对其他人来说有益的事。可以这么理解?我的核心本质是想服务别人,而不是被别人服务?估计,这也是我看不惯现在某些小年轻作风的原因。他们那种任性的张口主义,我不喜欢,他们甚至不用拿来主义了,他们连伸手都懒,直接张口命令你得把他们要的送到嘴边。

看书可以让人变成话痨,跑步可以清空大脑让人保持空白。

2015-05
8

累瞎

By xrspook @ 9:49:10 归类于: 烂日记

现在是大清早,但我感觉很累很累。我什么正经事都没开始干呢!累跟长跑受伤一个样,不是一时半刻整出来的,那是日积月累的结果。大前天晚上和室友聊到午夜12点多才睡觉,前天晚上看电影+整橡皮章1030睡觉,昨天改了一天的论文到1130才躺下,外加昨天中午为了写blog没有睡。一个乱入的论文修改把我弄得措手不及。幸好昨天一大早下雨,领导塞车被堵在路上,于是我有机会看了一阵的书。若不是看书过后我手贱点开食品工业科技的采编平台,我不会发现审评稿已经下来,我需要修改。迅雷不及掩耳地我把那稿子下载了回来,然后开始按照上面的要求修编。你知道么,当我早上晚点时候、下午、傍晚再打开那网站的时候已经挂了,不知为何,就是挂了。估计是服务器出错,我就是那么好彩,在他们网站挂了之前就把东西下载了回来,更聪明的是下载回来的审评稿我没有直接就在上面修改,而是另存为了文件才开动,所以即便网站不能再打开,即便我怀疑自己是不是改错了我还有最原始的资料可参考。这一切都不是运气,这是经验,这是积累的结果。每天只要打开邮箱我都会顺便打开采编平台,看看有没有新动态。理论上,采编平台上任何进展我都会收到邮件,但偏偏审评稿退回给我需要修改,我却没有收到邮件。提示让我修改是5月7号开始,5月21号结束,2周的时间,但如果我完全没有神经质一天查看N次采编平台呢?我铁定要错过了有没有!其实5月6号晚上(早上或下午都还没有)我已经看到他们的进度到达了外审完毕,编辑查看的程度了,我觉得如果要退修必定是近期的事。想不到5月7号一大早他们就已经把审评稿发出。我也迅雷不及掩耳地5月7号早上开始退修,5月7号晚上退修完毕重新递交修改稿。

我很有诚意的啊啊啊啊啊啊啊啊,有木有!

不过之所以可以那么快实际上因为我有充分的资料后盾。这篇论文是我本科毕业论文的阉割缩减版啊啊啊啊啊啊啊。毕业论文算上封面一共41页,接近2万字。但我拿去投稿的论文我好不容易才控制成6000字多一点,这真太难了!所以,当编辑在我一级标题“结果与分析”那里批注“不要只表述现象,要分析。”的时候,我觉得天下第一大怨!我把很多很多我的想法删除掉了才凑出了现在的模样,之所以分析少是因为把最基础的东西呈现出来已经耗费很多版面和字数了,再来些一大段一大段的见解,那是必须上万字的节奏,折腾不起…… 通常来说,一个期刊上发表的论文,我觉得6000字几乎是上限了不是吗?他们应该不会给我那么多的版面,我也付不起天价的版面费。于是呢,我昨晚需要做的不是再看着实验结果绞尽脑汁想什么,而是重新翻阅我的毕业论文精简提炼其中的一些观点插回到论文里。

一看本书从薄变厚太容易,现在我的水平处于,把书从厚读薄太困难。但我相信经过一定时间的积累,我能做到。如果训练机会足够多,且我一直都能沉浸在高大上的风气里,我能做到如食品工业科技编辑们那般的专业干练。干那个会死很多脑细胞,我懂,脑力劳动比体力劳动更辛苦,我太明白了!但我喜欢干那个,是打心里热爱。如果能把那个变成我的职业就太神奇了,不过实际上我并不想那样。兴趣跟职业还彻底分开,井水不犯河水比较好。

今天还要做12个样品的大米胶稠度检验,5本职称计算机的书我一本都还没看完,今天已经5月8号,还有20天就开考了好吗!

and,今天是516广州官洲生物岛10K比赛查询参赛号码的日子。

© 2004 - 2024 我的天 | Theme by xrspook | Power by WordPress