周末偶有点儿感冒,于是不敢拖很晚才睡觉,同时作业一堆,所以整个周末白天的时间都在做作业,没有时间搞京剧了。甚至于 email 都没有回复。 所以您若是这期间发来了 email,请多等两天就会有相应的回复了。
分类: 未分类
未分类的文章
除夕
除夕之夜(晨?过年,自然按国内的时间了),还要爬起来去上课,正所谓“他国我国不一般”,这番邦就是和咱天朝没法儿比。
新春快乐!来张马连良的《跳加官》剪影,算是送给各位看客的祝福吧!
“人言可畏”
不要误会,实在是想不出更好的词来形容这个话题了,与“人言可畏”的真正含义毫无关系。
这些天和网友金缘通电子邮件,谈到一个问题,就是剧本的录入。金缘问:“是怎么录入啊?不会是一个一个字的往里敲吧!我没有接触过这方面工作,但是别人建网站时,大量的资料是用扫描仪扫进去,再用汉字识别软件把它转换成文字文件,再使用语音软件边念边校对。您们也是这样做的吗?”
这里涉及同一类的两个问题:文字识别和文字阅读。在文字阅读方面,现在的技术已经算是比较成熟了,至少在小豆子接触的中、英两种文字的文字到语音的程序,都是很流畅的(除了个别特殊发音的地方有时会念错)。而在文字识别方面,英文的识别已经较以前有了很大进步了。但由于中文比英文在字形上复杂得多,中文的光学字符识别(OCR)技术,小豆子认为离成熟尚早——尤其是对付像剧本这样有着特殊情况的输入源。
首先,为了提高识别的正确率,需要让程序“学”很多词句的组合,在一个地方看不清的时候,就要程序根据上下文来判断当前所缺字符字形与哪些字相似、此处该出现的词的词性以及其概率,然后做出选择。而由于剧本文学与普通的文字有着很多不同,如果按照普通文档来识别,错误率还是很高的。
其次,由于老书是繁体字,加上年头久远,纸质发黄,哪里是字哪里是纸分得不是那么明显,若强行采用黑白扫描,字中间就可能会是一团漆黑,使得电脑更难辨认。尤其是中文字库之大,形似而差几笔的字很多。所以这也是老剧本识别率低的一个原因。
但这也不是说敲字就保证没有错别字,只是这样产生的错别字更容易找出来(特指拼音,五笔字型或其他按字形输入的输入法,所产生的错别字有些类似于 OCR 的结果)。比如“已然”,如果用扫描,可能被扫描成“己然”,而若校对时候没有仔细看,就会被忽略掉;拼音如果拼错了,拼错的字在字形上与正确的字有很大差别,所以比较容易看出来。虽然直接敲字在录入的时候可能会费一些时间,但是在整理、校对和格式化的时候却能够省时。因此,两种方法只能说各有利弊而已。
参加录入剧本的朋友很多,在校对的时候,能够看出哪些是用拼音敲的,哪些是用扫描仪或五笔录入的。条条大路通罗马,这都是数字化的手段,不存在一定要使用什么录入方法的问题。当然不可否认,对于一些页面干净的新书,有些 OCR 程序还是有很高识别率的。
皇兄的二次校对对那些形似而实非的字是很敏感的,最近抓住一个“隹”,应为“佳”,实在厉害!
人的思想、语言比电脑要复杂得多得多了,在文字、语音识别、文字之间的翻译等等与人言有关的工作上,电脑永远也不能代替人(所以您若是位翻译,大可不必因为某个号称更强的翻译软件的出现而担心会丢掉饭碗)。电脑以及为人工智能而奋斗的人们,应该是最能体会“人言可畏”的吧。
补习完了
好一个月黑风高杀人夜,凌晨了……
晚上的补习还是有不少成果的:根据错误报告提交上来的内容,改正了《白蛇传》中的一个错别字和“梨园百年琐记”中的一个错别字。啊,“梨园百年琐记”有近两年没更新了,时间晃得真快。给合意太爷发了一些剧照,并扫描了两出剧本发给录入人。又回复了一些信。怎么就这个周末显得那么忙呢?皇兄那边倒是正相反,闲得很,所有二次校对的都完了,已经开始拿好几年前的剧本开刀了。
停电!
倒霉的水管儿,导致市中心一片停电12小时左右:从早上8点多到晚上将近7点。今天在睡梦中忽然感到电脑停了。奇怪,电脑开着有一些由风扇产生的声音,而关了就没声音了,竟然能在睡觉的时候感到外界的噪音消失,那岂不是一直在习惯性地听着原有的噪声?
不管怎样,没电了。今天的一切计划全部打乱,只好去学校做作业。录音无法整理,等待发出去的剧本无法扫描。现在一切正常了,该补一下没干的活儿了。
A broken water main caused a power outage in the city’s downtown core today, prompting the closure of stores and tourist attractions and leaving some residents without power for nearly 12 hours.
Toronto General Hospital and Sick Children’s Hospital operated on emergency power.
The City of Toronto opened Metro Hall for condo and apartment-dwellers who were left without heat as temperatures outside hovered well below freezing. Personnel from the Red Cross were on site.
Power began to be restored just before 7 p.m., and was fully restored by 7:45 p.m., said Karen Cormier of Toronto Hydro.
At about 7 a.m., fire crews were called to a water main leak at a power station at 532 Bay St., near Dundas St. Hydro crews shut off power before 9 a.m. after the water main caused flooding at the facility.
The power was shut off for safety reasons, according to Toronto Hydro.
Buildings between Grenville and Pearl Streets from George St. to University Ave. were without electricity for much of the day.
Ryerson University and the Toronto Eaton Centre were closed and not set to reopen until Monday.
“We don’t know the extent of the damage (of the leak),” Hydro One spokesman Alan Manchee told a news conference this afternoon.
The ramifications of the outage would have been worse had it happened on a weekday, Manchee said, as it struck much of Toronto’s financial district.
“I’m not sure you could say any time is a good time for an incident like this,” he said. “(But) it’s good that it happened today rather than a weekday.”
Manchee said power was restored incrementally to avoid overloading the system.
Power was returned at the Eaton Centre and Ryerson University, along with most of Yonge St., just after 7 p.m.
Cormier said there was no significant damage done to Toronto Hydro’s equipment and that any replacements needed will be made by mid-week.
During the outage, Staff Sergeant Duggan of Toronto Police said a section of Bay St. was completely closed and several traffic lights in the surrounding area were not functioning.
Toronto Transit Commission subways and streetcars ran at regular speed, though some stations were a little dimmer than usual because emergency lighting was being used, said TTC representative Marilyn Bolton.
忙!
就一个字,够概括这些天的日子了。这几天纯粹没时间整理剧本,好在库存颇丰,随时拿来,半个小时就可以做一次更新。就是这半个小时暂时挤不出来。
包括录音,已经录了一些,暂时还没时间整理出来。好在有四台电脑可以同时使用,相信今天晚上应该有所进展吧。
移动硬盘被借出去了,上面有李宗义《斩黄袍》的电影,准备拿回来后截图,然后就该进行第三批剧照的更新了。
说到《斩黄袍》,有幸听到西城老军所传姚玉兰主演的实况录音。绝对老派演法,所有在当年整理该剧剧本时见到的,里面都有。比如苗顺“算定苍龙,命当归天”,后面出来个“黄花洞中一仙翁”,把郑英救了,到后面郑恩死后和陶三春的对唱,在当时都觉得无比新鲜。没想到还能听到这种演法的录音,真是太棒了。虽说现在(现在还有人能演这戏吗?)的演法,去掉这些“迷信”,也算通顺,这种老的演法也不见得多高明,但是这毕竟是一种历史的见证,一种文化的体现啊。
Adobe Acrobat 7
刚发现,去年年底的时候,Adobe 推出了 Acrobat 7。现在软件更新的速度可够快的了,考虑一下是要升级到新的版本呢,还是继续用现有的6。反正做出来的 PDF 剧本大家都可以读——向下兼容就是好。
2005年到了
真不习惯,要开始写2005了。新年快乐!
吃啊,喝啊,过节啊。不过今年没什么感觉,正好赶上周末,而且下周一就开学了。还有一个原因就是几天前东南亚的海啸引起的那场灾难。
告别2004年
2004年很快就要过去了,外面还在刮大风——虽然温度并不低。又是一年的结束,又将是一年的开始。还不到说新年快乐的时候(当然已经对在国内的朋友们说过了),所以先道一声拜拜,2004,又一个精彩的年度这样飞快地过去了,似乎比刘翔还要快。
顺便说一下,刘翔确实让今年显得格外精彩。让我们面向2005年,像刘翔一样,对戏考的录入进行下一个冲刺。
金条
圣诞节前几天,网上就开始流行“个性化”金条,形式是一个网站,做成和正规的新闻一样,内容大约是说个性化金条上市,附有图片,其图里显示的就是个性化的名字。这个图片是通过 URL 传进去的名字合成的,逼真得很。
有兴趣的可以到这里看看,最下面填上自己或者朋友的名字,生成一个新的网页,把网址传给朋友就可以了。当然,也可以像小豆子这样先保留一个自己的金条。
“新闻” 内容:
12月25日,一位银行销售员在展示新年“个性”金条。这些金砖非常个性化,可以刻上用户的名字和祝福语。此次上市的新年“个性”金条分为20大类110种规格,成色均为99.99%。金条价格参照上海黄金交易所和伦敦金银市场黄金价格体系,分别按销售价和回购价买卖。据悉第一批个性金条,已被等候多时的消费者抢购一空。