索笑来寻记几回

7月底的时候,看到一条前重庆市委书记夫人、那位四个字儿的女士被提起公诉的新闻。发新闻的不是什么小报,所以这应该不算是什么禁忌话题了吧。于是就着这四个字儿的名字,套了《御碑亭》里王有道与孟月华告别时的唱段,发到网上。很快,这边厢豆瓣就给拿下了,那边厢的新浪微博则貌似安好。等一觉醒来,收到这么一条消息:

抱歉,您在2012-07-27 06:08:47发表的微博“男(西皮原板)但愿得此一去…”已被管理员加密。此微博不适宜对外公开。如需帮助,请联系客服(链接:http://t.cn/z0D6ZaQ)

顺便说一下,新浪系统也不会用正规省略号嘛,拿仨英文句号来代替,果然和韩寒是一家人。

上网十几年来,这是鲜有被删掉帖子的状况。一直以来不希望这种情况发生,也不希望因为可能出现的禁忌而被禁言或者惹麻烦,所以总是在自家的地方开个 Blog 啦,架个论坛啦,就是不想总被各种平台提供商限制。不过,微博时代,只能找个托管的地方。那么屋檐之下,看人眼色,也就在所难免了。

于是觉得有必要定期把在微博上的一些言论归到一块儿堆儿来做个保留,一来这些也是生活中产生的——不敢说思想火花吧,好歹也是一种灵光一现的玩意儿;二来这里面相当一部分是和戏有关的,或者是通过戏的方式表现出来的想法;三来这里既然是戏考的 Blog,也就一并收下这微 Blog 的东西吧;四来不在这里留底儿的话,一些段子可能就永远消失了。

玩儿微博的时间不算长,但对于微博140字的字数限制已经有所领教了。有时候脑子里蹦出一个小段子,感觉不长,付诸于电脑之上,两三行而已。可一数字数,超出十几甚至几十个字。于是一点儿一点儿抠,有时候恨不能电脑能有一种把字写瘦一点儿好让两个字占一个字位置的方法 表情 深刻体会了当年老艺术家们灌三分钟一面儿唱片儿时候的心情了,有时候就得赶着唱呀。可毕竟人家这声音可以提速挤到一张唱片里,这电脑里的中国字一个是一个,有时候还真不好弄。所以就得牺牲格式了。比如占一个字符的标点符号舍掉,以空格代替,这样俩半角的空格才占一个字;有时候戏文的板式就得缩写,把“西皮原板”写作“原板”等。小豆子对于文字略有洁癖,尤其是希望要系统整理好的东西能够格式统一,所以正好就着这个整理归纳的机会,把一些因为受字数限制而改动格式的段子给统一改过来。当然,段子内容是不会动一个字的。

给这个系列起了个名字:“火彩”,都是些一闪念间出现的小火花,出彩与否见仁见智,重要的是那灵机一动后的结果。

至于那个#京剧引子、定场诗、对儿#的主题,因为是纯文字摘抄的性质,就不在收录之列了。反正到时候里面的文字,都会出现在戏考的剧本之中。

那就从上个月的总结开始吧,嗯,其实是要把6月份的也稍带上,那会儿刚开始玩儿。

红毹艺话毕业了

红毹艺话试运行已经将差不多两年,事实上这期间程序上的调试几乎都是很微小的。比如标签云上标注了所包含录音的数目,比如网站首页可以在显示不止一个但隶属同一个话题的录音组,等等。大的框架没有动,还是和两年前一样。

因此,今天红毹艺话算是毕业了,摘掉了“测试版”的帽子,站标也就更简洁了:

红毹艺话
红毹艺话

说到这个站标,当初选的那把小扇子,就是带有说书先生的意思——把梨园的那些事儿,娓娓道来。

这个站还会继续如讲述梨园那些事儿那样,慢慢地更新。说到更新,红毹艺话的频道聚合(RSS Feed)随着网站的毕业也推出了,使用聚合阅读器的朋友们可以通过这个关注网站的更新状态。

为了庆祝毕业,小豆花特地更新了杨荣环谈尚小云唱腔的录音,希望大家喜欢 表情

名称服务器出现问题

最近发现国内朋友连戏考和相关网站愈发困难,于是自己连回国内测试了一下,竟然连 xikao.com 这个域名都无法解析成 IP 地址了,直接告诉域名不存在。这个就奇怪了,因为网站明明是好好儿的。

于是上网查了一下最近的政策和防火长城的变化,发现原来自新年始,国内访问 GoDaddy 的名称服务器(NS)便出现了极度困难的情况。而 xikao.com 都是通过 GoDaddy 的 NS 来解析的。这也就可以解释上面的现象了。在国内已经不是练得通连不通戏考的问题,而是从年初开始很多内地的 NS 压根就不知道 xikao.com 存在了。

迫于形势的变化,只好弃用 GoDaddy 的 DNS 服务器,使用在国内可以正常且快速访问的 DNSPod,经过多方测试,域名现在可以在国内正常解析了,不过连接的通畅性还是不稳定,这个就没办法了,而且似乎因地而异,广州明显比上海和北京要好。

xikao.com 一系的网站一直正常运转着,也将会保持最大化的高可用性(HA)。所以如果突然连不上了,八成是中间的那堵墙又调整了 表情

新春快乐!以及梨园百年琐记2011年度大事评选结果

农历新年又到了,今年因为春节来得比较早(事实上连2012还没写利索呢,经常写成2011),因此应对不及,仓促了些,先给大家拜个晚年吧!祝健康快乐,龙年大吉!

加拿大邮政龙年邮票
加拿大邮政龙年邮票

去年梨园百年琐记搞大事评选的时候,miao网友说这个投票其实很没有意义,小豆子当时对着这几年的投票率,也是有同样的感叹。果然,今年投票的数终于降到了冰点:零。那么看来,这确实是一个不讨好的玩意儿,明年把它停掉是肯定的了。那么这个将可能是最后一次包含“梨园百年琐记2011年度大事评选结果”的帖子,之所以是“可能”,是也许在将来,我们有更好的评选方式,或者其他什么的,也未可知。总之,不把话说绝了吧。

不过,回过头来看一下上一年故去的老先生们,缅怀一下,这个页面终是会留着的。前两天看新闻,中华戏校两位金字科的老先生,张金梁和李金泉,先后离世了,再唏嘘一下。手头还有没整理的李金泉教唱《李逵探母》的录音,应该最近整理出来好,放到红毹艺话

梨园像往年一样,准备了十出戏码庆祝春节,水牌子在此,已经进行到第四天了,感兴趣的朋友可以去看看。

还是那句话,今年的年来得早了点儿,仓促了,收到电邮拜年的和没有收到电邮拜年的,小豆子和小豆花在这儿都再给您拜年了,到与不到,请多包涵。

2011年工作总结

在总结今年工作之前,先补一张应该在前几天圣诞节贴出来的圣诞树的照片,照片拍摄者为小豆花,而这棵树来自据信是圣诞树的故乡——德国。是的,我们去德国玩儿了几天,才回来的。

科隆街头的圣诞树
科隆街头的圣诞树

今年戏考新增剧本数目35个,较去年少了3出,但是还没有像前年那样跌出一个更低的产量,所以说还算是正常的吧。具体的分布情况如下面的图,今年换一个扇形图吧。

2011年工作图表
2011年工作图表

本年录入第一多的是小豆子,敲了13个剧本,第二多的为仲愚,贡献了7出剧本,第三名的为苹果大圆子,贡献了3出剧本。

其他小站方面,具体的统计数据如下:

  • 梨园百年琐记:人物条目新增128条,修正156条;事件条目新增879条,修正40条。主要条目贡献人包括:周肇西、平常心、北溟客、京剧乐队、如舸斋、京门浪荡客、小豆子等。
  • 京剧剧目考略:剧目新增24个,主要剧目贡献人包括:碾芹斋等。
  • 红毹艺话:录音新增15出。主要录音贡献人包括:西城老軍等。
  • 梨园:录音新增134出,修正14出,恢复老梨园录音20出。主要录音贡献人包括:西城老軍、董林、临祺蝂芹、小豆子等。

眼看新年就要到来了,祝大家在新的一年里健康快乐!同时,希望诸位(还有戏考的这些小站们),在生活和工作上,都像开头那棵圣诞树上的攀登人那样,再攀高峰 表情

传说中的2012年就要到来,是个什么样子呢 表情

小豆花说:小豆子终于又放我出来说话了,长话短说,祝大家新年快乐,2012都登上各自期盼的载满或金银珠宝或喜乐安康或以上全选的诺亚大方舟 表情

最近的情况

最近有很多朋友反映从国内连不上或者很困难连得上戏考的网站,而问题似乎局限于某些地方的某些运营商,全国范围内似乎不是都有这个问题,因此觉得不应该是像2008年那次被超级防火长城堵住了的缘故,倒像是亚太间的哪条光缆又出问题了似的。各位看客最近上戏考及相关网站都有困难么?

不过最近生活上确实挺忙的,主要正经上班的办公室活儿很多,加上一些同事跑外地本地人手不够,所以晚上经常会要在家里加加班儿。因此最近弄戏的时间比较少了,不过因为办公室人少,平时插着耳机不被打搅听戏的机会倒是多了些,有失有得吧。

先汇报这么多,顺便调查一下最近网络情况。眼看农历小雪了,各地方也都开始变冷了,大家要注意保暖的 表情

梨园的新文件名

先回顾一下十多年前的历史吧。

早先,梨园网站的文件名都是拉丁字母,剧名和演员的名字全部用拼音的缩写。比如 jdf-mll.rm 就是指马连良的《借东风》。从这个名字我们可以看出两点,第一,辨识度不高,下载下来的录音一定要立刻在本地改名,否则日久天长恐怕都不记得这是什么戏了。第二,那会儿的音频格式还是 Real Media,质量不高,也是当时空间所限,尽量压出来的结果。

说到空间所限,那时候梨园网站所在的空间托管服务是亿唐公司的,这家没有挺过那场互联网冰河纪的网络公司,一开始给出的空间是很诱人的,大约有几百 MB。当然,在现在以 TB 计的时代,几百 MB 已经不算什么了,但是那会儿还是相当可观的。唯一的问题是在单独的文件上有限制,每个文件不能超过10MB。于是,对于需要提供整本大戏的梨园来说,不得不使用文件分割技术,即把一出戏的录音分割成若干小份儿,把所有文件都下载之后,运行一个批处理文件(其实就是 copy 命令)把这些小的再组合成一个大的。

接着说回文件名。在使用了一阵子辨识度不高的文件名之后,梨园开始使用剧目的全部拼音。比如 jiedongfeng-mll.rm 就是马连良的《借东风》了。不过演员的名字一直没有使用全称。这种命名方式在梨园几次搬家中都继承下来了。对于名字缩写是一样而又有同样剧目录音的,则会有些区别。印象最深的是 luochengjiaoguan-ysl.mp3 这样的名字,你说这个 ysl 是叶盛兰呢,还是叶少兰呢,这爷儿俩可都有这个录音。于是我们会看到 luochengjiaoguan-xiaoye.mp3 这样的名字,代表“小叶”,那就是叶少兰无疑了。

不过这样有时还会出现重名的现象,于是文件名最后可能会出现 sk(实况)、sh(上海)、hk(香港)等等缩写以示区别,或者会有如 1963 这样的年代跟在后面。

而那时候作为梨园的访客,小豆子在下载了录音之后会把本地的文件改名,用中文,并转换成 Windows Media Audio 格式。而用的中文名的格式,是剧名加上括号中的演员名。对于同一演员不同版本的录音,也会加上地点、性质或者年代这样的后缀。比如程砚秋的三版《三击掌》,分别为:

三击掌 (唱片) (程砚秋 于世文).wma
三击掌 (实况) (程砚秋 于世文).wma
三击掌 (音配像) (程砚秋 于世文).wma

马连良、谭富英、裘盛戎两版的《三顾茅庐》,分别为:

三顾茅庐 (马连良 谭富英 裘盛戎) 1955.wma
三顾茅庐 (马连良 谭富英 裘盛戎) 1957.wma

这种命名格式首次公开是在老梨园空间越来越紧张的时候,小豆子在自家的电脑上架了一个 FTP 服务器,大家可能连过来下一些梨园老的录音,这样梨园主站上可以删除一些,以达到减负的目的。那会儿这个站叫“梨园的 FTP”,大约坚持了一年多,直到梨园搬到京艺网提供的空间。

搬家后梨园继续使用剧名拼音加演员缩写的文件命名格式,唯一的不同是,这次搬家使得梨园彻底抛弃了旧有的 rm 格式,全面使用 wma 和 mp3 格式了。

2007年梨园从京艺搬出,到了现在这个空间,小豆子决定在网站上直接使用中文名了。一来需要再次恢复老录音,而本地电脑里的东西已经是中文名的文件了,如果传到网上之后再一一改名就实在太麻烦费事儿了;二来随着录音不断地增加,旧式的拼音命名会出现越来越多的“重码”,使用中文名在技术上也已经没有任何问题,那何不用更好的呢?于是,上面列出的那种剧名加演员加少量演出信息的文件名正式出现在梨园网站上。

历史回顾完了。说一下这次梨园准备做的改名行动吧。

现有的文件名最大的弊端是格式的不统一。演出的年代或者城市只是在出现重名时才会用到,所以这次决定把在文件名中除了剧目和演员之外,统一加上录音的年代、录音的地点(可考到具体剧院的则包括剧院名)、录音的性质(实况、静场、唱片)等。而且和之前戏考网站上剧本标题中的使用的括号[]一样,英文瘦版的括号()不是特别明显,故而改用【】括号。下面是几个例子:

三堂会审【1954-03-04广州中山纪念堂实况全剧】梅葆玖、姜妙香.wma
三堂会审【1961中国唱片全剧】张君秋、姜妙香.wma
三堂会审【台北实况选场】顾正秋、刘玉麟.wma

这样对于同一演员不同版本的录音,会出现如下的情况:

牛皋下书【1957天津实况选场】侯喜瑞.wma
牛皋下书【1961-12-22上海中国大戏院实况全剧】侯喜瑞.wma

同时,在文件本身的属性中,演员的名字以标准的分号而不是空格分隔,同时文件属性的标签中会增加诸如录音性质、演出地点等信息,也以分号分隔。

另外,因为很多录音已经考证到了具体的演出剧院(或者是唱片公司),网页上面,录音的标题也会增加这一信息。

这次改名的过程大约需要一个月的时间(录音很多啊),大家这些日子将会发现网站上的页面逐渐变化。而这期间新上传的录音,也会开始遵循新的文件命名规则。

最后概括一下新的文件命名规则:

剧名【年代地点性质场次版本】演员甲、演员乙、演员丙.wma

其中,“年代”为四位数年份,如可考到具体日期,则为“年年年年-月月-日日”版的 ISO 格式;“地点”为城市名,如可考到具体地点的,则为剧场、唱片公司或广播电台名;“性质”为“实况”、“静场”、“唱片”、“电影”、“电视片”、“教学录像”之一;“场次”为“全剧”或“选场”;“版本”只在当演员阵容、年代、地点完全一样而版本不同时出现,以“一”、“二”、“三”等区分。

基建升级

大约在2000年的时候,买过一盘赵松樵的《徐策跑城》VCD,后来发现这正版盘的质量着实有问题,多台电脑都打不开它,最后费半天劲找了几个号称能够强行读盘的软件,轮番上阵,总算给读出来了。

后来随着刻录机的普及,电脑上很多资料也开始刻到盘上了。不过慢慢出现两个问题,一个是光盘本身的易损性,造成有些数据再也读不出来了(好在硬盘里还有底儿),另一个问题就是购买和刻录的盘越来越多,家里遍地是光盘了。

所幸的是,现在已经不是遍地是磁带或者录像带的时代了(尽管手头还有很多这种老制式的玩意儿需要数字化),光盘较之还是很省地方的,但积少成多,一堆光盘摞起来也是相当可观,更何况光盘不可能就那么摞起来——要摆好了,这样以后找什么都容易。

数字化的玩意儿,仍然需要载体,于是仍然有物理上的规整问题。看着日益增多的光盘,唯一的解决办法,只有回到纯数字上来,把资料转成纯文件,保留于硬盘里。毕竟,存在硬盘里的1GB 的数据与1TB 的数据所占物理空间是一样的,而换成光盘就差出好几百张了。

硬盘也有问题,就是因为其机械的特性,可能会出现坏损。曾经有至少两块移动硬盘,在从北京带回家的飞机上牺牲了。SSD 固态硬盘自然没有了机械的部件,但现在还是太贵,而且还有寿命问题。

那么就用磁盘数组吧(RAID,独立磁盘冗余数组)。没错,现在豆家的服务器已经在春节后投入使用了新的存储设备,一款由5个1.5TB 硬盘组成的硬盘数组,使用 RAID5 等级,共有5.45TB 的可用空间,在其中任何一块硬盘出现故障后数据不会丢失,这样有时间能够更换新硬盘——当然,要是倒霉到同时两块硬盘都出问题了,那就没辙了。不过,有备份,我们在这里要同时强调备份的重要性!读者朋友们,注意,备份很重要呢。

所以准备把手头上的光盘都存到新的硬盘数组里,光盘本身装箱收起来——腾出来的空间迎接新光盘的到来。

在物理上腾出空间的同时,数字存储空间也是大大扩充了,那么,除去家庭的照片、影视剧的备份外,这些空间,就是留给京剧数字化的了——文字的、音频的、视频的,等等。

新的存储空间
新的存储空间

梨园百年琐记2010年度大事评选结果

又一年的大事评选结果出来了,这次的投票率依然很低,两个字,寥寥。其实从访问的统计数据显示,琐记每天的访客挺多的,甚至比戏考还要多几百,这与网站本身比戏考的剧本数据量更大和更新更动态有关。那么就应该利用这个优势,怎么能够在更明显位置让大家看到这么个投票活动,进而说怎么能够调动起大家的积极性来。先放这儿,这事儿年底再说。

顺便缅怀一下去年过世的老艺术家吧,凋零,也是两个字。

以下事件均为两票,不分先后。

人生不满百,常怀千岁忧

又一年即将过去,戏考除了剧本之外,第二大的业务——梨园百年琐记,也一晃做了八年了。

当然,前三年基本上就是一个 HTML 的表格,此后的五年,数据库的应用加上广大网友积极参与条目的编辑,使得现在的规模已与以前的那个不可同日而语。

因为历史的原因和文化本身的特色,琐记里面的日期从来都是以公历和农历两种历法记录的。以前,这些农历日期都是随着每一个事件条目或者生卒项目一起加入的,随录随加,这就意味着如果有三个事件发生在历史上的同一天,那么公历和农历的对应日期在数据库里会出现三遍。这样所产生的问题是,有时候由于输入或查询的错误,同一个公历日期可能会误出现不同的农历日期。这个问题后来得到了解决,即同一公历日期肯定只对应一个农历日期,但是这个对应的农历日期可能本身就有错,比如把“正月十一”误打成“正月十二”。

而且上面的做法也挺费时的,每次整理事件条目的时候,都要现查一下对应的农历日期。顺便说一下,Google 有一个很好的查询,很方便,比如只要在搜索框里输入“nl 2010-12-31”进行搜索,它就会告诉你农历的对应日期是什么。不过只适用于1900年以后的日期,之前的需要再用单独的万年历程序。

前一阵想起来应该在数据库里做一个大表,把每一个公历的日期都找到相应的农历日期,这样在显示页面的时候直接一查询就好了。包括首页上显示的今日日期,其中的农历日期之前是通过一个函数现算出来的,而这个函数理论上在二零三几年之后就不可用了。人无远虑,必有近忧,这也是要解决的,而最好的解决方法就是上面所说的大表,一劳永逸,而且快。怎么获得农历和公历的对应日期呢?微软的 .NET 有相应的类和函数,用它终于生成了对应表,并且导入到了数据库——花了很长时间导入呢。现在看看,一张大大的表,十八万五千多行的数据,覆盖了自1600年1月1日至2100年12月31日的数据。五百年!

当然,1600年估计早了点儿,万历二十八年,还没戏曲曲艺什么事儿呢。宜早不宜迟,这样肯定够了。而2100年呢?希望那会儿还有值得记的戏曲曲艺事件。2100年之后呢?显然,梨园百年琐记到那会儿就不是我辈能顾及的事儿了。值得操这份儿心么?不知道。也许,最终这个工程会完全开放,由大家自由操作,那么也就不用担心上面那张大表没人去扩展了。操心也没用,现在的数据已经够这辈子弄的了;身后的事,暂不去计较。想得太多太远,就真是“人生不满百,常怀千岁忧”了。若真往远了想,地球有一天都不保,再大的表也没用,我们任何一个项目也是没有用的了——扯远了。

手头上的数据、工程、收藏,在身后会是怎么样的结果?您是否想过?不论如何,休管他今后怎样,我们只要积极向上,把眼前的事情踏踏实实地做好,再稍微考虑一下今后若干年、或者几十年,也就好了。

谨以此与所有努力做着有意义而又征途漫漫、不同道路而有着同样精神的同志们共勉,另:又一岁的新年快乐!