2007年工作总结

又到了年终总结的时候了。

今年戏考的剧本整理仍然是个相对来说的低产年,76出剧本。至于原因,可以从以下几个方面找辙:琐记整理工作需要花时间,年底的时候给梨园搬家,另外就是剧本本身也越来越需要时间来整理好,因为接触到越来越多从未听过看过的剧目,在校对及考证上就需要更多的时间了。今年整理的剧本分布情况如下:

2007年工作图表
2007年工作图表

今年录入的头五名如下,其中头一名及第五名为并列(小豆子也在第五名中):

合意、痴菊叟:16
Thirteen:6
碾芹斋:5
LILA、chrislew:4

当然,不仅要感谢头五名,同样感谢所有参与戏考剧本整理工作的朋友们!

琐记方面,人物条目共增加新条目611条,修正已有条目873条;事件条目共增加新条目1452条,修正已有条目1839条。这是相当多的了。同样感谢参加整理的朋友,像大戏魔、青山、可风、东风劲等等,以及众多匿名参与的朋友。琐记现在受关注的程度不低于戏考,而且能够吸引一些艺人的家属后代出来提供第一手资料,小豆子认为这是最难得的地方。谢谢大家了!

剧目考略那边基本上大半年没怎么动,直到梨园搬家需要用到一些剧情而没有,才整理了一些。这在以前也提过,这里不重复了。

今年资料整理方面的工作大大多于网站的建设及创新,如果不是年底有这么一茬儿梨园搬家的事儿,那还真没什么值得一提的新建设。去年这会儿脑子里的一个点子,到现在一年了,还没落笔。不过,梨园这次搬家速度之快小豆子自己也都有些吃惊,这么短的时间就把网站的大架子做好了。还有些小页面需要去做,就留给明年吧(今年也没时间了不是)。还有就是现在听戏谈戏的论坛莫名其妙地没了(豆腐反映大约是被封了),明年的首要任务之一还包括做一个坛子出来。

戏考的数据库及页面程序在今年三月的时候重新写了,挺好,现在更新剧本要比以前省时了,而且更易读了。也算在年初不太繁忙的时候,做的一件很重要的事情吧。

最后让我们一起回首这一年来戏曲曲艺界的事件,并送别这一年里离开了我们的艺术家们。

戏考网站的小优化(下)

(这个应该是几天前就写出来的东西,因为光顾着忙工作上的事儿了,所以就耽误了。)

戏考这次改版,剧本页面除了很多共有的改进外,还包括以下这些只有少出剧本才会有的改进,比如这个《战太平》剧本

剧本截图
剧本截图

有些剧本,是带有脚注的,这在以前是用①、②、③一类的数字符号来标注,你需要把页面移到最下面才能看到这些注释是什么。现在不一样了,充分利用超级链接的优势,把所有脚注都用链接连起来,点剧本正文的数字链接,就会被带到页面最下方相应的脚注处。同样,在脚注处点一下,又回到了页面正文。

PDF 格式的一大优势就是可以把字体嵌入到文件中。有些剧本里的字,在正常的中文字体里尚未被定义,而在最新的 Unicode 有定义了,像方正的“宋体超大字符集”就可以显示出来。所以对于有这样特殊字的剧本,戏考 PDF 的剧本可以正常显示,而纯文本的页面上,不是显示为一个空框,就是一个问号,或者什么都没有。这虽然显出来 PDF 的优势,但以前并没有一个针对纯文本的解决方案。现在则不同了,如果你浏览有特殊字的剧本,就会看到如下图中的那个方块,表示此字无法显示。更妙的是,当你把鼠标挪到上面的时候,会看到对这个异体字的形容。

剧本截图
剧本截图

另外,像有些剧本,一个本子里包含两个或以上的本子,有时会在正文中标出“头本”、“二本”或者剧名,在 PDF 格式里,这些都是被加粗加黑的。而以前纯文本并没有任何特殊处理。现在,这些也在纯文本中加粗加黑了,而究竟哪行加粗加黑,完全由现在的程序自己判断,并没有人为干预,换句话说,现在的程序可以明白一行文字是否是“头本”或者一个剧名、还是一个剧本的正文了。

所以,剧本的格式要做到统一,有一定规律可循,这样程序才能够对每一行如何格式化做出准确的判断。要让程序读懂京剧剧本其实并不难,重要的是,编程序的人,要了解京剧,并了解编程。小豆子自认为,还是可以胜任这一差事的。

戏考网站的小优化(上)

这次戏考网站的改版,最明显的改动就是纯文本剧本的显示样式,与 PDF 格式基本无异,甚至有些地方比 PDF 格式做得还要好。

最基本的对齐、缩进这次都实现了,纯文本格式的剧本看起来不再是杂乱无章,而是与 PDF 版一样整齐。这是多年来一直想做到的,现在终于实现了,而且是在不改变已有文本底稿、没有增加繁多式样的基础上实现的。小豆子个人是相当满意 表情

另一个明显的变动就是剧本的字号变大了,算是符合更多拥有高分辨率及广大上了年纪网友的利益吧。但并不是网站所有的字号都提了,除了剧本页面及首页外,大部分仍然是原来的字号。

剧本页面最下方增加了阅读次数的统计,这个统计很早就开始了,只不过一直没有显示,借着这次改版,浮出水面。

页面加载的速度理论上是应该比以前快了,尽管很难测出来。因为现在显示的剧本文本,是直接从数据库缓存调出来的,所有该套用的样式、该缩进的空格数都已经在里面了,直接读出来,然后显示出来就好了。所有格式化的活儿,都在更新缓存时完成,所以作为读者,您并没有在处理如何显示剧本的事情上耽误一秒钟(以前虽然格式没有现在这么复杂,但显示剧本时还是先作一些计算,然后根据内容动态格式化并显示的)。

还有一个显眼的改动就是剧本页面最上方也如首页一样,有一个搜索框,可以直接从任何一个剧本去搜索别的剧本。而搜索页面也是重新写过的,当您点击搜索结果中“标出搜索关键字”的链接是,相关剧本页面上的搜索框也会被填充上您这次搜索的关键字,便于做进一步搜索。

剧本页面上“相关剧本”的链接也是直接从缓存里调出来的,不像以前那样每显示一个剧本,都要现从数据库里查找相关的剧本,然后无序地排列出来——其实这也不完全是“无序”的,而是根据剧本的编号排列,当然,很多情况下,这样的排序结果就是无序的。现在的排序,完全符合京剧剧目的顺序,比如当您看《二进宫》的剧本时,会在“相关剧本”中看到《大保国》、《探皇陵》两出剧本的链接,而且,《大》一准儿会在《探》的前面,无论它们的编号是什么。

以上都是这次改版中对所有剧本都显而易见的优化改动,下次聊聊对有“特殊”格式的剧本的优化改进。

戏考六周岁!

今天戏考六周岁!大家同喜啊! 表情

今天同时把网站做了改版,这是六年来改动相对来说最大的一次,很多细节上都作了更优化、更友好的处理。大家有空不妨翻阅翻阅剧本页面,看看这些改进的地方是否令人满意?

不光剧本页面,首页也作了不小的改动,尽管基本格局没有变,但是精简了很多东西。主要是突出重点:比如戏考的基本信息、最新的剧本、录入过剧本的同仁名单……并且把原来散在卷首语的链接,大部分都归纳到一起,一目了然。

在后面的几篇帖子里,将着重介绍一下这次优化后的一些重要细节,敬请关注。

洪峰预报

预报一下,最近一周内,会有至少二十出剧本被修正。反映到戏考的更新记录上,就是一批又一批的修正剧本。最近在为戏考改版做准备的同时,顺便查一些错儿,不仅是错别字上的,也有格式上的。比如有些剧本的省略号误作六个“.”,有些逗号或句号是半角的“,”和“.”。这些,虽是瑕疵,但所谓精益求精,既然有条件把它们一下都揪出来,就顺势修正了吧。

一场“修正主义”的洪峰,即将来临。请注意更新您本地的剧本文件。

新年新气象

眼看要过农历新年了,而且戏考也将迎来六周岁的生日。所以最近开始花一些时间在优化戏考的页面程序上。

戏考的剧本资料在前年的春天正式转到数据库的。那个时候只是简单地把原来 HTML 的页面用 PHP 写一遍,动态从数据库调资料生成而已,并没有任何优化的地方,就是原来静态版的一个翻版。戏考近六年来,页面风格和布局没有什么变化,小豆子也不求什么大的变化,而是小处的优化。

似乎直接看纯文本剧本的人远比 PDF 版的人多——尽管小豆子一直倾向于 PDF 版。PDF 版有它的好处,这里不重述了。但显然,我们无法否认纯文本所拥有的庞大读者群(毕竟直观哪)。所以,优化纯文本的显示结果就很重要的,毕竟现在看纯文本的剧本,有点儿乱。

所以这几天小豆子一直在后台做这方面的事情,而且还得保证在正式推出来前,和现在的界面兼容。如果您在过去24小时内用过戏考的搜索功能的话,也许会发现一些在后台工作的蛛丝马迹(现在已经藏起来了)。不管怎样,平稳过渡,是这次幕后工作的目标。

而且现在已经做得比较满意了。大家可以看一下这个截图,这个就是以后剧本页面的样本。

戏考的新界面
戏考的新界面

剧本的格式是不是与 PDF 版一样了呢?很漂亮了吧——至少小豆子这么认为。而这些格式都是通过 CSS 生成的,所以页面文件的大小并没有因为漂亮的格式而增加多少,因此加载页面的时候还会是很快的。另外,还有其他一些变化,等正式登场后再聊了 表情

当然,欢迎您尝试或一如既往地支持 PDF 格式的剧本。

戏考优化的正式版会在春节后适时推出。

和两件旧事物说再见

今天,和两件旧事物说再见。

一个是用了有小十年的 FastCounter 计数器。这个伴随了戏考以及后来琐记和这个 Blog 的计数器,在今年就要结束它的使命了。微软在上周发来一封电邮:

Effective February 15th, 2007, Microsoft will no longer offer FastCounter by bCentral. The service’s free reporting features and Web page counters will be decommissioned. In its place, we invite you to sign up for Microsoft Office Live Basics, where you can receive Web site hosting, e-mail, plus site building and reporting tools for FREE.

记得刚开始用这个计数器的时候,连 HTML 是怎么回事儿都还没弄太明白,战兢兢把那段代码复制下来并贴到网页上,发现竟然可以计数了。很神奇嘛 表情 小豆子用上这个计数器的第一个网站其实并不是戏考,而是一个提供自己编译程序的个人网站。

当然现在就不一样了,网页上的小程序写起来很简单,于是今天抽空写了个计数器的程序,应用到了戏考、琐记和这个 Blog 上。和微软的 FastConter 说一声再见吧,毕竟伴随戏考这么多年了。

另一个要说再见的就是梨园百年琐记的“条目质量提升”栏目。以前也谈过这个栏目运作的不太理想,所以今天彻底从站上拿下了。但不管怎样,还是要感谢参与的朋友们,谢谢了!

过些日子,取而代之的会是一个类似于“导读”或“推介”的栏目,出现在首页的左下方。琐记现在记录的人物也不少了,事件也很多,很多条目其实是很精彩翔实的,而有可能因为数据量太大而被忽略,所以隔段时间在首页推荐一条内容上比较工整翔实的条目,供读者阅读,应该是一个比要求读者去参与编辑更好的方式吧。毕竟读者永远比编者要多,要容易当。这个栏目相信在月底前可以完成并上线,希望到时候大家多提意见。

2006年工作总结

总结今年工作的时候到了,一起来回顾一下戏考这一年的业务情况。

本年新增剧本80出,算是产量低的一年了。一方面,今年整理琐记那边的资料占去一部分时间,另一方面,今年曾经有三周的休假,加上后来加班加点补琐记落下的活儿,剧本的产量就低了。不过现在有不少整理好待登的剧本,所以相信明年会更好一些。

2006年工作图表
2006年工作图表

特别感谢一下今年录入的头五名,同样,这个不能够完全反应今年录入的情况,比如像合意太爷,碾芹斋妹妹,今年打了不老少本子,只不过还在这里校对中,没轮上呢。

痴菊叟:27
朱旻:8
chrislew:6
白头翁:4
泠娜:4

今年《关羽戏集》全部录完,值得一记。而前几天 Ken 刚刚把该书的前言及后面论关戏的文章敲好,明年会补充到文献里。

其他工作方面,琐记被更多的人所关注,尤其是像演员的家属这样的群体,能够主动上门提供第一手资料,大幸。截至目前,琐记整理好的资料包括1913名人物生平,4078条事件记录。感谢大家的支持与关注。

除去这些数字上反映的成功,琐记也有其失败的方面,比如“条目质量提升”栏目,基本上就没有做起来,开始几期还好,一些大家,像程砚秋、马连良这样,资料容易找到进而系统整理,但也基本上是小豆子一个人根据投票的情况去整理,很少出现多于两个人同时整理的现象。而下半年,这个栏目基本上荒废在那里了,投票的人还是有的,毕竟大家还是希望把条目的质量提升再提升,详细再详细,但真到去系统整理的时候,没有人去动它,而新一轮的投票则又开始了。所以,小豆子的意思,这个栏目明年也许就暂时停掉,取而代之的也许会是一个类似的投票系统,只不过我们不再去专门系统整理位列榜首人物的生平,而是将他作为推荐的条目,登在首页上。只是一个设想,明年具体落实中再看。

今年是全民 Blog 的一年,这事儿放以后细说。就工作方面而言,这个 Blog,小豆子感觉其发挥的不再是一个沟通的作用,比如今年新开的“拾慧”栏目,把自己感觉好的博文链出来与大家分享,原作者得到了更多的访问量,读者开阔了视野,作者与作者间增加了互动,小豆子对这个做法是相当满意的,不知道各位看官怎么看?希望您能在这儿留个言:是否点过去阅读“拾慧”里推荐的那些文章?每次大约阅读几个?是否发现“拾慧”有用?谢谢您的支持,也欢迎您的建议。

今年除去“拾慧”的另一个大一点儿的创新就是“京剧剧目考略”网站,希望对大家查京剧剧目资料有所帮助。这个网站更新不是那么频繁,基本上就像普通的工具书那样,静静地躺在那里,当你需要的时候,随用随到。

今年遭遇了黑客,倒没什么损失,却着实吃惊不小,而且教训是长了——增加备份的频率,做到双份的有备无患。

一年就这么过去了,等待明年的到来吧。

一些程序上的更新

一些琐碎的更新,有全新的,也有旧物翻新。

5月份时的预告,包括频道聚合和报告系统,前者已经实现,后者所说的新的报告系统昨天已经在戏考投入使用,从用户的角度看,除了界面与以前稍有不同外,没有太多变化,只不过后台的管理更方便了,像戏考、琐记甚至以后其他的什么,都有了一个统一的反馈箱,便于集中处理,当然,从编程的角度说,也省去了重复写一样程序的麻烦。

琐记的重名表也做好了,这是一个新的栏目,显示资料库中所有重名的人物,一目了然。稀松平常的名字或者艺名也就罢了,像钱金福这样的名字,都有两个人叫,挺有趣的。不过一望之下,给人的感觉是,梨园界重名的比例还是挺小的。

戏考也好,琐记也好,说白了就是旧资料整理,但这并不意味着只是简单的搬抄已有的资料,而在于做出新意来,做到最大化的满足用户体验以及优化资料的查询、统计和分析。琐记的资料整理就是最好的例子,一盘散沙般的资料,在经过整理、格式化、数据库化之后,可以重新组合成新的资料,如人物活动年表、年度事记,或者按姓氏、行当等等分类。一个人的创造性是有限的,所以在什么时候,都是需要群策群力,关于网站建设,您有什么好的想法,您希望如何重组、分析已有的资料,欢迎反馈回来,小豆子洗耳恭听。

600!

刚更新完戏考,剧本数达到600!

照惯例,拍照留念:

2006年8月29日更新后的戏考网站
2006年8月29日更新后的戏考网站

统计数据:

已录入完成剧目:518出
总计剧本:600出
总计字数:4040306字
参与人数:114人
累计访问人数:335549

功劳簿:

8d、CALF、chrislew、CRT、door、DYH、eclogite、glanfan、gucz、jackie、Jasmine、 jipyan、lans、louisa、Mila、rossiwu3505、sansan、silencelake、Snake Sui、Talker、toower、WL、wyoss、xu_henry_ca、zinnia、万毅多多、云遮月、亢方、仲愚、兔兔、兖苍、公羽、关东糖、冰棍儿、午夜兰花、半个馒头、合意、吉示翁、周文武、咚咚锵-中华戏曲网、品菊斋、在人间、在宥、大亮、大地、天外来客、天狼、天空海阔、嬉笑伯、小 Q、小澂、小蕙、小邢、小露686、岱黛、常希群、张、张丽华、张新宇、张晖、弦外无音、彭海晖、微、思秋、悟空、成斌、我爱中华、易水伊人、映月、昴日星君、曹达人、朱旻、李海天、杨落雪、松仁老虎、柳柳、毛刷子、泠娜、波罗游子、浙江李小勇、煮鹤焚琴、王二、王学范、王郗、痴菊叟、白头翁、知秋、石见、砚愚、碣石调幽兰、秋杨、秋逸斋主、箫声、红衣易灵、红鬼、罗马、老叟、胖胖、范畹、草莓26、菊苑散人、蓝旗、行健轩主人、西门小土包子、豆腐、赵文华、铁杆戏迷、铁马冰河、长弓贯日、阳春白雪、香陵居士、骅骝、麒痴

共勉。