2004年07月06日 星期二

是否需要统一编码

中文博客标准组织的首页看到说:中文有两种编码,统一文字的编码将是进一步交流的基础。 感觉应该说中文有多种编码才对,除了UTF-8,至少还应该有big5和gb2312这两种中文主流编码。或者你说简体中文我也没有意见。提这个,当然不是咬文嚼字或者出于什么政治理念问题才这么小题大做。只是觉得对岸在Web中文领域的贡献,也非常巨大。特别在blog,wiki这些方面,有很多杰出的推动者。jedi,mark,zonble这些像isaac一样务实的人。至少我是在这样一个环境中启蒙的。所以感谢他们。

其实RSS的trackback编码问题,FoF修改过的Magpie-RSS 已经可以做到gb2312/big5转为utf-8编码了。应该是个不错的思路。我也很赞成UTF-8化的推动。但是这周遭的风风火火的标准化运动革命,让我有少许的迷茫。我们在努力追随世界游戏规则。不过少有的制定规则的尝试也以失败告终。


失败是必然的,结局的可怜的。不过,PRC也没有丢面子,大家皆大欢喜。

utf-8推动的目的是因为国际化交流的现实需要引发的问题。对于中文世界来说,我觉得是特别有意义。但是,也不是所有的人都需要加入进来,都需要UTF-8。有时候,这样的转变,还需要付出一些代价。编码的改写,重新的调试。都需要耗费巨大的人力成本。幸运的是,没有包袱的新系统就没有这么多顾虑了。所以,在你转到utf-8的时候,还要三思。

每次看到wiki的link或者google的url是一串%E6%A0%87%E5%87%86%E5%8C%96这样的天书的时候,怎么也不能和可读性产生任何联想。这感觉也变成了享用utf-8的一个附带代价。这一切让我为utf-8喝彩的同时,也告诉我:你应该冷静。别给这小子给害了。 :)

PS:cnblog看到的一个网站www.mypoco.cn

这是另一个在实现中的personal portal. 它被叫做“个人服务超级组合”10M免费空间。
我是有点不以为然的,好像跟我想象的pp有很大出入。别问我,我认为的pp应该长啥样。反正是,瓜有瓜样,豆豆有豆豆样,PP也有PP样。^oo^
ps2:现在mt生成文章的速度变得奇慢无比,有解否?

[technorati relative tag]

[相关内容]

由 tristones 发表于 2004年07月06日 下午10時38分

留言

首先澄清一个问题。推荐采用UTF-8编码,不带有任何政治因素,也没有两岸的一方压倒另一方的意思。我们的这个建议,更大程度上是从技术角度出发的。

事实上,UTF-8更为普遍的区域,恰恰就是对岸的同胞所在的网路。在大陆地区,用UTF-8编写的程序和制作的网页都还比较少。如果您知道大五码big5的一个十分重大的缺憾(所谓冲码问题),那么就不难理解为什么在港台很多作者倾向使用UTF-8也就是他们称呼的万国码了。最简单的概括,就是大五码本身设计上的缺陷使得PHP甚至UNIX系统在处理汉字时将一部分汉字的一部分误认为控制符。因此,采用UTF-8,是最好的解决冲码问题的方法。在黑杰克网友尝试繁体化本程序的过程中,我和他就共同探讨出了用UTF-8代替big5的必要性了。

其次,建议统一UTF-8编码,和改动RSS的程序使之可以接受gb/big5的做法,都一样是在从技术角度上解决沟通的问题。而我们之所以不建议通过程序本身在接受trackback时完成编码的转换,自然也是从技术难度上出发的。PHP和ASP是两个最流行的网络脚本语言了,asp我不熟,但是记得loveyuki曾经说过,asp要转码也不是易事,还牵涉到IIS。至于PHP,大家都看到了,一定要好心的服务器管理员们安装iconv的组件才能完成编码转换。从技术角度上说,当然是大家都用同一个编码更容易实现了。

撇开技术的问题,我还想从China Bloker的成立目的讲讲。China Bloker不是企图成为中国博客程序的规范制定者,我们只是一个自愿加入,互相交流最新想法的组织。或者说,China Bloker是一个平台,程序作者可以在上面提出他的一个创意或者一个改进的思路,然后由他自己或者别的有能力者去完善和实现这个思路,使之成为现实。就好像现在在建的几个项目,都在等待一个从蓝图到事实的过程。所以,不是光说不练的,也不是高高在上的,更不是权威的觊觎者。如果China Bloker成功,那么这个成功的表现形式一定是,上面的某个项目被我们中的一个blog程序实现了出来,而且其他blog看到了这个创意(或者说新功能)的好处,而愿意在自己的blog里也加入这个功能,觉得不好的创意则忽略。这才是自由的网络应该提倡的:共享、互利和共同推广。

是的,正如mikliker所说,也许会失败,也许很多人,也许甚至包括我们自己在若干年后,会觉得我们是多么的幼稚。但至少现在,这是我们的梦想,也是我们试图推进China blogs 的一项努力。

Posted by: Bob 发表于 2004年07月13日 下午10時49分

没想到有人的回应比我的原文还长,真是受宠若惊。其实我只是看到了blocker引言提到的语义上的错误而写的。另外我也说了,我也提倡大家使用UTF-8,只是说在很多领域我们未必真需要他,因为很多的应用情境是不需要国际化的,特别是在需要更新原有系统来使用这种国际化需求,但是得到的效果和付出的劳动不成比例的时候。
blog或者其他的ss应用,只是网络或者电脑应用的一个方面,不是全部。所以我的想法当然也不是只针对blog来说。
标准化的推动固然是好,但是,从另外一个角度来说,标准化也不是花好稻好什么都好。技术也只需求的必然。有需要的自然会用的。blocker这个平台搭了,大家知道了,作用也就开始发挥了。
Bob,请继续,我不会来拆台的,放心。:)

Posted by: tristones 发表于 2004年07月14日 下午12時13分

觉得应该是utf-8统一天下的(blog).就blog本身来说,他不是独立的,他们之间是互相联系,互相订阅的。如不解决编码问题,就无法相互联系,虽然在程序上是可以处理,但有太多的麻烦.

utf-8 无法实行,也是因为系统本身的问题,很多软件都无法直接编辑 utf-8 文件,这个也是在相当大的程度上阻碍了 utf-8 的发展.

Posted by: lendy 发表于 2004年11月03日 下午11時07分