\ 敏感词 - Lakoo | 拉闊

敏感词

发布日期 August 10th, 2015 by 高重建

一个偶然的机会下,接受《破折号》访问,谈开发中的游戏。在冰室的阁楼,还是大一学生的年青记者问,「你有什么梦想?」,我差点没吓得喷水。作为一个废坑的我好想说,「你还是说广东话吧。」

*    *    *

「新闻说我候选了时代周刊的两百个影响全球的人物,中国同时入选的还有敏感词,敏感词和敏感词等人。」五年前,韩寒在博客如是写,文章后来跟其他博文结集成《敏感词》

敏感词不能发,是麻瓜不能说佛地魔般的常识。常识分两种,一种是如太阳在东边升起之类的物理定律,另一种是些政策和社会现象,人民习以为常,遂成常识,哪怕它反物理定律。比如几年后,「胸袭」将成常识。

曾经被叶刘引用辩说杜「普」作诗不会用广东话的「摆do」,相当直白而脸不发红,这样解释「敏感词」:

「大部份论坛、网站等,为了方便管理,都进行了关于敏感词的设定。

在多数网站,敏感词一般是指带有敏感政治倾向(或反执政党倾向)、暴力倾向、不健康色彩的词或不文明语,也有一些网站根据自身实际情况,设定一些只适用于本网站的特殊敏感词。

比如,当你发帖的时候带有某些事先设定的词时,这个帖是不能发出的。或者这个词被自动替换为星号(*)或叉号(X)等,或者说是被和谐掉了。」

随着时代进步,大陆的敏感词库远超古代避讳,单是非官方网站 67960.com 就收录了5540个敏感词。与此同时,香港的《常用字字形表》,收录的字数为4721个。敏感词库除了历久常新的词胆,也有因时制宜随时增删的。试过在六月某天,「今天」成了微博上的敏感词。有时,定义敏感词的不是”zf”而是公司,因此,想搜索「众里寻他」的客户的负面新闻,无疑很天真。Google的核心竞争力是处理关键词,因此成为最大的搜索引擎;「众里寻他」的核心竞争力是处理敏感词,成为最大的公关公司,无良企业的危机处理专家,为官方对大事定调的发言人。

敏感词包括某些人名、某些日期、某些运动、某些日用品,有时甚至包括某些单字如草、日、操等,因此网民在网络游戏和论坛看到「*莓」、「*本」、「*场」等都见怪不怪,也因此约定俗成了一批网络语言去避开过滤,比如zf、qj,习惯拼音输入法的网民没有不懂的。可以想象,假如有人在论坛问世上都有哪些敏感词,回复的结果要么是** *** ** **,否则就是zf ls ysyd…

具正义感的港人,看到这里或许正在咬牙切齿,痛恨配合zf河蟹的共犯。这些包括我在内的公司决策者,承担不了关门坐牢的后果,更不希望透过自己发出敏感词的人承担后果,选择河蟹掉,是真小人。大人物可任重道远了。2004年,雅虎香港分公司向中国国安机关提供了名诗人、作家、记者师涛的电邮信息,其后师涛被判刑10年,前年出狱后下落不明。总觉港美文明地抗争而大陆人懦弱地妥协的香港人,别忘了有此一役。

说起香港,这里相对自由开放,没有人会反对。只是,zf都封杀不掉的敏感概念,生活做到了,比如「梦想」,你上次在日常生活说出或听到是何时?恐怕是小学作文。而我自己,自离开学生组织,毕业后进入商业社会,好像拨了开关,知道有些词说不得,否则会被投以奇怪目光,被当作象牙塔内的离地份子、疯子、火星人,唯有当我回到校园,回到泳池边,才会重新听到和说出那些敏感词。

可幸的是,打从十来年前,香港有股新力量,把敏感词库逐渐解封。皇后码头和喜帖街解封了「集体回忆」,新界东北解封了「城乡共生」,其他大小事件解封了「历史意识」、「公民」和「公义」等本应基本不过,却被经济主导排为异端的概念。

我们成年人,与其说要为下一代带来甚么,倒不如先想想为下一代带走甚么,解封敏感词库,让每个人随心所欲说「梦想」而不觉突兀,不会被看成学院派、不成熟、不切实际。每一个敏感词的解放,都会为社会释放极大能量,爱恩斯坦说e=mc^2,说的其实是,能量 = 敏感(mingan)词(ci)的平方。

#原文刊于《明报﹣星期日生活》 2015.08.02 “Ryu vs Ken” 专栏

Tags: