AI抢救方言:“乡音未改”将成永恒
“如果不能有效保护方言,我们将永久失去完整记录人类文化遗产的机会。” 援鄂期间,“武汉话转普通话”功能使用次数达到七十多万次。
(本文首发于2022年9月1日《南方周末》)
责任编辑:刘悠翔
“mo55老;w55大;wo55wo31帮助……”
这是一本独龙语发音与汉语词汇的对照词典。如今,独龙语母语者少于一万人,且普遍年龄大、文化水平低,不会写“独龙文字”,因此该词典收集的语料多为录音,直接用国际音标表示。
词典的制作者是人工智能,通过一种特殊算法,整个过程只需要输入两种语言的独立语料,不需要现有翻译,也不需要操作人员有任何关于独龙语的知识储备,就能获得对应词典。
该词典和背后的算法由英国谢菲尔德大学计算机系在读博士彭煦潭主导完成,为濒危语言的记录和保护提供了一种新思路。
联合国教科文组织在2020年的调查数据显示,全球七千多种语言中至少有40%处于某种程度的濒危状态。据商务印书馆出版的“中国濒危语言志”丛书记录,全国130多种语言中,有68种使用人口在万人以下,有48种使用人口在五千人以下,有25种使用人口不足一千人,有的语言只剩下十几个人甚至几个人会说。
“‘少小离家老大回,乡音无改鬓毛衰’道出了乡音的无限情感魅力;一个浪迹天涯、久别乡井的游子,偶尔在异国他乡邂逅素昧平生然而乡音无改的乡亲,那种喜悦、亲切、激动之情始终是使用国家通用语言——普通话所难以表达的。”著名语言学家詹伯慧曾在《语文杂记》描绘了这样一个场景,并写道,“方言将永远在它所通行的范围内充分发挥其无可替代的作用。”
“没有任何一种方言是一成不变的,以后方言也会‘适者生存’,而我锚定的是我们这个时代的话。万一它今后断层了,还能靠现在留下的音频文字资料唤回。”在保护方言方面活跃了近十年的85后苏州姑娘予安说道。
长大重学家乡话
2014年,予安忽然发现家乡的年轻人很少讲苏州话了。这一年,从事西班牙语教学的她回到苏州工作,一讲苏州话,11岁的表弟已经完全听不懂了。予安很吃惊,因为表弟3岁之前说着一口流利的苏州话,予安还录过他唱方言儿歌的影像。
原来,表弟小学六年均在寄宿学校上学,完全失去了苏州话的语言环境。而再往下了解,予安发现像表弟这样的00后大多不会说苏州话,能听懂的年轻人寥寥无几。
予安打算为此做点什么。她报名参加苏州市语委举办的苏州话辅导师培训班,并通过了口语评定。培训班上,予安发现身边的“同学”平均年龄六十岁左右,而自己的苏州话在他们听来非常“洋泾浜”(不正宗)。直到通过考核,拿到苏州话辅导师资格证书时,予安仍觉得自己“会教,但讲得不好”。很多同班同学则情况相反,他们讲得好,但是不会教,有人甚至没参加最后的考核。
考核结束后,学员们问负责人“我们拿了这个证能干嘛”,对方表示“你们自己去找街道搞活动”。于是很多人拿到资格证书后就没了下文。但予安没有停下,她继续想办法提高自己说苏州话的水平。
西班牙语专业的她决定像对待一门新语言一样来重新学习苏州话。苏州话所属的吴语在国内方言中研究资料较多,但予安找到这些资料后发现看不懂,于是从头开始自学与现代汉语教学相关的基础知识,并补充了国际音标
登录后获取更多权限
网络编辑:李木子