●主播介绍●
淘淘:常年混迹硅谷的科技宅,俩娃奶爸。对世界充满好奇,对上海文化无限热爱。
Francis:多伦多吴语保护协会主席/创始人
祁老师:在两个拉美国家教中文,汉语方言学研究者,肥宅,爱美食,赌徒性格,放荡不羁。传媒与教育界双栖八零后。
祁老师:我到广州去的时候看他们广州人看外地人学广州话的态度和我们上海人看外地人学上海话的态度是不一样的。
Francis:对对对。
祁老师:我觉得呢,粤语区的人可能在这方面他的文化自信比较强,所以呢,他能够包容你外地人说不标准的粤语,但是是上海人在这方面有一种鼓励性,也可以说上海人在这方面其实也是一种莫名其妙的优越感,就会说你算了吧,你不要说这种就是说洋不洋土不土的洋泾浜上海话了,你跟我说国语算了,他会非常的不耐烦,这一点是上海人做的不对的地方。
淘淘:不要说和外地人了,我有一个同事,一对小夫妻,老婆是上海人,老公是崇明人,他们家里也是普通话交流的。我说你崇明话听得懂吗?她说听得懂的,但是太土了不想听。就是莫名其妙的优越感。
Francis:我不知道是不是户口制度还是历史上的很多原因,就是上海人的概念在建国六十年,几十年的过程中相对于固定化的。反而是香港人的概念在以前是动态的。因为你在以前,香港在我们之前很早就变成了一个移民城市,因为相当多的其他地方的人口进来,那么他们会希望他们能够更加好的融入这个社区,慢慢地把这些人同化成香港人。反而我们上海和苏州呢,刚刚开始做这些事情,可惜我们没有这个氛围嘛。
淘淘:我觉得上海刚刚是反过来的,我印象当中50年代之前,上海是一个流动性很强的城市,所以就是说那个时候的上海是包容很多口音的,所以我们小时候经常接触到这样的老人家,反而就是户口制度建立之后,比如说七八十年代之后的这一代人,他们就变成所谓有上海户口是上海人,但是上海口音也有一定的固话,变成了一个群体。有没有这样的感觉?
祁老师:你说的这个在文献中是可以验证的,就是上海的口音一致话呢,也是从六十年代开始的,就是说户籍制度实施之后呢,就是说人口的流动,城乡的流动,还有跨省的流动就比以前少的多了。人一多的话,口音是会趋同的,而且这个口音的趋同是大量的在60到80年代之间发生的。我们现在看到的上海话在49年之前是不存在的。大家都是各自带着自己的口音的,宁波人带着宁波口音,无锡人带着无锡口音,是这样的一种情况。
淘淘:很有趣的就是以前在香港有很多自称上海人的香港人,有很多人也只是在上海生活过一段时间,并不是真的出生在上海,我记得像邵逸夫....
祁老师:其实你仔细去听的话呢,就是董建华这批人他们的粤语,还是上海口音非常重的,从语言可以分析出他的上海口音,或者说是吴语口音,体现了在他的粤语里的影响。
Francis:最典型的就是香港四大才子嘛。
祁老师:金庸倪匡都是这个样子的嘛。
Francis:他们的粤语都是带着很重的吴语区的口音的。
祁老师:这个问题我想多说两句,就是我们过去不管语言研究,还是说语言的推广教育这方面,过去是有过一种普遍的想法,就是说,语言在一个地方是比较均匀统一的。不管是方言也好,还是方言也好。但是从一个社会语言从七十年代八十年代开始发展之后呢,就有越来越多的研究者发现,语言在社会的存在中,并不是我们想的理想化的一种状态,而是说你这个地区的人可能说各种各样的方言的,或者说说各种各样的口音的,但是互相之间大家都是互相认同,而不是说你不说我这种方言我就不认同,不是这个样子的。比如说从宁波来的上海人他可能带有一点带宁波特点的上海话,比如说接袜子。那么你作为一个苏州后裔的上海人,你是不说这些东西的,但是你听得懂吗?你是听的懂的,完全可以的,而且大家一直在说一个问题,就是说,上海人对于上一代人的上一代人的称呼,其实你是可以看出他的足迹所在地的。
淘淘:阿爷阿娘,大大嗯奶。
祁老师:有些人是说阿爷阿娘,有些人是说大大嗯奶,还有说是亲妈,还有说是老爹,都是有的,为什么是这样的情况呢,因为大家有不同的来源,但是大家,你说互相之间听不懂吗?不可能的,他不说这个词语,他能接受这方面,这都是我们社会里面正常的一个语言特征。我觉得就像回到我们刚刚说的那个问题,香港是缺乏官方的对于一体性的控制的这样一种手段,也没有像上海那样实行过户籍制度,就是香港的文化多元性是很强的。文化多样性的与否,对于他的一个语言的使用和同化,向下一代的传承是没有负面作用的,相对来说都是积极作用,我觉得应该从这个方面来想。
淘淘:对的对的,也要接受外地人说上海话,才能保持上海话。
祁老师:这个也是我的结论。上海话要想传承下去,一方面要上海的年轻人,新生出来的人,不要只说普通话,是吧。这个是第一点,第二点就是说,你的语言,尤其是上海这么大的移民城市,你不能只靠原来那帮人去传承的,你要有一定的同化能力,你没有同化能力,外面的人越是进来你就越糟糕,这是不行的。你不能够画地为牢,你肯定是要能够同化外地人口,具体要怎么实现,这就很长了。
淘淘:我们的同化从Francis开始。
Francis:我是自我同化的。
淘淘:我一直觉得Francis你说的上海话跟很多上海的小青年说的话,有很多上海的小青年会很惭愧的,作为一个上海人说的还没有你这么好。你起到正面的作用。
Francis:我是一个正面典型是吧?
淘淘:那么下一个话题,我就还想聊一聊,我们最近不是说到了这个三语报站吗,因为我实际上开始做这个上海话节目之后呢,我也慢慢了解到了,就是以前有这种吴语的,或者说上海话的各种各样的努力,包括我想祁老师对于这方面是很了解的,不知道你可不可以跟我们介绍介绍?因为这方面实际上海人知道的也是比较少的。大家只是模模糊糊的知道有点这样的行为想要保持下去,但是我相信,实际上有很多人是做了很多努力的。
祁老师:这个我自己开始了解这些事情也是从年02年的时候开始的。
淘淘:这个非常早了。
祁老师:那个时候是在BBS上,那个时候网络上有一批人,那个时候主要还是用BBS的时候,一个是新浪的BBS,还有一个是北京大学中文系的BBS里面。那个时候就看到一篇,可能是吴语区的人写了一篇,就是吴语的文化价值。这个之前我也是从来没有接受过这样的概念的。
淘淘:上海人有很多都不知道吴语是什么是吧?
祁老师:我就经常说,就是觉得我自己说的是上海话,旁边的城市说的是苏州话,嘉兴话,还有杭州话,从来没有觉得大家是一个共同体,也没有去想这个背后有什么文化,因为从大多数普通人的角度来说,这个就是一种土话,是方言,他是在社会中一样比较底层的文化标志,那么越是往高处走,普通话就会更加显示出来,地位是有高低区别的,这个是长期的教育,或者是长期的传统带给人的一种思想。那么我当时看到这篇文章的时候我也是蛮受触动的。我想说的就是我后来想写这篇文章,看这篇文章,参与这篇文章讨论的人,大多数都是不在上海的,不在我们吴语区的人,就是当这些人走出了自己的家乡,像我是到东北区,有很多的大学生是考到北京,或者是考到杭州,还有更多的人是到国外去的,像我刚刚说的吴语文化价值这篇文章,是当时一个在法国在那边做医生的一个上海人,那么这些人离开家乡之后才会感觉到,原来我从小到大生长的环境给我留下来的一种印记,是这样的一样东西,我如果不离开上海,不离开苏州的话,我可能一辈子都感觉不到。我都是离开之后我才感受到,其实我是一个上海人,我是一个苏州人。我和北京人,和广州人是不一样的。这个不一样最明显是什么地方,就是我的语言是不一样的。当然你也可以说生活习惯不一样,饮食习惯不一样,但是最最明显的就是语言方面。那么就会去考虑我从小的语言,我从小在爸妈那里学的语言到底是什么东西,再会回过去考虑这件事情,所以说我觉得在外地的学生里面,在留学生里面当中,出现了这样的一种思潮,而且我接触到的大多数都在北京,都在国外。像我们这些在东北的吴语区学生都是互相有串联的,我们都会写一些文章互相之间交流,或者像一起去做一些事情。最明显的就是,两件事情,考正字,考正字是在方言研究里面一个很重要的事情,我怎么去确定我口语中说的这些音节,我用汉字形式怎么把他写下来,这是我,应该说是考本字,方言里面是考本字。
淘淘:就是胡适说的我说什么就写什么是吧?
祁老师:是不是他说的我不知道了,反正是新文化运动一个白话文的传统里面就是要把我自己所说的语言写下来,其实这种传统也不是中国本土兴起的,也是当时当时有一部分留学生到了海外之后,到了欧美之后接触到他们的那些文化的这种操作的习惯,才发现原来我成长了这么多年,我怎么没去想过用文字把我自己嘴里说的口语写下来。包括我觉得这个形成的原因就是我们到国外去留学接触到,其他的一些语言,现代的民族语言文化是这样的一套操作,然后才能想到这样的做法。我觉得这个也是中国接受现代化的一个方面吧,过去讨论的比较少。
淘淘:那么你这边说到的有一个,就是现在全世界比较成系统的文字或者语言,都是经历过一个现代化的过程,就像古代人的时候不管是中国还是外国,很多老百姓说什么和写什么,可能不识字就不会去写,那么现代化之后。
祁老师:在古代的时候,文字这个东西是有一定的垄断性的。就是他可能是社会里面的一小部分人。也就是那个时候,像埃及就是一部分祭司,或者在中世纪的欧洲是那些懂拉丁语的教诲里面的这些人,这些人垄断了文字这些东西,当然在东亚社会也是这样的,读书人在过去的很长一段时间里面,是占很小的一部分比例的,不管是中国韩国,还是日本,都是这样的。那么这些人就垄断了文字这样东西,大多数的劳动人民是没有关系的,所以我觉得人和人走向平等的一个必有的道路。
淘淘:所以你们那时候去考证那个正字,有点像为我们这个方言重新做一个现代化的过程。
祁老师:没错没错,所以我们后来去建了自己的BBS去办了自己的网站的时候,其实当时有一个口号就是吴语现代化,就是说我们做的事情不是去考古,也不是对于过去的什么农村的习俗这方面,从外人的角度理解都是这样的,但是从我们的角度来说是让我的母语走向现代化的这样一件事情。
Francis:包括好像现在吴语学习网上也写着推动吴语的现代化是吧?
祁老师:对的,吴语现代化这个口号实际上是我和另外一个网站的组织者我们两个人想出来的,当时是觉得这个口号是非常好的。那么大家都沿用这种方法就说明大家对于这种想法是有一种共识的,另外我说的一方面就是考本字,考正字,另外一方面就是考方言的拼音,也是在零几年就开始了,而且在这个之前呢,编著上海话和苏州话的教材或者工具书的人他们已经做过这些事情了。大家我觉得06年....
淘淘:那时候是有本书的嘛,江南拉丁文。
祁老师:对的。这个是比较早的一个东西,但是这件事情是一件非常不成熟,或者非常不科学的做法。那么到了06年左右呢,我觉得这个是一个分界点,就是说到了06年之后,我们网上就已经发展出了我认为的比传统的方言更加有体系的,更加有操作性的拼音的方案,是从这个时候开始的,就是年之后开始的,包括无锡话,苏州话,绍兴话,宁波话,上海话都有。
淘淘:那个你们什么叫可操作性?以前和现在的区别是什么?
祁老师:以前和现在的区别就是我们现在设计的拼音的方案,要怎么去考虑,我用什么字母来代表什么音,这个里面实际上是有很多选择的,就是说我有一部分的想法就是说我觉得过去的他们比较容易去接受的,就是说,当然这和长期以来历史有关系。可能大多数人不知道,就是在五十年代的时候呢,我国是在五十年代开始的汉语拼音的设计,定型以后。除了汉语拼音之外,其实国家还在做另外一件事情,就是为各个少数民族设计他们的新文字,有种少数民族是把原来的文字全部推翻,就像广西壮族,就是完全从零开始,用拉丁字母开始设计。
淘淘:就是全部用拉丁语开始设计?
祁老师:是拉丁字母不是拉丁文。还有就是有些比较强势的,像朝鲜族,蒙古族,是本来就有自己的文字的,那么他就把原来的文字再规范一点,那么那个时候为各个民族去设计,就是为有需要的民族去设计拉丁文字的时候,有一条基本的政策就是要以普通话的汉语拼音作为蓝本。以这个为基础去设计,但是我和一些同行认为,这条原则是错误,因为你不同的方言或者说不同的民族语言他的音译实际上是不一样的,就是说我最近的拓扑,或者说里面的音素与音素之间的对立都是不一样的,那么你最应该做的事情就是考虑我这个方言里面的音与音之间,或者说翘舌音和平舌音中间有没有这种对立,我的对立整体上是什么格局,我设计的拼音方案首先就要考虑本身而不是去迎合普通话。他普通话用这个因为发音就是这样的,我既然格局跟你不一样的,我还要硬去套你这个东西,最后做出来的这个东西就四不像了。这是不可以的。
淘淘:就是有点像上海话硬翻成普通话,就屁都不是了。就像有些小朋友说的屁事不是。这种就是违背了方言本身的规律,或者说是本身的规则。
祁老师:我就是实事求是的来看这件事情,就是不带先决的条件的这种情况下面,那么我是得依照我本身的方言的特性来作为我设计拼音方案的一个出发点。这个也不是说我一个人的想法,我说的是到06年为止,大多数在网上搞方言网站,搞方言论坛的,搞方言文字化的,我们年青一代的这点爱好者,大家是有这样的共识的。但是这个共识和老一辈的方言研究者之间是有冲突的,这个冲突就是06年12月开的一个叫首届上海方言研讨会,在这个研讨会上,就是说新老两代的搞沪语拼音之间是有争议和争吵的。
淘淘:就是有学术的成分。
Francis:我接触过很多上海话和苏州话的拼音方案,但是我了解肯定没有祁老师这么深,其实我在一个,没有接受过相关训练的角度来说,其实是两种平衡,就是你学过汉语拼音的人,你会自动的套入他们的思路,来理解他们拼音正规的系统。因为除了刚刚说的,还有科学性,还有一个就是可推广性,就是你是接受过汉语拼音的老百姓要能够去,很快的把这一套东西学会,这个也是很重要的,不然的话你太专业或者太和他们的生活环境脱节的话,他们是没有多大的耐心去学这样一台拼音系统的,其实有很多的拼音方案是折中的,就是希望能够能够有和大家自己的语言中有共性。
淘淘:我想到另外一个东西就是吴语字典,这个东西我不知道祁老师了解吗?因为我觉得这个是很方便的,我有时候,就是我们之前录繁花嘛,虽然说有时候和年级比较大的朋友一起在录,但是有时候还是搞不清怎么读,那么我们一读字典就很清楚的,这件事情是不是也是那个时候,祁老师有没有参与?
祁老师:吴语字典这个东西呢,实际上我就想明确两个概念,用上海话来说就是字典,实际上呢有两样东西,一个叫做字典,一个叫做词典,这是两种东西,然后相对来说吴语字典这个东西相对比较早的,从八十年代就开始了,我们现在看到的有一个比较早的就是那个时候华东师大的一个教授在上海年就出版过这样一本书,叫简明吴方言字典,这个也是从我小时候就看到过的,但是这本字典他的收入量相对来说比较小,而且可能里面的举例子就比较少,因为他里面的篇幅本来就有限,因为不够用嘛,所以我们后来就,在网上的爱好者也会想到去用一些新的字典,这个时候官方的学着也在编新的字典,就包括现在看到,上海话大词典,还有一本中日合作编写民间话语字典。我就觉得民间和官方,也不是官方,就是学者,同时在做这些事情。就是大家都在从事这件事情,然后字典这件事情,我自己觉得到目前为止,我对于词典这方面的水平还是不太满意的,就是说相对来说,你会在市面上看到相对来说比较多的东西,但是真正能够用的,或者说能够被普通人所利用的还是不够多,像我们说,到现在为止,还没有比较方便的手机上的可以使用的客户端。你比较了解的可能知道,广东话和闽南话现在已经有这方面的东西了,但是吴语这方面做的还是比较落后的。
淘淘:我看到过那个时候就有一个网站叫做吴语字典。
祁老师:我知道我知道。
淘淘:这个字典好像在手机上和电脑上还能够发音。
Francis:我想问一下祁老师,就是这些网站是公益的完全用爱发电的,还是有什么盈利渠道?
祁老师:是没有盈利渠道的,完全是一种公益的劳动,因为我以前也做过的,我也有一个网站,但是这个网站是没办下去,因为我记得这种网站最多的时候,我是整个吴语区去算的,一共有四个同时存在,但是留存到现在的可能就只有一两个了,因为大家在这方面投入的精力和财力实际上是蛮多的。
淘淘:那么这里面有没有学术界的介入呢?应该是这么读吧?学术界。
Francis:学术界。
淘淘:我重新读,这里面有没有学术界的介入啊?比如说项目基金投进去,因为我想....
祁老师:没有这方面的基金会投入的,都是自己袋子里挖出来的钱。
淘淘:我看到过一个网站叫做乡音缘,这个网站不止是做上海话,他全国各地的方言都有,就会里面,你点家乡,哪个城市或者哪个地区,他有一段这种几岁几岁的这种老人,或者年轻的人用方言读出来的文字,你看到过这个网站吗?
祁老师:我就是这个网站的三个管理者之一。
Francis:偶哟。
祁老师:我一开始就是靠这个混的好吧,所有人一进Clubhouse就说了,这个东西我认识的。然后就有话题可以聊了,说起来还是比较惭愧的,因为我参与这件事情不是很多,我也是从年才开始参与这件事情,他们最早的,创立这个网站的两个美国人12年就开始办了。
淘淘:是美国人啊?是美国人创立的?
祁老师:是的,当时一个在北京,一个在无锡,两个美国人建立的网站,所以两个美国人建立的这个网站以后,在中国的媒体上是引起了不小的反响的。因为当时的媒体都有一种比较猎奇的心态吧,或者说这个事情居然不是中国人在做,居然是美国人在做。其实有相当多的媒体想要去采访这两个创办者的时候,是被拒绝掉的,因为这两个人也是觉得这种报道角度不是很健康,就是总归有一种酸溜溜的心态,所以他们对于采访的人也是有选择的,但是你还是可以查到,就是一席那个时候是请他们去说过的,还有一个就是上海的叫什么皇家亚洲协会啊,是建国宾馆那边的,也做过这样的。我自己还去旁听过,这两个人的想法其实我觉得还是比较习惯的吧,因为他们看到了其他的比较濒危的语言的做法,相当于借鉴了西方国家的一些做法,用到中国的语境里,没有想到会做这么多事情,因为确实那个时候在中国有这种想法或者有这种思路的人是比较少的,大家在从事方言的这段时间还是比较传统的想法,就是我要编字典啊,我要写语法书啊,或者说拼音方言字典啊,或者说输入法,都是这样的想法,但是国际上对于濒危语言,他们在各大洲人口数量比较少的语言中去收集,去做文献,归档的工作,其实从他们开始的。
淘淘:那么我可以理解为这两个创始人对于濒危语言的资料,比如说他对于语言的资料非常感兴趣,他就想为人类保留更加多的方言或者语言?这样一个数据?所以中国的这个记者可能不太能理解,实际上我觉得作为中国人很难理解一些人为了我们看来没有什么用处的事情。
祁老师:有一些记者甚至去看是有一些阴谋论的。或者甚至说这个会不会危害到中国的语言国家安全。有各种各样的阴谋论会出现。说明在思想上他是落后人家很多很多年的,转不过来也是很正常的。
淘淘:我突然之间想到一个很有意思的事情,就是我大学的时候很喜欢去拍上海的老建筑嘛,那么那个时候有一批外国人也很喜欢来拍上海的老建筑的,有一次到一个弄堂里面,有一个阿姨就拉着我说,你为什么一直拍来拍去,我说我就喜欢拍啊。她说前几天有几个外国人也来拍,是不是要拍我们中国比较破的地方?因为老房子大家都是七十二家房客,居住环境比较差。老是把我们中国比较差的这方面放到外国宣传我们不好。
祁老师:你说的这个人她年纪多大?
淘淘:那个时候我印象中应该是六十岁朝上。
祁老师:那么这些人肯定都经历过年,安东尼奥的中国这部纪录片的,因为年是邀请了比较左倾的社会主义。意大利的,因为意大利是比较倾向于社会主义的,意大利同情社会主义的导演跑到中国来得到允许拍纪录片,结果还是得到中国的强烈的批判,然后大多数跟着批判的人,我觉得大多数经历过的人是有印象的。包括我爸妈也是,说起安东尼奥他们就说这个人阴险,是野心鬼,是当初跑来拍中国的阴暗面的,然后好的东西不拍。那个时候都不拍,专门去拍犄角旮旯里。
淘淘:专门去拍那种棚户区。
祁老师:就拍棚户区,就拍中国人倒马桶,就和我们中国搞革命宣传的初衷是不一致的。但是我们现在去看就会感觉到,幸亏这位朋友来过了,幸亏他拍到了,带回去了,否则的话,我们现在根本是看不到这点东西的。
淘淘:影像资料是很私人的。
Francis:这个跟文化自信也有关系,你要是觉得这个东西人家比我差,所以我就要给你看好的一面,说明你自己还是很自卑的嘛,在文化上。
祁老师:那个时候还专门组织了安东尼奥的拍摄组到山西河南的交界,那个时候刚刚造了一条水渠,作为社会主义建设的很好的一个东西,所以他就专门有一集是拍这个东西的,就是为了完成任务。
淘淘:社会主义的成就是吧?
祁老师:幸亏当时大多数还是在上海,苏州,北京这些地方拍,还是拍到了很多我们现在看不到的东西。
淘淘:有意思有意思,而且我觉得这个对于对老的东西比较留恋的情趣,也是在我们新一代人身上比较多,因为我印象中我爸爸妈妈爷爷奶奶对于过去的事情兴趣不大,可能过去了。他们觉得保留也没有什么意义,但是我相信这个社会是进步的,那么包括这些拍纪录片的人,包括这些做网站的人,他们都是国际上很先进的经验。
祁老师:我后来在上海就认识一个,就是说在美国长大的一个菲律宾人。这个人当时他做的事情,他的团队呢,就是专门到上海的各条马路上去,他也是录音,但是他跟录方言的这个东西不一样,他录的是,这条马路上的人,在路上走,跟周围的人交谈,还有你能听到的其他声音。最后他应该是编了一本书,叫做与沪成长,就是和上海一起成长。
淘淘:有意思有意思。
祁老师:他这本书我记得还是有媒体给他宣传过的。
淘淘:这个就有点像你到一个地方去旅游,你买一个罐头,里面是那个地方的空气,就等于是把空气放在罐头里。
Francis:空气也是反应他的时代精神的一种方式。
淘淘:就是上海话的语音识别最开始是苹果做的,到后来我看什么科达云飞啊才做出一点像样的产品出来。
祁老师:没错,这个也是我年去参与的一个项目,就是说是苹果公司找了一个中国的数据代理商,然后希望能够采集这方面的数据,然后做一个识别上海话语音的这么一个产品,差不多用了一年左右的时间,就是16年的秋天到17年的秋天,然后我当时组织了八十多个人的团队,就是说去做语音识别的标志,就是鉴别,另外一方面我是提供了将近四万多的字的上海话的词典,但是这和我们看到的词典差别是比较大的,这是用来做语音识别的东西,所以可能会在这个话里面出现的词语和词组啊,他具体在这个情况下面读什么音。所以我的这个字典会比你看到的任何上海话的词典规模都比较大。因为我是要考虑到他是真的能够用的。你要知道现在市面上能买的到的字典,他有一个规则,就是要普通话也用的词语,他基本上是不算的,但是我是不能这样去做的,因为我这样做的话,就没有办法识别了。我就用的上海话里面原有的词语,哪怕他跟普通话一样,就比如说工作这个词语,大多数的方言里面都是不会说的,但是你要知道这些词语,是生活中经常要用到的词语。经常说的,天天说的,对吧?还有什么,比如说情况,这个词你在任何一本方言书里面都找不到的,因为编入字典的都是,就会认为这是和普通话一样的词语我就不收了,但是你不可能不把这个词语做到这个语音识别里面去,因为你不做进去的话根本不能用的。
Francis:那么我想问一下祁老师,就是上海话里面也有老中青非常不同的派别,他们的发音也不一样,你在做这个设备的时候会不会也考虑到,比如情况的发音的区别呢?
祁老师:这个问题问的蛮好,我那个时候采用的技术呢就是,应该是八十年代初中期的主流的上海话音准,我也是根据年出版的一篇论文,对于当时上海社会当中的,这点语音状况的归纳,我是根据这篇论文来建立我的上海话的字典的。然后在这个基础上面,我在当时找的到的上海话发音整个做了一个归类,通通统一到这个上面去,至于说你提到的这个问题,我也有过这个想法,想要在这个的基础上面,去造新和老的,能够做兼容,问题就是这个项目组给我的时间是非常有限的,根本做不到这件事情的。
淘淘:这个我有点了解,因为我最近做模型嘛,我们是做模型,我们和翻译的模型是一样的,那么实际上在建模的时候呢,当时在建造这个模型的时候,因为你是识别嘛,机动性越高越好,不止于老中青,甚至是洋泾浜,半吊子的上海也能做出来,这个在理论上也是能够做到的,但是这个深度学习嘛,这个模型的参数是比较多的,你只要能够有足够的数据,应该是能够训练到这样的程度的,科大讯飞好像做过,还是识别的比较好的,当时一直优化嘛,更加多的数据能够优化的更加好。
祁老师:他们这个项目的投入比较长,科大讯飞对于他们这个项目的投入是很大的,时间精力还有财力的投入是比较多的,就不像苹果,苹果我们刚刚说的就比较像是一锤子买卖,就是说他一开始做好这个项目,之后就没有继续推进。我也是后来通过我的一个朋友认识了在旧金山的一个项目组,他们总的负责人,我也是和他们交流过这方面的想法。当初他们最早的时候是希望能够做一个上海话的siri,但是后来这件事情后来也碰上阻力了,没做下去,我也是希望再去探讨一下把这个事情继续推进下去,但是我听下来的口风就是说好像苹果对于这方面也没有那么多的想法,所以可能也就到此为止了。
淘淘:今天听到了点内幕消息。因为我记得科达云飞,因为我用过他的翻译软件嘛,他是收费的,他是API,就是说你进去翻译多少字,就收多少钱,还是蛮贵的,所以大部分的这个功能呢是商业用途。而且科大讯飞不是还有一个输入法嘛,你平常打字的时候,你短的语言可以用这个办法来翻译,但是长的话,我们做了一个节目,想翻译成上海话,文字他是要收费的,而且收的蛮贵的。
祁老师:你就是想说他们这个商业模式其实比较成功,是不是这样?
淘淘:我也没有数据了,但是我相信商业上用的人还是蛮多的吧。
祁老师:但是类似的,我印象中除了科大和苹果之外,在做一样的事情的公司起码还有三家。但是他们做的产品可能比较专注于一个方面,比如说有一个是做汽车导航,所以他希望驾驶员能够听懂上海话对他说指令,有些是做地图的,他希望地图能够听懂他想做什么事情,还有做音乐的,甚至于还有,我印象当中他说他是NASA的分支机构,他希望能够做这方面的事情。还有一家,但是我现在不能说的太多,因为他们是保密的,也是有一个特别的功能,做好这个模块之后,这个数据公司,不是我说的那家,是另外的一家数据公司就是完全封锁起来交给甲方的,等于你现在看到的能够公开的东西都是比较少的,其实有很多东西都是投入了很大的力气去做,做了重复的事情,但是可能最后这个知识产权就掌握在一家很小的,或者说一小部分人手里。
淘淘:我觉得这个东西,可能他使用的时候呢,我要做siri也好,我要做这个语音输入也好,很多上海市民用普通话输入也可以的,他没有必要一定去用上海话的这个输入法,反而就是说他能赚钱的地方,就比如说我们打电话,有可能留下来了一些商业资料,海量的商业资料,他可能不经意间用的是方言来说,就比如说家庭之间的话。
祁老师:就比如说你跟你老婆讨论要买一个冰箱,但是你的手机听懂了。
淘淘:对的,我们
转载请注明:http://www.0431gb208.com/sjszlff/3408.html