晋网-山西生活门户     
三晋热线
adall01 adall02
当前位置: 晋网 > 社会

让机器“说”中文面临哪些新挑战

责任编辑:笑笑    来源:晋网    时间:2016-12-25 11:20   热搜:机器   阅读量:19040   

让计算机、智能手机这样的机器像人一样来懂得和应用语言,这是语言信息处置专家们的理想。然而,相较于英文而言,中文表达缺乏词与词之间的空格,人名首字母大写这类显著的表层语法特点,使得机器辨认和表达中文信息时困难更多。12月23日至24日,中文信息学会在京举办第八次全国会员代表大会暨学会成立35周年学术会议,专家们解读了让机器“说”中文的研究进展。

让中国人与机器自在交流

中国中文信息学会理事长、哈尔滨工业大学教授李生说:“中文信息处置就包括对中文(汉语,一部分民族语言)的编码、音、形、义等方面的计算机自动处置。”

实际上,在计算机问世并快速激发囊括全球的信息技术革命时,因为其应用英文语言,如何进行汉字编码、存储、输入和输出一度成为计算机在中国普及和推行的“拦路虎”。尔后,在速记专家唐亚伟创造亚伟中文速录机,北京大学王选院士等人研究出汉字照排和印刷技术研究,并处理了巨量汉字字形信息存储和输出等问题以后,电脑才与汉字“兼容”。

如今,跟随IBM的沃森超级计算机、谷歌的阿尔法围棋、百度的小度机器人、微软小冰,和苹果的Siri等人机交互系统走进人们的平常生活,能与人类用“语言”交流的应用已经无处不在,且更加智能,而这些现代科技催生的智能“机器”在中国的推行应用,一直存在将英文语言转化为中文方式的需求。对此,与会专家们表示,中文语言处置的目的就是让机器像人一样来懂得和生成中文,让中国人能够用自己的语言与机器进行自在交流。

机器“说”中文需独自觉展理论

让智能机器“说”中文,最大的难点是什么?李生说:“中文处置与英文有诸多差别,然而其最核心的差别在于中文重义合,英文重形合。”这使得中文表达对比英文缺乏显著的表层语法特点,例如词与词之间的空格,人名等单词的首字母大写等,这类差别致使机器处置许多语法层面的任务时,中文比英文要更困难一些。

“中英文之间的差别甚至已经体目前人脑对语言信息的处置上,而这已经获得了神经科学的证明。”李生说,这一点美国科学院院刊曾刊发论文进行阐述,“中文信息处置领域内的许多资深科学家也强调需求正视中英文差别,独自觉展中文的处置理论。”

“要最后达到机器懂得中文的目的,还有许多还没有处理的困难。”中国科学院自动化所研究院宗成庆说,中文信息处置是多学科穿插的复杂问题,仅歧义消解这一困难就已经让自然语言处置研究者捉襟见肘,力有未逮。

“更况且人类应用语言还有多种多样的体现手段,诸如隐喻、滑稽、夸大、双关、暗射等,它们对自然语言懂得研究都有深入的影响。”而如今对有些问题刚开始研究,有些甚至还没有触及。对此,宗成庆以为,要完成机器对语言的懂得,必须首先解开人类懂得语言机制的机密,这是有关人类认知机理、智能实质的科学困难。

中文信息处置让人们更“聪慧”

能够进行各类语言互译的计算机软件是人们如今常常应用的语言处置工具。但通过量年的发展,机器翻译依然不能够让人非常满意。在该学术会议上公布的2016年《中文信息处置发展报告》中指出,在“信、达、雅”这三个语言翻译的不一样条理上,如今的机器翻译还基本挣扎在“信”的阶段。将来,机器翻译质量的提高还有赖于基于神经网络技术的翻译办法等的发展提高。

对此,李生表示,以互联网、大数据和深度学习为标记的海量信息时期的到来,也给信息检索、语音技术、文字辨认、自动问答、机器翻译等中文信息处置领域带来了新的挑战和机会。

他举例说,人工智能技术给中文信息处置带来了诸如手机语音助手等许多新应用处景,这其中又产生了大批的用户反应数据,这些海量的数据则增进了基于中文的知识图谱树立和深度学习等新技术的应用和发展。李生以为,这些变革会极大地将人们从中文记载、翻译、文字辨认等机械劳动中解放出来,同时也会提高人们的认知能力。他说:“总之,借助中文信息处置技术的诸多提高,我们会了解得更多,变得更‘聪慧’。”

(本报记者 詹媛)

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

栏目:社会

相关文章

adl03
http://www.sxjin.cn