让机器帮你“通读”世界!

信息来源:google 黑板报  作者:  阅读次数: 次 发布时间:2008-05-19
文章摘要:谷歌翻译的方案名为“统计机器翻译”(statistical machine translation),这与人们以往的努力不同。简单来说,谷歌的机器翻译将已经翻译过的相关语种文档输入电脑,让计算机学习、识别,并在未来的翻译中作为参考。


5 月 8 日下午,谷歌和金山联合发布了《谷歌金山词霸》,我们的很多用户也对谷歌的机器翻译有了初步的认识。其实,这并不是第一款应用了机器翻译技术的产品:在谷歌中文主页“语言工具”中早已包括了“翻译文字”、“翻译网页”等由谷歌机器翻译技术支持的功能。现在,我们就更全面地了解一下什么是“谷歌机器翻译技术”。

首先要给大家介绍一下传统翻译技术。以往人们都是把语言学家设置的语法规则和词典输入电脑,电脑根据语法规则进行翻译。而谷歌认为,人们未来将能够依靠机器逻辑而非语言学家把文件立即翻译成世界主要语言。

谷歌翻译的方案名为“统计机器翻译”(statistical machine translation),这与人们以往的努力不同。简单来说,谷歌的机器翻译将已经翻译过的相关语种文档输入电脑,让计算机学习、识别,并在未来的翻译中作为参考。按照谷歌规划的未来,人们完全可以在瞬间将自己的文档翻译成其他主要语种,并且只需要利用机器逻辑,无需语言专家干预。

下图可能会帮助你更好的理解谷歌“统计机器翻译”的基本原理。谷歌在网络上获取中英文文章后,通过对齐句子或句段,进行词语对齐及短语提取。当你需要翻译时,机器会通过统计得出该短语在一定语境下最常用的翻译,从而确保得到较好的翻译结果。
    


    

为了提高翻译的准确性和顺畅性,谷歌应用海量数据来训练模型。目前在翻译模型 P(E|C)中,约收录了两亿中英文词;在语言模型 P(C)中,约收录了一万亿中文词。在文本方面,已经有数百万份联合国和欧盟的双语文本被录入了计算机。通过对上述海量数据进行分析对比,谷歌的机器翻译能够方便快捷地提供精确的结果。以我们现在提供的网页翻译功能为例。当用户搜索出英文页面时,谷歌会自动提供页面翻译的功能。如输入“斯坦福大学”,搜索结果中出现的第一条为“Stanford University”,你只需点击旁边的“翻译此页 BETA”,谷歌的机器翻译便会直接为你呈现出中文翻译结果。
    


英文页面:
    


翻译后的中文页面:
    

从 2005 年到 2008 年,谷歌的机器翻译技术已连续3年获得美国国家标准局测试第一名。德国人 Franz Och 是谷歌翻译项目的负责人,他于 2002 年在德国最负盛名的理工科大学——亚琛工业大学(RWTH Aachen)获得计算机博士学位,并于 2004 年加入谷歌。Franz Och 博士的母语是德语,此外他还精通英语和意大利语。

当然,谷歌的机器翻译技术还不完美,这主要因为某些语言没有大量翻译的文件。对于此,Franz Och 指出:机器翻译比较麻烦的是缺乏译文对比的语言,比如非洲国家的一些语言,因为它们的使用人群并不大,“对照文本越多,翻译效果越好”。但是我们相信,通过不断努力,谷歌以领先技术贡献产业发展、服务中国用户的目标定会实现。
热点链接:  世界  机器  翻译  谷歌  语言  技术  人们  中文  页面  我们  
参与评论
用户名:新注册) 密码:匿名评论
说明:不能超过250字,需审核后才会发布,请自觉遵守互联网相关政策法规.