一种翻译一切的方法

经过:

I’m a casual fan of science fiction, and by that I mean I love Star Wars and Star Trek and any video game involving interplanetary war, but not to the point that I have tattoos of the Rebel Alliance or can speak Klingon or anything like that (though if anyone has a suit ofStorm Trooper Armor.他们想送我的方式,我的妻子说没关系!)。

在我所体验过的大多数科幻小说中,由于不同文明说着截然不同的语言而造成的沟通困难在很大程度上已经得到解决,通常是通过使用翻译机器人或可植入设备。但这样的工具现在或将来会存在吗?

事实证明,也许!谷歌研究人员最近设计了一种方法用于使用语言统计特性的高效交叉语言翻译。首先,研究人员认为,所有世界的语言都描述了一个大但有限的概念。语言学家可能会与这种假设争论,但我不会在语言学家和计算机程序员之间进行中断,所以我们将继续前进。

接下来,他们将大量语言数据喂入计算机程序。该程序查找了在其他单词和短语的上下文中出现某些单词和短语的频率。例如,可能有兴趣了解句子中的空白空间“我正在下班后将到___”充满了“商店”10%的时间,“银行”5%的时间,“俱乐部“.3%的时间等。

在将足够的语言数据喂养到计算机程序后,研究人员可以为语言中的每一个单词和短语构建矢量(数据集)。从那里,从一种语言到另一语言的翻译只是找到了将一组向量转换成另一个矢量方程的问题。我不知道如何做那种数学,但显然它对于数学博士学位的人来说非常简单。

研究人员声称他们的翻译计划接近了90%的精确精度@ 5,我认为这意味着当该计划给出其特定单词翻译的前五大猜测时,将在90%的时间内出现正确的翻译(如果我’m grossly misinterpreting the concept of precision@n, please hit me up on twitter @jimkloet or leave a comment!). On top of that, the translation program was able to identify and fill in gaps in some pre-existing translation dictionaries.

这个翻译程序听起来很有希望,但我认为我们不会很快就会期待真正的C3PO。对于初学者来说,Google团队的工作仅适用于单词和短语,而不是句子或整个对话。它也没有考虑任何语音和语言的任何细节,就像语音,讽刺或幽默硕士学位的变化一样。

据说,知道人们实际上正在努力解决这种事情是令人兴奋的。自动语言翻译将使世界汇集得多,而不是要求每个人学习大约7100种不同的语言今天说话。如果我们在星球之外找到聪明的生活,那么它可能会派上用场。

话题:

标签:

评论

添加新评论