100种语言直接翻译！Meta推出SeamlessM4T新模型，核心数据集还开源_

当前位置：首页 > 视点聚焦 > 正文

100种语言直接翻译！Meta推出SeamlessM4T新模型，核心数据集还开源

时间：2023-08-26 08:22:54 来源：36氪

作者 | 虞景霖

编辑 | 邓咏仪尚恩

《创世纪》中有这样一个故事，传说在千百年前，地球上所有的人都使用一种语言，有一天他们决定建造一座高塔直通天际，远离洪水的侵扰。

(相关资料图)

这座高塔叫做巴别塔。

很不幸，这件事被神知道了，他们害怕人类因为巴别塔的成功建造而感到骄傲和傲慢，因此决定对人类进行干扰。

于是神打乱了人类的语言，导致人们无法理解对方在说什么。不出神的意料，由于语言不通，人类产生了混乱和分歧，不得不放弃建造巴别塔的计划，四散到了世界各地。

来源：pixabay

而如今，在AI的帮助下，使用不同语言的人可以直接进行交流，重建巴比塔成为可能！

来源：公开网络

这就是Meta发布的AI大模型：SeamlessM4T。一款能够转录和翻译近100种语言的一体化翻译器，目前已在官网免费开放使用。

来源：Meta AI推特

官网体验链接：https://seamless.metademolab.com/

消息一出，就引起了网友的广泛关注，甚至有网友把SeamlessM4T戏称为是“万宝路”创造癌症治疗法。

来源：Jason Ferrell推特

还有网友表示距离《星际迷航》中的万能翻译器又近了一步。

来源：kache(yacine)(e/boy)推特

嗯…..怎么不算呢？

来源：公开网络

但也不是一致好评，有网友就表示SeamlessM4T的表现差强人意，直言：“几乎每次都完全错误”。

来源：minos推特

100种语言直接翻译，文本语音一条龙

不同于仅支持文本转文本的传统翻译器，SeamlessM4T功能众多，具体来说：

能够对96种语言进行语音识别

支持近100种输入和输出语言的语音到文本翻译

支持近100种输入语言和36种输出语言的语音到语音翻译

支持近100种语言的文本到文本翻译

支持近100种输入语言和35种输出语言的文本到语音翻译

来源：Meta AI官网

据官方说明，SeamlessM4T可以分为两个部分，编码器和解码器。

编码器能够识别近100种语言的语音输入，再由解码器将其转化成近100种文本语言或35种（包含英语）语音语言。经过训练的编码器，能够自动识别输入语音中和人类语音对应的音频信号，并将其分解为一系列语音段，最后通过匹配器将这些语音段对应到单词中。

而文本的识别，则基于NLLB模型的文本编码器，经过训练后能理解100种语言的文本内容。基于识别的内容，解码器就可以进行语音和文本的输出。

编码器和解码器实现机制

简单来说，就是把文本或者语音扔给编码器，让它在内部进行一系列解析、分割和转换等操作，再把这些处理好的信息丢给解码器，解码器把他们合成对应语言的文本或者语音。

来源：Meta AI官网

说话间，已经有网友等不及上手玩了起来。

左边这位网友用福建话自我介绍的一瞬间，AI就立即将语句转换为英文，后面即使是“一整段福建话”，SeamlessM4T也应对自如。

来源：Meta

对此就有不少网友开始脑补，有了SeamlessM4T，以后上网组队玩游戏，管你讲啥语言，AI统统都拿下！

来源：Eder Teixeira Eder Teixeira推特

目前，Meta并非唯一一个投入资源用于开发AI转录和翻译的公司。

去年9月，OpenAI就开源了Whisper自动语音识别系统，还强调Whisper的语音识别能力已经达到了人类水准。

而更早之前，互联网鼻祖Netscape旗下的Mozilla基金会，也在2017年推出了公共数据库Common Voice，这是用于训练自动语音识别算法的最大的多语言语音库之一。

在训练数据层面，SeamlessM4T的训练数据似乎没有Whisper那么庞大。OpenAI声称Whisper使用了68万个小时的训练数据，而SeamlessM4T的训练数据约为44万个小时。

那么，Meta的SeamlessM4T强在哪？

来源：公开网络

首先，SeamlessM4T实现了语音和语音之间的直接转换，免除了中间的文本转录过程，能够更好地保留语音特征。

而其他语音转录软件，如Whisper，由于接受了大量的噪音数据的训练，转录的文本中包含实际没说的单词的可能性更高，当语音中包含多种语言的时候，Whisper的转录效果似乎并不那么令人满意。

SeamlessM4T则在这个方面进行了改进，大大增强了模型处理背景杂音和多语言语音的能力。

免费开源，包括核心数据集

目前，Meta将以研究许可证的形式向公众免费提供该模型（仅限非商业用途），以便研究人员和开发人员在此基础上进一步研究。

来源：公开网络

更重要的是，Meta还将发布SeamlessM4T的关键训练数据集之一SeamlessAlign。

这个数据集通过语音识别和文本挖掘技术，从公开渠道抓取并对齐了大量语音和文本数据，覆盖了37种语言，包含了超过44万小时的语音和文本数据，是迄今为止用于多模式翻译的最大的公开数据集。

另外，在测试中团队发现，SeamlessM4T的鲁棒性也灰常不错！

与此同时，Meta还专门做了研究表示，相较于当前最先进的模型，SeamlessM4T在语音转文本任务中处理背景音和变化的语音的能力更强（平均水平分别提高了37%和48%）。

SeamlessM4T鲁棒性测试结果

但和其他众多的AI模型一样，SeamlessM4T也并不是完美的存在，仍然存在多种形式的偏见和误差。

当输入中性词语时，输出的结果偏“男性”。例如，在不明确性别的时候，SeamlessM4T大约有10%的概率倾向将性别表示为男性。Meta推测，这可能是由于训练数据的“男性”倾向更加明显。

除了性别输出偏好，SeamlessM4T还有一些其他的问题。

例如在孟加拉语和吉尔吉斯语等一些语言中，SeamlessM4T对社会经济地位和文化进行了恶意翻译，这类情况在涉及性取向和宗教的翻译中更加严重。而这一点也得到了网友的验证，并表示对此现象的出现十分失望。

来源：Cuenta Libra推特

但是，Meta声称，SeamlessM4T的公开版本中包含了恶意评论的过滤器，能够阻止恶意言论的输入和输出。

但实际情况确是，在模型的开源版本中，默认情况下并没有这个过滤器。也正是由于这个原因，Meta不建议将SeamlessM4T用于过长文本和严肃内容转录翻译。

SeamlessM4T可谓Meta多年来在翻译器开发领域的集大成者。去年，Meta发布了一个能够支持200种语言的文本转文本翻译模型NLLB（No Language Left Behind），还推出了第一个针对闽南语的语音转语音翻译器。

今年5月，Meta推出了一个多模语言翻译器，能够识别并合成1100多种语言的语音。SeamlessM4T综合了上述所有项目的研究成果。

未来，Meta希望基于SeamlessM4T在翻译器开发领域进一步探索，最终创造一个没有语言障碍的世界。

X 关闭

最新推荐

100种语言直接翻译！Meta推出SeamlessM4T新模型，核心数据集还开源

2023-08-26
武汉洪山：天兴洲“变色”啦，这是丰收的颜色

2023-08-26
股票行情快报：朗博科技（603655）8月25日主力资金净买入34.98万元

2023-08-26
不得了！今晚，长春这里嗨翻了！

2023-08-25
2023首届“南开杯”国际跳棋公开赛落幕

2023-08-25
孙守财(关于孙守财简述)

2023-08-25
兴业银行济南分行打造精细管理品牌促进服务品质提升

2023-08-25
文玩盘玩谈文化觉得尴尬，说盘玩又坚持不下来？到底应该怎么办？优质

2023-08-25
山西又见平遥演出门票有效期规定

2023-08-25
⚽墨甲战报：特尔潘卡特尔双响巴斯克斯补时染红 10人莫雷利亚4-0横扫10人多拉多斯

2023-08-25
韩总统曾劝商贩不要担忧核污水排海：聪明的国民不会被谣言所动

2023-08-25
装甲核心6：境界天火媒体好评率高达48%!

2023-08-25
全民反诈在行动

2023-08-25
开源虚拟化软件QEMU 8.1发布支持新x86 CPU模型

2023-08-25
龙之谷黑龙在哪（龙之谷黑烟）

2023-08-25
四级协商议事平台再发力，一解石材企业发展之“渴”

2023-08-24
都排成“鸳鸯锅”了还嘴硬是安全的！日本预计用700亿日元处理负面信息！

2023-08-24
梅花创投吴世春：中国的企业家是最勤奋、最律己的凤凰网科技

2023-08-24
合肥肥东县免费结婚检查在哪里可以做？

2023-08-24
1—7月我市规上工业增加值同比增长7.2%

2023-08-24
四川迎来新一轮降雨过程

2023-08-24
求职信范本（关于求职信范本的基本详情介绍）

2023-08-24
会稽山：“一日一熏”气泡黄酒线上销售额已突破300万元

2023-08-24
俄罗斯瓦格纳组织创始人普里戈任在坠机事故中遇难

2023-08-24
梦见下雪是什么征兆

2023-08-24
磨底期的苦日子还要熬多久？(附策略)

2023-08-24
IP业态和服务都是只在这里有

2023-08-24
联想便携式电脑产品推荐联想便携式笔记本电脑推荐

2023-08-24
马健：中国男篮阵容真正的核心是谁？大家对这套阵容有信心吗？

2023-08-23
期房没有封顶银行会放贷款吗

2023-08-23
新款Model 3更多细节曝光，售价可能20万左右，外观更有吸引力？

2023-08-23
青岛获批建设国家“算力平台” 聚焦海洋领域人工智能发展

2023-08-23
命好的痣能嫁好老公有钱眉毛脖子长痣婚姻顺

2023-08-23
高温下宝妈带10岁儿子体验摆摊：早上6:30起床摆3个小时，会免费送饮品给环卫工和保安

2023-08-23
俄空天军为何不参战俄空天军总参谋长任代理总司令基本情况讲解

2023-08-23
武汉新洲区人才生活补贴标准及申请条件（本科+硕士+博士）

2023-08-23
假面骑士Faiz真骨雕开盒官图公开，小马哥的真骨雕也要来了

2023-08-23
ST高升8月23日快速回调

2023-08-23
莫干山景区内有游客翻越警戒线拍照，回应：如造成物品损坏将报警

2023-08-10
京投发展跌逾4%，股东程少良拟减持不超2%股份

2023-08-10
高温下“集中供冷”提供新模式？大规模推广难度较大

2023-08-10
甘肃庄浪：千亩西蓝花托起百姓“致富梦”

2023-08-10
因为刀郎的“罗刹海市”，淄博被迫“开园”，网友：活该淄博爆火

2023-08-10
盐城市天湖房屋征收服务中心党支部组织党员学习贯彻市委八届五次全会精神

2023-08-10
2023第十一届互联网安全大会举办 360智脑构建生产级大模型

2023-08-10
自愿晚一年上小学可以吗晚上一年小学好不好

2023-08-10
数字检察为能动履职注入新活力中站区“醉驾安全教育”小程序上线

2023-08-10
大英博物馆终于向华裔女子道歉，双方达成和解，不允许透露赔偿金额

2023-08-10
[无锡芯片36条]解读

2023-08-10
有恃无恐追师记(关于有恃无恐追师记的简介)

2023-08-10
雷雨+大风！晋江紧急预警！

2023-08-10
“暑期档”有序升温！深圳龙岗艺术场馆人气旺~

2023-08-10
仰融、德隆、中植，发心起念不正的，都走黑灯瞎火，撞见牛鬼蛇神

2023-08-10
任天堂下一代Switch将涨价至399美元：或明年发布

2023-08-10
华策影视（300133）：8月9日北向资金减持460万股

2023-08-10
信用卡逾期没还利息怎么算

2023-08-10
今日棉价 | 18071元/吨下跌33元

2023-08-10
马尔康市加达锂矿再迎潜在买家天华新能宣布将参与竞拍

2023-08-09
周鸿祎：安全企业不能只想卖货，未来靠服务业“说话”

2023-08-09
2023年8月9日铋粒价格最新行情预测

2023-08-09
信用就医覆盖厦门59家公立医疗机构新增"亲情付"服务

2023-08-09
第十一届（2023年）中国半导体设备年会暨半导体设备材料与核心部件展示会

2023-08-09
南京好的流产医院_南京人流医院哪家做到比较好？

2023-08-09
昆明市呈贡区吴家营街道：党建引领探索“警地融合”推动基层治理新思路

2023-08-09
YU SPACE 许鑫 | 云上「宛居」450㎡气质美墅具体是什么情况?

2023-08-09
情商比智商更重要的观点（情商比智商更重要）

2023-08-09
郑州部分中学报到、军训、返校时间确定！

2023-08-09
工商局股权质押流程（股权质押流程）

2023-08-09
轰24+8+8爆锤波兰！申京超级进化，感谢雷霆，你又为火箭送来哈登

2023-08-09
光庭信息8月9日盘中跌幅达5%

2023-08-09
阿里云邮箱如何搜索某一发件人的所有邮件阿里邮箱怎么搜索邮件

2023-08-09
各国参加世界杯NBA球员:澳大利亚10人中国李凯尔领衔

2023-08-09
钉钉版本如何升级

2023-08-09
里皮：说实话，目前中国女足，能称得上世界顶尖的球员只有这1人

2023-08-09
以先进制造业牵引区域增长西安高新区上半年经济发展迈出更快步伐

2023-08-09
8月8日LME基本金属注销仓单

2023-08-09
中钨高新董秘回复：截至7月31日，公司股东人数约为4.6万

2023-08-09
梦见抓鱼了抓了好多鱼孕期梦见抓鱼了抓了好多鱼

2023-08-09
两笔美元债利息未按时兑付碧桂园：将优化资金安排

2023-08-09
苑东生物（688513）8月8日主力资金净卖出55.22万元

2023-08-09
“全民健身日”云南省系列活动启幕

2023-08-09
两次夺得金牌，物理奥赛总分世界第一！他被保送北大物理学院

2023-08-09
iphone公开版和移动4g版有什么不一样（苹果手机移动4g优先版是什么意思）

2023-08-09
巅峰空战2023官网在哪下载最新官方下载安装地址

2023-08-09
3天倒计时！罗马诺：凯恩告知拜仁热刺，转会截止周末英超开赛！

2023-08-08
但少闲人如吾两人者耳翻译成现代汉语_但少闲人如吾两人者耳翻译

2023-08-08
“高薪”背后可能有陷阱谨防招聘诈骗套路多

2023-08-08
不回巴萨！打脸巴黎！内马尔父亲反驳，金钱大于梦想，梅西成关键

2023-08-08
海南开展中小企业“揭榜”工作

2023-08-08
土耳其一港口粮仓剧烈爆炸致10伤巨响后升起滚滚浓烟

2023-08-08
雨停不意味着“警报解除”

2023-08-08
天府融媒看大运丨一张长卷记住这个闪闪发光的夏天

2023-08-08
民呼必应| 市民呼吁增设新华路（湛河以南）至建设路往东的公交路线职能部门回应：尚无法满足直达需求

2023-08-08
远达环保：公司全资子公司特许经营公司拟与关联方江西公司设立合资公司

2023-08-08
【新闻发布会】福建：今年1至6月共决定起诉2.9万余人

2023-08-08
2023年江苏养老金重算补发在即，工龄30年能领多少钱？试算一下

2023-08-08
上海电影（601595）8月8日主力资金净卖出1.37亿元

2023-08-08
预测：2023年年底iPhone 15系列出货量将达7500万部

2023-08-08
稻盛和夫先生曾提出一种理念，懂的都懂！“一壶水”的利他哲学：人这

2023-08-08
原来这车还能更好看！实拍新款标致508L

2023-08-08

Copyright © 2015-2022 起点纸业网版权所有备案号：皖ICP备2022009963号-12 联系邮箱： 39 60 29 14 2@qq.com