网站首页

ng体育产品中心

智能终端处理器 智能云服务器 软件开发环境

ng体育新闻中心

关于ng体育

公司概况 核心优势 核心团队 发展历程

联系我们ng体育

官方微信 官方微博
ng体育 > ng体育产品中心 > 智能终端处理器

NG体育官网app下载57%互联网内容或成人工智能生成的次品?

发布时间:2024-09-11 03:15浏览次数: 来源于:网络

  NG体育娱乐不只是您——搜索结果确实是越来越差了。亚马逊网络服务(AWS)的研究人员开展了一项研究,表明如今互联网上 57%的内容要么是由人工智能生成的,要么是使用人工智能算法翻译的。

  这项题为 《网络中惊人数量的内容为机器翻译:来自多向并行性的洞察》 的研究认为NG体育官网app下载,低成本的机器翻译(MT)是罪魁祸首,它获取给定的一段内容NG体育官网app下载,并以多种语言重新表述。研究人员在研究中写道:“机器生成的多向并行翻译不仅在有机器翻译可用的低资源语言的网络翻译内容总量中占主导地位;在这些语言的网络总内容中也占很大一部分。”

  他们还发现,与以单一语言发布的内容相比,在哪些内容会被机器翻译成多种语言这方面存在选择偏差的证据。研究人员写道:“与翻译成单一语言的内容相比NG体育官网app下载,这种内容更短、更可预测,并且主题分布不同。”

  更有甚者,互联网上人工智能生成内容的数量不断增加,再加上与对人工智能工具编辑和处理这些内容的依赖程度不断提高相结合,可能会导致一种被称为模型崩溃的现象,并且已然在降低整个网络的搜索结果质量。鉴于像ChatGPT、Gemini和Claude这样的前沿人工智能模型依赖于大量的训练数据,而这些数据只能通过抓取公共网络来获取(无论是否侵犯版权),公共网络充斥着人工智能生成的、而且往往不准确的内容,可能会严重降低它们的性能。

  “模型崩溃发生得如此之快且如此难以捉摸,这实在令人惊讶,”牛津大学的伊利亚·舒迈洛夫博士告诉Windows Central。“起初,它影响到少数数据——代表性很差的数据。接着,它会影响输出的多样性,并且方差会降低。有时,您会观察到多数数据有小幅改进,而这掩盖了少数数据在性能上的退化。模型崩溃可能会产生严重的后果。”

  研究人员让专业语言学家将从 20 个类别中随机选取的 10,000 个英语句子进行分类,以此证明了这些后果。研究人员观察到,“在比较双向和 8 向以上的并行数据(即语言翻译的数量)时,主题的分布出现了巨大变化,‘对话和观点’主题从已发表的 22.5%增加到 40.1%”。

  这表明被翻译成多种语言的数据类型存在选择偏差,其“很有可能”来自“对话和观点”主题。

  此外,研究人员发现,“高度多向并行翻译的质量显著更低(比双向并行翻译低 6.2 分,根据 Comet 质量评估)。”当研究人员审核了 100 个高度多向并行的句子(即那些被翻译成八种及以上语言的句子)时,他们发现“绝大多数”来自内容农场,其文章“我们认为其质量低下NG体育官网app下载,几乎无需或根本无需专业知识,或者几乎无需付出努力就能创作出来。”

  这当然有助于解释为何 OpenAI 的首席执行官山姆·奥特曼一直强调其 ‘不可能’在无法免费获取受版权保护作品的情况下制造出像 ChatGPT 这样的工具。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  朗尼克:不戴眼镜也能看出曼联问题所在NG体育官网app下载,我两年前说过的线助攻!皇马中场新星身价暴涨3000万,挑战贝林厄姆,安帅头疼

  一图看懂苹果秋季新品发布会:iPhone 16新增“相机控制”键 5999元起售

  9月10日,弥勒幼儿园小朋友给老师送教师节礼物,老师给小朋友最温暖的拥抱!

下一篇:2024年人NG体育官网app下载工智能技术赋能网络安全应用测试结果发布
上一篇:NG体育专访上海电力大学副校长张波:目前大模型无法解决人工智能与电力系统“源网荷储”全面协同的难题

咨询我们

输入您的疑问及需求发送邮箱给我们