网站首页

b体育产品中心

智能终端处理器 智能云服务器 软件开发环境

b体育新闻中心

关于b体育

公司概况 核心优势 核心团队 发展历程

联系我们b体育

官方微信 官方微博
b体育·(中国)官方入口在线登录网站 > b体育产品中心 > 智能终端处理器

B体育解释生成式人工智能

发布时间:2023-11-28 23:39浏览次数: 来源于:网络

  B体育生成人工智能(Generative AI)这一年来的爆发引起了广泛关注,像大语言模型 ChatGPT 这样强大的生成式人工智能系统是如何工作的,它们与其他类型的人工智能有何不同?MIT (麻省理工学院) 新闻办公室的专职作者Adam Zewe最近通过对MIT人工智能领域的几位教授的访谈,对生成式人工智能的概念及其演进进行梳理,并在MIT News 上发表了“Explained: Generative AI(解释生成式AI)” 。文章指出生成式AI并非是全新的技术,从早期的马尔可夫链到如今的生成对抗网络(GAN)和Transformer架构,深度学习模型的复杂性不断提升。生成AI将输入转换为标记的能力使其在合成图像B体育、设计蛋白质结构等领域发挥了巨大作用。然而,实施这些模型也带来了一系列问题,如工人被替代、潜在的偏见传递、抄袭和版权问题。一些学者认为生成AI可能改变多个领域的经济学,尤其在创建和发展更智能的智能体方面。尽管存在挑战和风险,但这一技术仍然被认为是推动创造力、改变工作方式的潜在工具。我们将该内容编译出来和各位客户、合作伙伴朋友分享

  快速浏览一下头条新闻就会发现,如今生成人工智能似乎无处不在。事实上,其中一些标题实际上可能是由生成人工智能(如OpenAI的ChatGPT)撰写的,这是一个聊天机器人,展示了一种近乎人类写作的不可思议的能力。

  在过去几年生成人工智能的兴起之前,当人们谈论人工智能时,通常是在谈论能够根据数据进行预测的机器学习模型。例如,这些模型通过数百万个示例进行训练,以预测某个X射线是否显示出肿瘤的迹象,或者某个借款人是否可能违约。

  生成人工智能可以被看作是一种机器学习模型,它被训练用于创建新数据,而不是对特定数据集进行预测。生成式人工智能系统能够学习生成更多看起来像它所训练的数据的对象。

  麻省理工学院电气工程和计算机科学副教授,计算机科学与人工智能实验室(CSAIL)成员Phillip Isola说:“当涉及到生成人工智能和其他类型的人工智能的实际机制时,区分可能会有点模糊。通常,相同的算法可以同时用于两者,”

  尽管ChatGPT及其类似产品发布时引起了很大轰动,但这项技术本身并不是全新的。这些强大的机器学习模型借鉴了超过50年的研究和计算进展。

  生成人工智能的早期例子是一种更简单的模型,称为马尔可夫链。这项技术以安德烈·马尔可夫(Andrey Markov)命名,他是一位俄罗斯数学家,于1906年引入了这种统计方法来模拟随机过程的行为。在机器学习中,马尔可夫模型长期以来一直用于下一个单词的预测任务,例如电子邮件程序中的自动完成功能。

  在文本预测中,马尔可夫模型通过查看前一个单词或前几个单词来生成句子中的下一个单词。但由于这些简单模型只能回望到那么远,它们在生成可信文本方面并不擅长,麻省理工学院电气工程和计算机科学Tommi Jaakkola教授解释说,他也是CSAIL和数据、系统与社会研究所(IDSS)的成员。

  “我们在过去的十年之前就已经开始生成东西,但这里的主要区别在于我们可以生成的对象的复杂性以及我们可以训练这些模型的规模,”他解释说。

  就在几年前,研究人员往往专注于找到一种机器学习算法,以最好地利用特定数据集。但这个焦点发生了一些变化,许多研究人员现在使用更大的数据集,可能包含数亿甚至数十亿的数据点,以训练能够取得令人印象深刻结果的模型B体育。

  ChatGPT及其类似系统的基础模型的工作方式与马尔可夫模型非常相似。但一个重大区别在于ChatGPT更大、更复杂,具有数十亿个参数。而且它经过了大量的数据训练,本例中主要是互联网上的大量公开文本。

  在这庞大的文本语料库中,单词和句子以特定的依赖关系序列出现。这种重复帮助模型理解如何将文本划分为具有一定可预测性的统计块。它学习这些文本块的模式,并利用这一知识提出可能出现的下一步。

  尽管更大的数据集是导致生成人工智能蓬勃发展的一个催化剂,但各种重大研究进展也导致了更复杂的深度学习架构。

  在2014年,蒙特利尔大学的研究人员提出了一种称为生成对抗网络(GAN)的机器学习架构。GAN使用两个协同工作的模型:一个学习生成目标输出(如图像),另一个学习区分真实数据和生成器输出。生成器试图欺骗鉴别器B体育,并在此过程中学会生成更逼真的输出。图像生成器StyleGAN就是基于这类模型的。

  一年后,斯坦福大学和加利福尼亚大学伯克利分校的研究人员引入了扩散模型。通过迭代地改进其输出,这些模型学会生成新的数据样本,这些样本类似于训练数据集中的样本,并被用于创建看起来逼真的图像。扩散模型是文本到图像生成系统稳定扩散的核心。

  2017年,谷歌的研究人员推出了Transformer架构,该架构后来被用于开发大型语言模型,如驱动ChatGPT的模型。在自然语言处理中,Transformer将文本语料库中的每个单词编码为Token,然后生成一个关注图,捕捉每个Token与所有其它Tokens的关系B体育。这个关注图帮助Transformer在生成新文本时理解上下文。

  各种方法的共同之处在于它们将输入转换为一组Tokens,这些Tokens是数据块的数值表示。只要您的数据可以转换为这种标准的标记格式,理论上,您可以应用这些方法生成看起来相似的新数据。

  Isola表示:“您的效果可能有所不同,这取决于您的数据有多嘈杂以及信号有多难提取,但它确实越来越接近通用CPU可以接收任何类型数据并以统一方式开始处理的方式。” 这为生成人工智能开辟了大量的应用领域。

  例如,Isola的研究团队正在使用生成人工智能创建合成图像数据,这些数据可以用于训练另一个智能系统,例如通过教计算机视觉模型如何识别物体。

  Jaakkola 的研究团队正在使用生成人工智能设计新颖的蛋白质结构或指定新材料的有效晶体结构。他解释说,就像生成模型学习语言的依赖关系一样,如果向其展示晶体结构,它可以学习使结构稳定且可实现的关系B体育。

  麻省理工学院电气工程和计算机科学系和IDSS和信息与决策系统实验室的成员 Andrew和Erna Viterbi 教授Devavrat Shah表示,尽管生成模型可以实现令人难以置信的结果,但它们并不是所有类型数据的最佳选择。对于涉及对结构化数据进行预测的任务,例如电子表格中的表格数据,生成人工智能模型往往被传统的机器学习方法超越。

  Shah进一步表示:“在我看来,它们的最大价值在于成为与人类友好的机器的出色接口。以前,人类必须用机器的语言与机器交流才能实现某些事情。现在,这个接口已经找到了与人类和机器交流的方法。”

  生成人工智能聊天机器人现在正在呼叫中心中用于回答人类顾客的问题,但这个应用凸显了实施这些模型可能存在的一个潜在问题 — 工人被替代。

  此外,生成人工智能可能继承和传播存在于训练数据中的偏见,或者放大仇恨言论和虚假陈述。这些模型有能力抄袭,并且可以生成看起来像是由特定人类创作者制作的内容,这引发了潜在的版权问题。

  另一方面,Shah提出,生成人工智能可以赋予艺术家们力量,他们可以使用生成工具帮助他们制作可能在其他情况下无法制作的创意内容。

  Isola看到生成人工智能的一个有希望的未来方向是在制造领域的应用。他认为,与其让一个模型制作一张椅子的图像,也许它可以生成一张可以生产的椅子计划。

  Isola表示:“这些模型的工作方式与我们认为人脑的工作方式有所不同,但我认为也存在相似之处。我们有能力在脑海中思考和梦想,提出有趣的想法或计划,我认为生成人工智能是赋予代理执行这些任务的工具之一。”

  源于硅谷、扎根中国,上海殷泊信息科技有限公司 (MoPaaS) 是中国领先的人工智能(AI)平台和服务提供商,为用户的数字转型、智能升级和融合创新直接赋能。针对中国AI应用和工程市场的需求,基于自主的智能云平台专利技术,MoPaaS 在业界率先推出新一代开放的AI平台为加速客户AI技术创新和应用落地提供高效的算力优化和规模化AI模型开发、部署和运维 (ModelOps) 能力和服务;特别是针对企业应用场景,提供包括大模型迁移适配、提示工程以及部署推理的端到端 LLMOps方案。MoPaaS AI平台已经服务在工业制造、能源交通、互联网、医疗卫生、金融技术、教学科研、政府等行业超过300家国内外满意的客户的AI技术研发、人才培养和应用落地工程需求。MoPaaS致力打造全方位开放的AI技术和应用生态。MoPaaS 被Forrester评为中国企业级云平台市场的卓越表现者 (Strong Performer)。

下一篇:茉颜化妆品个性化服B体育务人工智能数字系统发布推动中国化妆品个性化服务市场落地提速
上一篇:B体育人工智能专业是学什么的?

咨询我们

输入您的疑问及需求发送邮箱给我们