网站首页

b体育产品中心

智能终端处理器 智能云服务器 软件开发环境

b体育新闻中心

关于b体育

公司概况 核心优势 核心团队 发展历程

联系我们b体育

官方微信

官方微博

b体育·(中国)官方入口在线登录网站 > b体育产品中心 > 智能终端处理器

一文盘点2023人工智B体育能进展不止大模型而已

发布时间：2023-11-17 12:13浏览次数：来源于：网络

　　B体育来来来，畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。
　　RLHF今年虽然爆火，但实打实用到的模型并不多，现在还出现了替代方案，有望从开源界“出圈”；
　　除了大语言模型，Sebastian Raschka还根据CVPR 2023打包了计算机视觉进展，最后还讲到了AI当前的一些局限性、以及对2024年的技术预测。
　　GPT-4是由16个子模块构成的混合专家（MoE）模型，每个子模块拥有高达1110亿参数……
　　Meta亦是如此，在第一篇Llama论文中详细阐述了训练数据集，但Llama 2完全没提相关内容。
　　即便如此，Llama 2已经是一众大模型中最公开的了。斯坦福大学最近发布了一项关于大模型透明度指数的研究，Llama 2得分54，透明度排第一，GPT-4得分48，排第三。
　　虽然模型细节算是公司商业机密，但Sebastian Raschka认为这种趋势还是值得关注，因为它似乎会在2024持续。
　　一些编程工具，如GitHub Copilot，也在不断增加上下文窗口长度。
　　这些模型研究重点之一，是用小于100B参数的“小模型”对标GPT-4的文本处理能力。
　　Sebastian Raschka认为，开源模型的下一个突破点不一定是“更大”，或许MoE也可能把开源模型提升到新的高度。
　　但也有值得关注的开源多模态大模型，例如10月17日刚发布的Fuyu-8B。
　　Fuyu-8B在处理图像时，直接将图像切成小块，然后把这些小块输入到一个线性投影层，在这一层里面自动学习小块的向量表示，避免用额外的预训练编码器来提取图像特征，简化了模型架构和训练过程。
　　RLHF（人类反馈强化学习）是大模型最受关注的技术之一，InstructGPT、ChatGPT、Llama 2中都用到了这种训练方法。
　　但分析公司stateof.ai发布的“2023AI现状报告”中显示，它还没有被广泛运用，可能是因为实现起来比较复杂。目前大多开源项目仍然专注于指令微调。
　　DPO利用奖励函数到最优策略之间的映射关系，把强化学习问题转变成仅需要训练策略网络来拟合参考数据的问题。
　　最近首个用DPO方法训练的开源大模型已出现，来自HuggingFace H4团队打造的Zephyr-7B，它在一些任务上已超过用RLHF训练的Llama 2-70B：
　　今年还出现了一些Transformer的替代方案，比如循环RWKV、卷积Hyena。
　　这些新的框架主要是用来提高模型效率，当然基于Transformer架构的大语言模型仍是主流。
　　大模型除了用来处理文本，也逐渐被用到提升生产力（Microsoft全家桶）和写代码（GitHub Copilot）等场景中。
　　Ark-Invest曾发布报告预测，编程助手能让编码任务的完成时间缩短约55%。
　　这对Stack Overflow（全球知名开发者问答网站）等平台意味着什么？
　　同样是“2023 AI现状报告”中，一张StackOverflow与GitHub的网站流量对比图，可以说明一些问题：
　　不过对于AI的“另半边天”计算机视觉而言，在2023年，这个领域也有许多不可忽视的新进展。
　　今年大家都在重点关注大语言模型，但实际上，计算机视觉领域也取得了不少进展，从计算机视觉顶会CVPR 2023中就可以窥见一斑。
　　今年CVPR 2023共接收了2359篇论文，大多数研究都集中于以下4个主题，Sebastian Raschka逐个进行了介绍。
　　视觉Transformer原理与语言Transformer类似，是在多头注意力块中使用相同的自注意力机制。
　　不同的是，视觉Transformer不标记单词，而是标记图像，同样能取得不错的效果，但它一直有一个局限：相对资源密集且效率低于CNN，导致实际应用受阻。
　　主要创新点有两个，一是全连接层之间的单个内存绑定多头自注意力模块，二是级联群注意力。
　　模型训练时，逐渐往训练数据中掺入噪声，直到变成纯噪声。然后再训练一个神经网络，让模型反向学习去噪，从噪声中合成数据。
　　研究人员评估了新架构，在条件图像生成任务中，新的U-ViT扩散模型可与最好的GAN相媲美，优于其它扩散模型；在文本到图像生成方面，它优于在同一数据集上训练的其它模型。
　　3D重建是计算机视觉的研究重点之一，在3D扫描、虚拟现实、增强现实、电影和视频游戏中的3D建模和动作捕捉中都有运用B体育。
　　今年SIGGRAPH 2023最佳论文中，有一篇被称为三维重建领域“爆炸性”新技术——Gaussian Splatting（高斯溅射）。
　　一举突破NeRF与之前的渲染引擎难兼容、需要专门设计硬件、渲染开销的老大难问题。
　　这种方法的核心是使用3D高斯作为场景表示，通过优化各向异性协方差矩阵来表示复杂场景。
　　论文还提出了交错的3D高斯参数优化和自适应密度控制方法，设计了快速、可微分的GPU栅格化方法，支持各向异性斑点，并实现快速反向传播，可以达到高质量的新视图合成，而且实现了首个1080p分辨率下的实时渲染。
　　4D Gaussian Splatting实现了实时的动态场景渲染，同时可保持高效的训练和存储效率。
　　NeRF主要是通过训练神经网络来学习场景中每个点的颜色和密度，然后使用这些信息来生成逼线D场景渲染图像。
　　但NeRF有一个缺点是：有光泽的物体通常看不清，半透明物体的颜色也很模糊。
　　这两个任务还是有区别的，目标检测是关于预测边界框和相关标签，分割是对每个像素进行分类B体育，来区分前景和背景。
　　DINO是一种带有改进去噪锚盒的DETRB体育，而DETR是Facebook AI提出的一种端到端目标检测模型，它使用了Transformer架构，提供了一种更简单灵活的目标检测方法。
　　虽然AI领域这一年来取得了诸多进展，但依旧存在一些局限性，主要包括以下几点：
　　今年出现了不少解决方案，包括RLHF和英伟达推出的NeMO Guardrails等，但这些方案要么难实施，要么处理得不到位。
　　目前为止B体育B体育，还没有找到一个可靠的方法，既能解决这一问题又不损害大模型的正向性能。
　　各大模型厂商没少被起诉，之前开源数据集Books3也因侵权问题惨遭下架，Llama、GPT-J等都用它训练过。
　　虽然通过询问人类偏好来评估大模型的效果是一个普遍的方法，但这种方式较为复杂。
　　生成式AI还在探索阶段，虽然无论是文本还是图像生成工具，在特定场景下确实能给人们提供帮助。
　　但这些工具是否真的能给公司带来收益，尤其是在高昂的运行成本面前，业界还在激烈讨论。
　　有报道称，OpenAI去年的运营亏损了5.4亿美元。直到最近又有消息指出，OpenAI现在每月能赚取8000万美元，有望弥补或甚至超出它的运营开支。
　　这个问题由来已久，PS等工具也能，而AI技术简易快捷，正在将此现象推向一个新的高度。
　　目前也有其它AI系统尝试自动识别AI产生的内容，但无论是文本、图片还是视频，这些系统的可靠性都不高。
　　涉及版权等争议，不少公司（Twitter/X、Reddit等）关闭了免费的API接入点，这样做既是为了增加收益，也是为了阻止数据采集器搜集平台数据用于AI训练。
　　之后一个好的方法可能是，建立一个众包数据集的平台，编写、收集和整理那些已经明确允许用于LLM训练的数据集。
　　展望2024，Sebastian Raschka认为大语言模型会在计算机科学之外的STEM研究领域发挥更大影响。
　　另一方面，由于高性能GPU紧缺，各大公司纷纷开发定制的AI芯片，问题关键在于怎样让这些硬件全面、稳定支持主流深度学习框架。
　　开源界，更多MoE（专家模型）也值得期待，共同创建数据集、DPO在开源模型中取代传统监督式微调也都是未来式。
　　Sebastian Raschka于2017年获得密歇根州立大学博士学位，曾是威斯康星大学麦迪逊分校统计学助理教授。
　　他经常在自己的AI博客Ahead of AI中总结AI领域的各项研究，已揽获粉丝。

下一篇：人工智能产业迎来发展新机遇(产经观察·构建新引擎制胜新赛道④)B体育
上一篇：微软重塑其人工智能愿景：Bing ChaB体育t 更名为 Copilot 以更好地与hatGPT 竞争

咨询我们

输入您的疑问及需求发送邮箱给我们

相关新闻推荐

人工智能产业迎来发展新机遇(产经观察·构 2023-11-17

一文盘点2023人工智B体育能进展不止大 2023-11-17

微软重塑其人工智能愿景：Bing Cha 2023-11-17

B体育人工智能引领时尚业新风潮科技创新世 2023-11-17

行业大咖齐聚2023数B体育智科技沙龙 2023-11-17

柳州市人工B体育智能教育成果展示暨WRC 2023-11-17

简历投递

admin@jlhaixin.com

商务合作

admin@jlhaixin.com

媒体垂询

admin@jlhaixin.com

b体育产品中心: 智能终端处理器智能云服务器软件开发环境

b体育新闻中心

关于b体育: 公司概况核心优势核心团队发展历程

关注腾讯

微信二维码

微博二维码

Copyright © 2002-2023 b体育·(中国)官方入口在线登录网站版权所有备案号：吉ICP备2021007224号