连载之(3)美国斯坦福大学:2023 年 人工智能指数报告
原创 2023-04-23 15:22 小桐 来源:AGV网1.3人工智能会议
会议出席
经过一段时间的出席人数增加后,AIIndex 收集数据的会议的总出席人数在 2021 年和 2022 年再次下降(图 1.3.1)。这种下降可能是由于许多会议在之后恢复了混合或面对面的形式。 2020年和2021年完全虚拟。例如,国际人工智能联合会议(IJCAI)和国际知识表示与推理原则会议(KR)均严格以现场形式举行。神经信息处理系统(NeurIPS)仍然是其中之一 参加人数最多的会议,约有 15,530 人参加(图 1.3.2)。参加人数一年增幅最大的会议是国际机器人与自动化大会 (ICRA),从 2021 年的 1,000 人增加到 2022 年的 8,008 人。
2010-22年人工智能会议的与会者人数
图 1.3.1
2010-22年出席大型会议
图 1.3.2
2010-22年出席小型会议
图 1.3.3
GitHub是一个基于web的平台,个人和编码团队可以在各种代码存储库上托管、审查和协作。GitHub被软件开发人员广泛用于管理和共享代码、在各种项目上进行协作,并支持开源软件。本小节使用了GitHub和经合组织提供的数据。人工智能政策天文台。这些趋势可以作为学术出版物数据没有捕捉到的开源人工智能软件世界中发生的一些更广泛的趋势的一个代理。
1.4开源人工智能软件
项目
GitHub 项目是文件的集合,可以包括构成软件项目的源代码、文档、配置文件和图像。 自 2011 年以来,与人工智能相关的 GitHub 项目总数稳步增长,从 2011 年的 1,536 个增长到 2022 年的 347,934 个。
2011-22年GitHub AI项目数量
图 1.4.1
截至2022年,很大一部分GitHub AI项目是由印度的软件开发者贡献的(24.2%)(图1.4.2)。其次最代表性的地理区域是欧盟和英国(17.3%),然后是美国(14.0%)。自2016年以来,美国GitHub人工智能项目的份额一直在稳步下降。
2011-22年GitHub AI项目(总%)按地理区域划分
图 1.4.2
“点赞”
GitHub用户可以通过“主演”它来收藏或保存一个感兴趣的存储库。GitHub的明星类似于社交媒体平台上的“点赞”,表示对某个开源项目的支持。一些最突出的GitHub存储库包括张量流、OpenCV、Keras和PyTorch等库,这些库被AI编码社区的软件开发人员广泛使用。图1.4.3显示了属于不同地理区域所有者的项目的累计星数。截至2022年,来自美国的GitHub AI项目获得的星数最多,其次是欧盟和英国,然后是中国。在许多地理区域,新出现的GitHub恒星的总数在过去几年中已经趋于稳定。
2011-22年按地理区域划分的GitHub“点赞”数量
图 1.4.3
第二章:技术性能要求
要点
今年的技术性能章节主要分析了2022年人工智能的技术进展。在以前的报告的基础上,本章记录了在计算机视觉、语言、语音、强化学习和硬件方面的进展。此外,今年本章将对人工智能对环境造成的影响进行分析,讨论人工智能促进科学进步的方式,以及对最近一些最重要的人工智能发展的时间线式概述。
章节亮点
在传统的基准测试上的性能饱和;人工智能继续发布最先进的结果,但在许多基准测试上的同比改善仍然很少。此外,达到基准饱和度的速度也在增加。然而,新的、更全面的基准测试套件,如BIG-bench和HELM正在发布。
生成性人工智能进入了公众的意识;2022年,DALL-E 2和稳定扩散等文本到图像模型发布,make-视频这样的文本到视频系统,以及ChatGPT这样的聊天机器人。尽管如此,这些系统还是容易产生幻觉,自信地输出不连贯或不真实的反应,这使得很难在关键的应用中依赖它们。
人工智能系统变得更加灵活;传统上,人工智能系统在狭窄的任务上表现良好,但在更广泛的任务中却很困难。最近发布的模型挑战了这一趋势;BEiT-3、PaLI和Gato等地,单一的人工智能系统越来越能够导航多个任务(例如,视觉、语言)。
有能力的语言模型仍然难以进行推理;语言模型继续提高它们的生成能力,但新的研究表明,它们仍然难以完成复杂的规划任务。
人工智能既帮助又破坏了环境;新的研究表明,人工智能系统可能会产生严重的环境影响。根据Luccioni等人,2022年,布鲁姆的训练运行排放的碳比从纽约到旧金山的单程旅行者多25倍。尽管如此,像空气冷却器这样的新的强化学习模型表明,人工智能系统可以用于优化能源使用。
世界上最好的新科学家……人工智能吗?人工智能模型开始迅速加速科学进步,并于2022年被用于帮助氢气融合,提高基质操作的效率,并产生新的抗体。
人工智能开始构建更好的人工智能;英伟达使用了一种人工智能强化学习代理来改进为人工智能系统提供动力的芯片的设计。类似地,谷歌最近使用它的一种语言模型PaLM提出了改进相同模型的方法。自我改进的人工智能学习将加速人工智能的进步。
2.12022年的新进展:时间轴
2022年2月2日 DeepMind发布字母代码
这是一个在竞争水平上编写计算机程序的人工智能系统,在人类编程竞赛中排名前54%。这代表了对人工智能传统上一直挣扎的更复杂的问题解决任务的改进。
图2.1.1
2022年2月16日 DeepMind训练强化学习代理来控制托卡马克(环磁机)中的核聚变等离子体
图2.1.2
2022年3月10日 IndicNLG 对印度语言的自然语言生成进行基准测试
一个国际研究团体启动了IndicNLG,这是一个用于11种印度语言自然语言生成的数据集。IndicNLG的创建增加了人工智能系统在更多样化、非英语语言环境中生成语言的潜力。
图2.1.3
2022年3月24日 Meta AI(脸书之元宇宙人工智能)发布了make-scene(“制作场景”)
make-scene(“制作场景”)是一种文本到图像的人工智能模型,用户可以通过文本生成图像。make-scene是2022年发布的众多文本到图像的模型之一。
图2.1.4
2022年4月5日 谷歌发布PaLM
谷歌的人工智能团队训练了世界上最大的语言模型之一--PaLM。由5400亿个参数组成的PaLM强化了这样一种信念,即研究人员可以通过在更多数据上训练大型语言模型来提高它们的性能。
图2.1.5
2022年4月13日 OpenAI发布DALL-E 2
DALL-E 2是一个文本到图像的人工智能系统,可以从文本描述中创建真实的艺术和图像,它向公众发布,引发了生成式人工智能热潮。
图2.1.6
2022年5月12日 DeepMind启动Gato
Gato是一种新的强化学习代理,能够完成广泛的任务,如机器人操作、游戏玩、图像字幕和自然语言生成。这些模型的发布表明,人工智能系统在泛化方面正变得更好。
图2.1.7
2022年5月23日 谷歌发布Imagen
Imagen是一种文本到图像的扩散模型,能够产生具有高度的摄影真实感的图像。Imagen的发布也伴随着DrawBench的发布,这是一个具有挑战性的文本到图像系统的新基准测试。
图2.1.8
2022年6月9日 来自132个机构的442名作者联合起来推出“BIG-bench”项目
为了更好地挑战能力日益强大的大型语言模型,一个由来自132个机构的442名作者组成的团队推出了超越模仿游戏基准测试(“BIG-bench”)。该基准测试包括204个任务,这些任务的范围包括语言学、儿童发展、数学、常识性推理、生物学、物理学、社会偏见和软件开发。
图2.1.9
2022年6月21日 GitHub为个人开发者提供了一种基于订阅的副驾驶服务
副驾驶是一个生成式人工智能系统,能够将自然语言提示转换为跨多种语言的编码建议。类似的系统包括OpenAI的法本和销售部队的CodeGen。调查显示,副驾驶可以让程序员更有效率,更少沮丧。
图2.1.10
2022年7月8日 英伟达利用强化学习来设计性能更好的图形处理器
英伟达利用其人工智能系统来提高其最新的H100级GPU芯片的性能。GPU对人工智能培训至关重要,这是人工智能如何开始开发出更好的人工智能的一个例子。
图2.1.11
2022年7月8日 Meta发布“No Language Left Behind”
“No Language Left Behind”(NLLB)是一系列可以翻译200种不同语言的模型。NLLB是第一批能够在Kamba语和老挝语等各种低资源语言中表现良好的系统之一。
图2.1.12
2022年8月4日 清华大学的研究人员推出了GLM-130B
清华大学的中国研究人员发布了GLM-130B,这是一种大型语言模型,优于mate的OPT、Hugging Face’s BLOOM
和OpenAI的原始GPT-3。
图2.1.13
2022年8月22日 Stability AI 发布Stable Diffusion
稳定扩散(Stable Diffusion )是一个开源的基于文本到图像扩散的模型,这意味着用户可以自由地使用模型的权重来生成自己的图像。稳定扩散是根据人类创建的现有图像进行训练的,没有给予任何认可或承认,这给图像生成器的伦理使用留下了一个悬而未决的问题。
图2.1.14
2022年9月21日 OpenAI推出Whisper
Whisper是一个大规模的语音识别系统,以大约70万小时的音频数据进行训练,能够在各种语音识别任务上具有可观的性能。耳语既不需要有监督的预训练,也不需要无监督的微调训练,但能够仅仅通过增加训练数据来获得强大的性能,这一事实进一步验证了越来越缩放人工智能模型的方法。
图2.1.15
2022年9月29日Meta 发布 Make-A-Video
Make-A-Video是一个允许用户从短文描述中创建视频的系统。视频的质量较高,再次证明了缩放方法的有效性。
图2.1.16
2022年10月5日DeepMind 启动 AlphaTensor
AlphaTensor(阿尔法张量)是一个基于人工智能强化学习的系统,能够发现新的和有效的矩阵操作算法。矩阵操纵对于广泛的数字实践是必不可少的,也是研究人员几十年来一直试图提高效率的过程。
图2.1.17
2022年10月22日 谷歌使用PaLM来改进PaLM的推理能力
谷歌的研究人员使用他们现有的语言模型之一,PaLM,来改进同一模型的推理能力。这一过程是人工智能系统利用自身知识进行改进的另一个例子。
图2.1.18
2022年11月9日 国际研究小组发布“BLOOM”
由来自全球各地的100多名研究人员合作开发了一种名为BLOOM的开放获取语言模型。BLOOM的公开发布让人印象深刻,并进一步促进了在人工智能研究方面的国际合作的可能性。
图2.1.19
2022年11月16日 斯坦福大学的研究人员发布HELM
作为根据更统一的标准来判断新的语言模型的一部分,斯坦福大学的研究人员为大型语言模型开发了一种新的基准测试方法,称为语言模型的整体评估(HELM)。HELM的推出证明了人工智能社区试图围绕日益强大、有能力和有影响力的大型语言模型开发透明度的证据。
图2.1.20
2022年11月22日mate 发布CICERO
CICERO是第一个在人类参与的外交游戏中排名前10%的人工智能。CICERO的发布表明,人工智能系统在战略推理方面得到了改进,这是他们传统上一直在挣扎的领域,并且能够有效地说服人类实现他们的目标。
图2.1.21
2022年11月30日OpenAI推出ChatGPT
ChatGPT是一个令人印象深刻的、可公开使用的聊天机器人,能够写大学水平的论文。在推出几个月后,ChatGPT的月活跃用户达到了1亿,使其成为历史上增长最快的消费者应用程序。ChatGPT的发布结束了生成性人工智能成为时代精神的一部分的一年,并提出了对人工智能将对人类未来产生的影响的质疑。
图2.1.21