微软的Azure和研究团队正在合作开发"Singularity"AI基础设施服务。

微软的Azure和Research团队正在共同努力构建一项新的AI基础设施服务,代号为"Singularity"。Singularity团队正在努力构建微软在其为该集团发布的一些招聘启事中描述的"从头开始的一种新的AI平台服务,它将成为微软内外AI的主要驱动力。

参与该项目的一组人发表了一篇题为"奇点:AI工作负载的行星尺度,抢占和弹性调度"的论文,其中提供了有关奇点工作的技术细节。Singularity服务旨在为数据科学家和AI从业者提供一种在Microsoft提供的专门为AI构建的分布式基础架构服务上构建,扩展,实验和迭代其模型的方法。

新发表的论文中列出的作者包括Azure首席技术官Mark Russinovich;合伙人架构师 Rimma Nehme,曾在 Azure Cosmos DB 工作,直到 2019 年迁移到 Azure 从事 AI 和深度学习工作;和技术研究员Dharma Shukla。来自该论文:"

Singularity的核心是一种新颖的工作负载感知调度器,它可以透明地抢占和弹性扩展深度学习工作负载,从而在全球加速器(例如GPU,FPGA)中提高利用率,而不会影响其正确性或性能。

微软官员此前曾讨论过将FPGA或现场可编程门阵列作为服务提供给客户的计划。2018年,微软公开了其"Project Brainwave"工作,该工作旨在在Azure中提供快速的AI处理。当时,微软在云中提供了由Brainwave提供支持的Azure机器学习硬件加速模型的预览版 - 这是向客户提供AI工作负载FPGA处理的第一步。

我猜想,Singularity是将Brainwave转变为商业服务的下一个阶段。我已经要求微软对此发表评论。我还问过微软计划何时以及如何将Singularity转变为商业服务。我将用我得到的任何信息更新这篇文章。

2019年,微软在OpenAI上投资了10亿美元,官员们在一年后宣布,他们已经与OpenAI合作并专门为OpenAI建造了第五大最强大的公开记录超级计算机。

虽然微软建造的AI超级计算机专门用于OpenAI,但微软官员一直表示,他们计划通过Azure AI服务和GitHub提供该公司的大型AI模型和训练优化工具。微软还在其"Azure AI"旗帜下向不需要专用超级计算机的客户提供各种加速器和服务。2021年11月,微软宣布将在Azure中推出80GB NVIDIA A100 GPU,以扩大其AI超级计算机阵容。

微软的观察者可能还记得,微软之前在另一个微软研究院项目中使用了Singularity代号。Singularity是一个微内核操作系统,以及一组完全在托管代码中开发的相关工具和库。Singularity不是基于Windows;它是从头开始编写的概念验证。Singularity最终催生和/或影响了微软的其他几个操作系统研究项目,包括Barrelfish,Helios,Midori和Drawbridge。

同样值得注意的是,微软并不是唯一一家试图在内部和客户中提供人工智能超级计算功能的科技公司。Meta也在做同样的事情,不出所料,它的工作已经将其工作定位为解锁Metaverse的关键。

关键词: 微软公开了其ldquo奇点rdquo人工智能基础设施服务的细节