AI代理正在颠覆自动化:详解AI自动化市场全景图!

发布于: 雪球转发:0回复:0喜欢:0

内容导读

最近,美国投资机构Insight Partners在对研究人员、构建者、现有企业、企业用户的大量调研基础上,更新了《AI自动化市场全景图》,并对AI代理和自动化领域进行了全面的行业分析,内容非常精彩,智能小巨人科技进行了编译,Enjoy~

内容目录

AI自动化之旅的五大预测

自动化平台的演变历程

AI在自动化中的应用:不同的参与者,差异化的方法

RPA和任务自动化平台

代理自动化框架:Copilots/GPT和Agents

无代码代理/GPT

专家混合代理架构

企业部署自动化的注意事项

自动化构建者的注意事项

生成式AI代理用例

AI自动化市场全景图

关于我

智能小巨人科技是诞生于“AI数字化革命+全面注册制”背景下的精品咨询公司;核心产品服务:企业战略智库、科技战略咨询、资本品牌解决方案、创始人品牌打造等。

大模型与AI商业的共识与非共识

智能小巨人科技业务介绍

目前我们的实名社群矩阵已覆盖5000+高知人群,欢迎添加小智的企业微信,发送姓名、职务信息后为您匹配垂直社群!

为促进AI领域优秀创业团队与早期投资团队之间的顺畅链接,智能小巨人科技每个月均与知名投资机构联合举办项目推介闭门活动,欢迎AI早期优秀项目添加小智的企业微信,参与闭门路演!

入群/项目推介3部曲:

第1步:扫描二维码加小智企微

第2步:发送您的姓名、职务信息

第3步:匹配社群或登记路演项目

本文由智能小巨人科技编译,转载请按以下格式注明来源:

来源 | 王铮Silvia(ID:silviawz2023)

原文 | Insight Partners

AI自动化之旅的五大预测

人工智能工具的主流化点燃了知识工作者和消费者大幅提高生产力的希望。基于Transformer的大规模语言模型(LLMs)展示了正在用新的自动化方法转变工作流程的AI能力。

在下面的文章中,我们追溯了人工智能时代的自动化之旅,并深入研究了一些当前和不断发展的平台。

本文内容基于与研究人员、构建者、现有企业、企业用户的大量对话以及Insight内部对话。

让我们从一些关于我们如何看待自动化领域发展的预测开始:

从消费者到知识工作者,每个人都将拥有一个AI助手。

这将重新定义垂直应用程序、自动化平台和IT服务之间的传统界限,为企业家创造转型市场机会。

AI助手将采取不同形式,从现有平台的copilots到嵌入AI的应用程序,以及各种形式的AI代理。

Human-in-the-loop是部署生成式AI解决方案的操作框架。

如今,大多数用例都处于实验或早期生产阶段,重点是咨询和面向助手的工作流程。

LLMs还不能可预测地规划或推理,记忆和上下文等领域仍在研究中。在需要确定性执行的自动化平台中,LLMs被用于“设计时”的特定任务,而不是“运行时”。

自动化是一个难题,往往被低估。现有企业正在将AI添加到他们的剧本中,并利用深厚的经验来提高平台效率和用户体验。

最先进的LLM提供商正在添加代理建模、协作和对工具的访问,使用户能够快速构建AI代理 (GPTs)。

寻求突破的成长型企业需要通过基于独特数据集和简单用户体验的重新构想工作流程,提供差异化的客户价值。

使用AI部署自动化将采用“爬行、行走、运行”的方法,从简单的任务开始到更复杂的工作流程。

关键是要不断试验代理,了解AI功能真正增加价值的地方,并确保在自动化架构中包含适当的“脚手架”。随着AI模型能力的增长,规模可以逐渐向利用更多AI功能倾斜。

代码生成已成为开发基于GenAI的应用程序和代理自动化平台的基础要素。

代码有两个关键属性,使其成为理想的LLM函数:它是一种文本形式,并且具有明确定义的性能度量。编码copilots的初始版本如今已被广泛部署,我们现在正在看到成熟的AI支持开发平台。代码生成LLM将在Agent架构中发挥关键作用。

自动化平台的演变历程

自动化是人类不断的追求。每个知识工作者都熟悉“宏”——一个简单快捷方式,用于重复命令集,以增加生产力。

早期的自动化工作集中在报价到现金、工资单等工作流程上,工程师编写定制代码,将这些由静态规则和定义控制的工作流程拼接在一起。

四种第一代自动化平台

这些脆弱的早期方法推动了第一代自动化平台的发展,例如:

机器人流程自动化RPA)平台在自动执行重复性手动任务方面提供了最大价值。它们结合了预定义的工作流程库和低代码/无代码平台,以帮助用户构建自己的剧本。RPA平台已逐步融入AI/ML模型以扩展其能力。

像Workato这样的iPaaS平台首先创建了一个中间件层来集成数据、应用程序源和 API,以连接不同的资源。此数据层是自动化引擎的关键输入,创建干净的界面是自动化之旅的第一步。

低代码任务自动化平台为知识工作者和中小企业提供了一组预定义的集成和简单的用户界面,以自动化重复性任务。

各种垂直自动化方法专注于特定领域(如供应链、IT运营和开发人员生态系统)的工作流程,以及面向客户用例(如帮助台和客户服务团队)的聊天机器人。

虽然这些平台大大减少了重复性工作,但在实现自动化价值所需的引导阶段,使用预定义工作流程或咨询性推广的复杂性仍然存在。在企业的运营环境中,实施也容易受到变化的影响。

GenAI将加速自动化之旅

GenAI有可能加速这一自动化之旅,因为现有企业将引人注目的功能整合到他们的平台中,构建者正在试验新的架构,研究人员正在朝着自主通用人工智能(AGI)的最终目标迈进。

AI在自动化中的应用

不同的参与者,差异化的方法

在企业中进行自动化通常是一个复杂的任务,一些从业者甚至将其称为执行工作流程的多个元素的复杂编排。

随着GenAI的出现,现有企业和初创公司/成长型企业正在从不同的角度把握这一机遇。

RPA(机器人流程自动化)和任务自动化平台带来了显著的现有优势,拥有丰富的自动化工作流程库和与企业合作处理复杂工作流程的经验。GenAI提供了一个机会,可以通过简化的用户体验来解决脆性和引导问题。

Microsoft 365和Notion这样的应用平台将AI直接嵌入到平台和用户工作流程中,以帮助完成任务、提供建议并生成内容,以协助用户的工作流程。

AI原生方法从应用程序或工作流程开始,从第一性原理的角度重新构想它。

在应用方面,像Swimm和Writer这样的新一代生产力工具为GenAI转变工作方式提供了引人注目的展示。同样,来自销售、营销、法律和财务的许多垂直应用程序都使用GenAI功能来简化复杂的工作流程。

大型语言模型(LLM)提供商和初创企业/成长型企业正在采取一种新的方法,利用代理来利用GenAI功能来执行简单的工作流程。其他方法将LLM与所需的“脚手架”连接起来,以解决复杂的工作流和应用程序。

如今,随着构建者对模型、架构和工具进行试验,代理自动化是一个不断创新和研究的领域。

RPA和任务自动化平台

当前一代自动化平台已经积极地将更新的机器学习(ML)和人工智能(AI)模型作为其平台的一部分。

下面将简要介绍这些平台的现状:

用户界面连接到低代码工作室,用户可以在其中构建、部署和验证自动化。此接口还用于监控性能、跟踪每个策略的使用情况,甚至衡量他们所创建的自动化的投资回报率(ROI)。

iPaaS(集成平台即服务)作为中间件扮演着关键角色,汇集来自应用程序、数据存储和事件流的数据,以创建一个高效的自动化层接口。

自动化层使用来自工作室的模板,从预构建的playbook中选择,使用预测性机器学习(ML)模型和工具库,或执行新的工作流程。一些常见用例包括:

从图像或电子邮件等非结构化来源提取数据并填写表单。

观察人类(例如阅读屏幕、跟踪击键)以产生可重复的工作流程或建议潜在的新自动化。

从库存系统中提取数据,并使用ML模型进行预测。

现有企业正在使用GenAI来简化用户参与并提供新的工作流程,例如:

输入一个任务,如“销售前景开发”,副驾驶会翻译意图并在自动化库中搜索,为用户提供任务的起点。

创建一个表单,并根据预训练模板用适当的字段进行更新。填写从各种非结构化源提取的数据。

生成“低”代码以根据自然语言(NL)描述创建自动化,以验证输出和工作流描述。

AI工具通过帮助加速用户的价值实现时间,帮助这些平台建立其现有优势(客户和剧本)。更好的用户界面/用户体验有助于减少用户在复杂部署中通常需要的咨询引导启动。

随着大型语言模型(LLM)能力的演进,我们可以预期RPA(机器人流程自动化)和任务自动化也将在能力上增长。

代理自动化框架:

Copilots/GPT和Agents

首先,定义通常用于指代市场上GenAI用例的术语:

Copilot是基于genAI的现有应用程序和平台接口,为用户提供简化的方法来发现和增强其现有功能。

代理结合了大型语言模型(LLM)的能力、代码、数据源和用户界面来执行工作流程。构建者正在研究几种方法:

围绕LLM或为特定任务(代码生成)训练的 LLM 的简单包装器。

“专家混合”架构,带有“脚手架”,结合特定任务的代理、预定义的代码/工作流程和外部工具,重新构想应用程序或自动化复杂任务。

通用代理旨在通过简单描述来自动化任何任务。这仍然是研究人员的长期目标,需要持续的AI进步。

无代码代理/GPT

AI Agents最初是实验性的,Yohei Nakajima等构建者发布了Baby AGI等项目,这些项目基于原生LLM功能来运行简单的自动化。

LLM提供商现在提供引人注目的无代码平台,带有插件库,可以构建LLM的自定义版本。对于许多简单任务或一次性自动化,这可能是一个快速开始的方法。

在这种方法中,无代码控制台允许用户提供任务的详细描述,或使用少量示例提示引导LLM构建任务代理。LLM提供商现在提供与数据源和应用程序的集成,使代理能够利用外部数据作为其工作流程的一部分。

代理还可以使用专有数据,使用检索增强生成(RAG)等技术提高准确性。API引入了搜索等外部工具。

如上所示,高级代理可以围绕大型语言模型(LLM)的能力构建,并使用胶合代码将这些不同的元素集合成一个统一的代理。

预计LLM提供商将继续推出新的能力,如代理建模、协作、更多的工具访问和预构建功能、反思、安全防护等,使它们成为构建代理的强大平台。

专家混合代理架构

Bardeen、Imbue 和 MultiOn等构建者正在解决使用专家混合 (MoE) 代理框架为复杂工作流程提供确定性结果的问题。

这个想法是将工作流划分为分配给特定代理或功能的任务,并为代理提供所需的“脚手架”,包括数据、丰富的工具集和界面。

下面讨论了该体系结构的一个近似情况:

(1)用户界面

面向用户的LLM使用户能够描述任务并利用上下文窗口来提供相关的上下文,例如少量示例。

较新的UI方法结合了用户上下文和交互性,允许用户控制代理并优化其方法。这种设计使“人机交互”能够认证最终输出。这种设计使“人机交互”的界面更加流畅,以提供输入并认证最终输出。

(2)任务代理

工作流可以分解为由 LLM 代理执行的不同任务,其中一些任务将在下面详细介绍。这优化了当前的LLM功能,并可以灵活地将任务代理用于特定功能,具有清晰的抽象和将来升级或重构的选项。

如今,规划代理可能会提出一个计划,将用户意图分解为任务列表,这些列表在路由执行之前由人工批准。这仍然是一个活跃的研究领域。

路由任务将任务映射到适当的AI/ML代理或预定义的工作流程。

功能代理针对特定任务(genAI或预测性ML模型)进行训练。

代码生成代理将任务转换为特定任务的代码,如SQL查询。

Reflection LLM对输出进行迭代,以评估质量并优化最终输出。像Devin这样的平台已经证明了这种技术在提高输出精度方面的有效性。

(3)确定性运行时

为了提供始终正确的最终输出,在确定性运行时组合来自各种任务的不同输出已被证明是一个好的实践。

例如,对于金融用例,代码生成LLM生成在运行时执行的SQL查询,以便精确提取数据。

MoE架构的核心设计原则是仅在需要时使用AI/ML模型,并利用预定义的工作流程/剧本。LLM在设计时使用,并在确定性运行时进行合成。

(4)代理到人机界面

如前所述,人机交互界面是当今架构的一个关键方面。

构建者正在通过从上下文窗口中的输入到设计代理作为浏览器扩展的各种方法,将代理基础化在用户上下文中,使它们能够观察用户行为并捕获上下文。

LLM插件引入外部数据或工具,这是赋予代理更多技能的关键方面。

最后,代理可以使用API与电子邮件、生产力和通信工具等用户平台通信,模仿典型的人类工作流程。

代理到代理接口是一个活跃的研究和开发领域。在MoE模型中,如上所述,具有不同能力的任务代理将需要进行交互。随着时间的推移,我们可以设想代理与其他代理交互以完成任务——推断出一个由AI支持的今天连接应用程序的API版本。

企业部署自动化的注意事项

大多数企业已经使用了一系列自动化平台,从用于特定任务的经典RPA和任务自动化平台到自主开发的解决方案。AI带来的生产力仍然更多是炒作而非现实。基于genAI的自动化的候选者需要进行清晰的成本/收益分析,因为它们将遵循与以前方法类似的成熟曲线。

“关键在于数据,笨蛋。”AI 代理的性能与其训练数据的质量和相关性直接相关。对于许多企业来说,这一旅程始于创建干净、专注的数据集和管道,这些可以支撑模型。

随着GPT5/Llama3的即将发布,LLM领域正在迅速发展,这将重置SOTA标准。同时,现在以有吸引力的成本提供具有GPT4级别性能的有多个模型。企业现在拥有来自不同来源、不同性价比水平的模型,可以根据用例和功能需求进行选择。

在平台层面,市场有多种选择。现有企业正在嵌入AI或提供copilots,以加快用户的价值实现时间。初创公司/成长型企业和LLM提供商正在采用AI原生方法来重塑垂直用例或创建新平台来,以转变成本、性能和用户体验。工作流程和性能基准应驱动选择。

如今的LLM对提示非常敏感,微小的变化可能导致模型输出的偏离。建立在用例层面(而非模型层面)的明确性能度量标准是关键。治理和数据安全也是如此。人机交互是当今所有AI部署的基本特征。

自动化构建者的注意事项

构建者可以在自动化平台中采用“爬行、行走、运行”的方法来使用genAI。深入了解用户、用例、性能基准,并利用大型语言模型(LLM)作为工具,将其能力与任务相匹配,对于构建差异化解决方案至关重要。

LLM主要是系统1思考者(基于训练数据的反射性反应)。构建者在需要的地方使用LLM,以实现差异化功能和预定义的函数/playbook,并在可能的情况下使用ML模型。有针对性和有针对性的数据集对于建立模型至关重要。

对于复杂的用例——不断的实验和正确的“脚手架”,以纳入用户上下文、访问外部工具和数据集、反思机制等,是一个“专家混合”代理架构的基础方面。

简单的基于文本的用户界面是一个很好的第一步。构建者通过添加实时交互性和多模态用户界面进行创新,以创建更积极的用户参与度,使用户能够跟踪LLM的任务列表,评估输出,并提供积极反馈以引导输出。

带来差异化的数据集,配以正确的治理,同时考虑安全性权衡、安全防护措施和性能,对于避免在最终用户环境中部署时出现监管和合规问题很重要。

生成式AI代理用例

我们在与企业的交流中得知,代理自动化领域正在进行各种努力。以下是一些详细的用例:

F100电信公司的首席数据官:“我们正在构建自主代理工作流,将表和数据库链接在一起,连接多个数据源,然后根据数据采取行动或提出建议。”

一家全球咨询公司的数据和AI副总裁正在构建代理工作流,使数据分析师能够从分散的电子表格中捕捉洞察。

一家F500建筑和房地产公司的数据和AI高级副总裁正在构建一个代理应用程序,将Palantir、OpenAI 和内部copilot联系起来,从数千份提交中选择获胜的RFP投标。

一家大型银行的高级副总裁说:“我看到了GenAI的两个活跃用例。一是编码copilot,已经向我们所有的工程师推广,我们看到高级工程师的生产力提高了约20%+。我们期待在这里获得更新的功能。二是与LLMs进行文档聊天,RAG在保护隐私的同时显著改进了模型的落地方式。聊天机器人已经进行了实验性推广,我们仍在完善这个用例,以考虑安全性和合规性。”

一家大型银行的首席数字官表示:“在我们的领域中,自动化将采取多种形式。我们拥有大量的RPA、ITSM垂直自动化平台等,并在LLM上构建了代理。我们正在积极试验代理自动化架构,并边走边学。一些现有的供应商在整合AI方面表现出了极大的灵活性。”

AI自动化市场全景图

人工智能的创新步伐只会加快。需要注意的是,这里讨论的许多方法仍处于实验和早期生产阶段。

随着代理和自动化领域的不断发展,我们致力于积极追踪并更新这一领域的最新动态。同时,我们欢迎有机会与构建代理自动化、重新构想垂直应用程序和差异化基础设施平台的创始人合作,并期待与社区的反馈和对话。

注:Insight Partners已投资Workato、Jasper、Writer、Bardeen、Big Panda、Torq。

原文链接:

网页链接

科技产业观察

让Kimi组织了一场AI大咖论坛、做了一份AI搜索行业研究,只想说:“真香”!

万字长文详解英伟达股价2年7倍四部曲!最新的投资故事如何演绎?下一个万亿还有哪些投资故事?

AI商业观察:拥抱AI的中国速度!

AI视频生成模型集体“狂飙”,创作边际成本会降到零?生成式AI“数据智能”如何演进?

深度复盘华为发展五大阶段的战略历程启示录与DSTE实战体系!

华为如何“五看”市场?!一篇文章读懂市场洞察必须的产业思维+产品思维!

END