最近几周,美国股市与AI相关的公司股票出现下跌,原因很多,但有一个是人们经常会关心的:AI应用和落地的商业化到了什么程度?遗憾的是有个坏消息、可能在一定程度上引发了这轮下跌。
美国知名高校 MIT Media Lab 日前发布了一份包括《The GenAI Divide: State of AI in Business 2025》(生成式AI的鸿沟:2025年人工智能商业化现状),提到目前企业在 GenAI 上花费了 300 至 400 亿美元,但 95% 的组织并未获得商业回报,目前处于“高投入、低回报”的尴尬境地。这份报告放大了市场对于 AI商业回报的担忧,引发了新一轮关于 AI泡沫 的争论。
MIT的报告提到,目前 “买家(企业、终端用户,尤其是中小企业)和 卖家(初创企业、供应商、咨询公司)之间的分歧如此之大,以至于我们称之为 GenAI 鸿沟”。那么这个 GenAI鸿沟是怎样的?我们来具体看下 MIT的这份报告。
一、巨大的 GenAI 鸿沟:高达 95% 的失败率
GenAI 革命的流行叙事与严酷的运营现实发生了冲突。对这种冲突最权威的分析来自 MIT Media Lab 的 报告《GenAI 鸿沟:2025 年 AI 商业状况》。该报告指出,在各个行业,估计已在企业生成式 AI 上投资了 300 至 400 亿美元,但 95% 的组织并未获得商业回报。
这种脱节在部署阶段最为严重。该报 强调了从实验到运营的灾难性失败:高达95% 的定制企业 AI 试点未能投入生产。 这不是一个渐进的挑战;这是系统性的崩溃。虽然 ChatGPT 和 Microsoft Copilot 等通用工具的采用率很高——超过80%的组织正在探索它们——但这种活动主要提高了个人生产力,而没有转化为企业级的转型。
来自一线企业领导者的情绪证实了这些数据。正如一位中型制造业首席运营官在报告中所说:“ LinkedIn上的炒作表明一切都变了,但在我们的运营中,没有任何根本性的改变”。人工智能的前景与其实际表现之间的差距定义了GenAI鸿沟。
二、原因分析:为什么大多数GenAI实施没有带来任何商业价值
95% 的失败率背后的原因主要不是技术问题。这些模型本身很强大,但它们在企业环境中的应用存在根本缺陷。失败的根源在于战略、组织和运营方面的缺陷。
1、 “学习差距”:真正的罪魁祸首
MIT 报告的核心论点是存在“学习差距”。与灵活且自适应的消费级人工智能工具不同,大多数企业级 GenAI 系统都比较脆弱。它们无法保留反馈,无法适应特定的工作流程环境,也无法通过用户交互不断改进。这种学习能力的缺失使得它们在处理敏感或高风险工作时并不可靠,导致员工放弃它们。这些工具未能将“最后一公里”的集成工作与复杂微妙的日常业务运营现实联系起来。
2、战略与领导力的缺失
成功的人工智能项目是业务转型,而非 IT 项目。然而,大多数失败源于缺乏战略协调和高管的坚定支持。研究表明,多达85%的人工智能项目未能规模化,主要原因是这些领导失误。 常见的失败模式包括:
1)缺乏高管支持:如果没有高管的支持,人工智能项目通常缺乏资源、跨职能权限和战略方向来取得成功。
2)业务目标不明确:许多组织都陷入了“闪亮物体综合症”,追求人工智能只是为了其本身,而不是为了解决明确的业务问题。IBM早期在 Watson for Oncology 上遇到的困境,就像是“用锤子找钉子”,值得警醒。
3)投资回报率预期模糊:项目启动时往往抱有不切实际的期望,或者对成功标准定义不明确,即使这些项目提供了增量价值,也容易导致失败。
3、数据准备和基础设施缺口
生成式人工智能对高质量、高相关性数据的需求巨大。然而,许多组织尚未做好准备。超过一半(54%)的组织认为他们尚未具备人工智能时代所需的数据基础。关键问题包括:
1)数据质量差:数据碎片化、孤立且质量低下是项目被放弃的主要原因。Gartner 指出,至少 30% 的 GenAI 项目在概念验证后会因数据质量差而被放弃。
2)低估成本:在云中运行生成模型的巨大计算成本可能导致预算超支,尤其是在从小规模试点转向生产时。
4、组织和文化惯性
技术实施最终是人文的挑战。文化阻力通常源于对工作流失的担忧或缺乏人工智能素养,这可能会阻碍技术的采用。
此外,孤立的业务团队和技术团队之间协作不足,往往会导致创建出技术上可行的模型,但却无法解决实际的业务问题,或者过于复杂,最终用户难以采用。如果原本打算使用人工智能系统的人不信任、不理解它,或者觉得它对他们没有帮助,那么这个项目注定会失败。
三、影子人工智能经济:个人成功掩盖企业失败
在企业批准的人工智能项目举步维艰的同时,一个充满活力且高效的“影子人工智能经济”却应运而生。 这是报告中最引人注目的悖论。研究表明,90% 的公司员工经常使用 ChatGPT 等人工智能工具来完成与工作相关的任务,但大多数公司都向 IT 部门隐瞒了这一情况。
这种暗中采用并非易事。员工们正在积极寻求“秘密优势”,利用这些工具来提高个人生产力,并克服企业官方软件的缺陷。Gusto 的一项调查发现,这些员工中有三分之二的人会自行支付工作中使用的 AI 工具的费用。这种行为造成了报告所称的“生产力提升的影子经济”,企业领导层对此完全视而不见,财务报告中也未提及。
这种脱节现象非常严重。麦肯锡的一项调查发现,高管层估计,只有 4% 的员工至少在 30% 的日常工作中使用 AI。而员工们自述的实际情况是,这一比例要高出三倍以上。 这种影子经济最清楚地表明了用户需求尚未得到满足。它表明,当工具灵活、直观且直接适用于他们的任务时,员工能够并且将会从 AI 中获取价值。企业 AI 的失败并非在于无法创造价值,而在于组织未能提供合适的工具和环境来大规模地获取价值。
四、解读成功的 5%:GenAI 实施中哪些是有效的?
95% 的企业还在挣扎,而成功的 5% 则为价值创造提供了清晰的蓝图。这些组织并非只是使用人工智能,他们从根本上重塑运营、使其成为人工智能原生企业。他们的成功建立在清晰的战略、前瞻性的技术架构以及对深度运营整合的承诺之上。
1、成功模式:高效 GenAI 实施的特征
跨越 GenAI 鸿沟的组织具有一系列独特的特征,这些特征使它们有别于大多数实验性组织。
首先,成功始于强有力的 C 级高管支持。在这些公司中,人工智能并没有委托给孤立的创新部门,而是被作为核心业务转型优先事项,通常由 CEO 直接负责治理。这种自上而下的授权提供了推动整个企业变革所需的权力和资源。
其次,这些领导者重新设计核心业务流程以嵌入人工智能,而不是简单地将人工智能叠加在现有工作流程之上。 这是弥合“学习差距”的关键一步。通过重新构建工作方式,他们创造了一个环境,在这个环境中,AI 不再是附加组件,而是运营不可或缺的组成部分。这通常需要创建专门的跨职能团队,将业务领域专家与 AI 和数据专家联合起来,共同开发解决方案。
第三,他们始终专注于可衡量的业务成果。目标不是部署 AI,而是解决业务问题。这在众多现实世界的案例研究中得到了充分体现。例如,通过瞄准特定的工作流程,公司获得了显著的回报:
- EchoStar 的休斯顿分部开发了 12 个生产应用程序,预计每年可节省35,000 个工时。
- 保险公司Markerstudy Group开发了一款通话摘要应用程序,每年可为其理赔部门节省约56,000 小时。
- 电信公司Lumen将销售准备时间从 4 小时缩短至仅 15 分钟,预计每年可节省5000 万美元。
这些成功并非偶然;它们是将 AI 实施与有形损益影响直接联系起来的严谨战略方法的结果。
2、Agentic AI 演变:从被动工具到主动协作者
成功的 5% 企业能够超越简单生产力工具的技术飞跃是向 Agentic AI(代理式人工智能)的演变。第一代 LLM 虽然令人印象深刻,但在企业使用方面受到严重限制:它们从根本上来说是被动的,需要人类提示才能采取行动;它们缺乏持久记忆,难以处理多步骤任务;并且它们经常难以进行复杂的推理。
Agentic AI 是下一个范式,专为克服这些限制而设计。这时候,AI Agent 是一个可以执行以下操作的系统:
- 感知其环境并理解上下文。
- 将高级目标推理并分解为一系列可操作的子任务。
- 通过自主使用工具(如 API 和数据库)并与其他代理协作来执行其计划。
- 从其行动的结果中学习,以提高未来的表现。
这将使人工智能从被动工具转变为主动的、目标驱动的虚拟协作者。用户无需要求 LLM “撰写入职电子邮件”,而是可以委托各种 AI Agent “管理整个入职流程”,这可能涉及发送电子邮件、更新 CRM、安排会议和生成报告。各行各业已经涌现出影响深远的用例,包括简化保险索赔处理、优化复杂的物流和供应链、加速药物研发以及自动化复杂的财务分析和风险管理。
3、小语言模型 (SLM) 革命:可扩展 AI Agent的引擎
小语言模型 (SLM)的兴起是这种 Agent 未来的经济和技术基础。对于人工智能模型,普遍的假设是“越大越好”。然而,对于大多数企业工作流程中特有的专业化、重复性和高容量任务而言,这种假设已被证明是不正确的,并且在经济上不可持续。
ArXiv 上的一篇开创性论文《小语言模型是代理 AI 的未来》指出,SLM 并非妥协之举,事实上,它对于大多数代理应用而言更为出色。 其论证对商业和技术领导者来说极具说服力:
- 强大的能力和专业化。最近的进展表明,精心设计的 SLM(例如,参数少于 300 亿的模型,例如微软的 Phi-3 或 Mistral 的 7B)在特定目标任务上的性能可以达到甚至超过更大型模型。 代理系统很少需要能够编写莎士比亚十四行诗的 AI;它们需要的是能够完美解析发票或执行 API 调用的 AI。SLM 在这种专业化水平上表现出色。
- 经济优势:成本差异显著。在延迟、能耗和计算成本(FLOP)方面,服务于 SLM 比服务于大型 LLM便宜 10 到 30 倍。 这使得实时、大规模的代理响应在经济上可行。此外,针对特定任务微调 SLM 只需几个 GPU 小时即可完成,从而实现惊人的敏捷性,而重新训练大型模型则可能需要数周时间和数百万美元。
- 架构契合度和灵活性。使用庞大、通用的 LLM 来处理狭窄、重复的任务效率极低。代理方法更倾向于“异构”系统——由专门的 SLM 代理组成的团队协作,并可能由一个更大的模型充当协调器。 这种模块化设计更高效、更易于调试,并且更能适应不断变化的业务需求。它还支持在边缘设备或私有云环境中部署,从而增强数据隐私和安全性。
因此,对于任何认真考虑大规模部署代理型人工智能的组织而言,向服务生命周期管理 (SLM) 的战略转型都是关键的推动因素。它将人工智能从昂贵的集中式资源转变为现代企业架构中灵活、经济高效且强大的组成部分。
五、结论:如何跨越GenAI鸿沟?
GenAI 鸿沟是当今企业领导者面临的决定性战略挑战。95%的失败率并非统计异常;它体现了一种过时的做法,即将人工智能视为一种简单的可采购技术,而非必须融入组织结构的变革力量。
为了跨越这一鸿沟,加入成功的5%,领导者必须汲取失败和成功的经验教训。这一旅程需要制定一个针对不同领导角色的多方面行动计划:
- 对于首席执行官和董事会而言:首要任务是愿景和商业模式转型。您必须引领“北极星”,确保重新设计核心流程所需的战略承诺和投资。您的职责不是问“我们如何使用人工智能?”,而是问“在一个自主代理能够执行复杂工作的世界中,我们的业务必须如何改变?” 不妨思考如何为您的企业构建一个成功的生成式人工智能战略。
- 对于首席技术官兼人工智能主管:您的任务是构建下一代架构。这意味着引领从单一的逻辑生命周期管理 (LLM) 向由专业逻辑生命周期管理 (SLM) 驱动的灵活、可扩展且经济高效的代理系统生态系统的战略转变。您最重要的长期项目是构建能够捕获和利用专有“流程数据”的 MLOps 和数据基础设施,将公司运营转化为最有价值的培训资产。
- 对于业务部门负责人:您的角色是成为变革的落地推动者。您必须识别您所在领域内哪些高价值、高摩擦、适合实施代理自动化的工作流程。关注团队内部的“影子人工智能经济”——它是一张藏宝图,直指最紧迫的需求和最有前景的机遇。与您的技术同行合作,共同设计解决方案,并领导必要的变革管理,使您的团队能够与新的人工智能合作伙伴共同蓬勃发展。对于那些希望在这一新模式下发展职业的人来说,了解2025年最紧俏的技能至关重要。
前进的道路是明确的:从被动工具转向主动代理;从单一模型转向专业智能;从孤立的实验转向对工作本身进行全面的战略性重构。做出这些基础决策的12-18个月窗口期正在关闭。现在果断行动的领导者不仅能在这场颠覆中生存下来,还将定义下一个竞争优势时代,规划未来的成功之路。
