作者 | 《新程序员》编辑部出品 | CSDN(ID:CSDNnews)
在这场席卷全球的 AI 浪潮中,生成式 AI 产品也正在经历一场前所未有的变革。
回溯过往,生成式 AI 的萌芽从算法模型的初步探索开始,当时还局限于特定领域内的简单应用。然而随着大数据的积累、计算能力的提升以及算法模型的持续优化,生成式 AI 开始展现出惊人的创造力与学习能力:从简单的文本创作到复杂的图像生成,乃至跨模态的内容创造。
站在新的历史起点上,我们不禁要问:生成式 AI 产品的未来发展将如何演进?它们又将如何继续深化与人类的互动、推动行业创新?
为此,在 9 月 20-21 日于北京正式拉开帷幕的「2024 全球产品经理大会」上,我们特设了“生成式人工智能产品”主题论坛,邀请到了来自腾讯、商汤科技、WPS、京东、快手、同程旅行、OPPO、云九资本、句子互动、58 同城、海纳 AI、来也科技以及爱设计& AiPPT.cn 的 13 位一线专家与行业领袖,深入剖析生成式 AI 产品背后的技术驱动力,共同探讨其潜在的应用场景与发展挑战。
汪晟杰:AI 驱动下的 B 端产品的思考与创新
面对日益发展的 AI 技术,产品经理正遭遇哪些全新的标准与挑战?腾讯云开发者 AI 产品负责人汪晟杰依据自身及其团队的实践经验,分享 AI 驱动下的 B 端产品思维和创新成果。
汪晟杰首先提出一个观点,即产品经理实际上是产品层面上的「CEO」。他从四个维度深度解读了这一观点:
● 产品价值。产品经理需要在整个团队中灌输产品的核心价值,并达成共识。产品价值在于明确产品独特的优势。
● 人心成功。做产品需要体察人性、把握人心,这要求产品经理要有敏锐的市场洞察力,并且能够定义产品解决的痛点。
● 创造和体验。创造性工作就如同为自己的孩子规划未来,产品经理需要在过程中不断调整方向,以适应市场的变化。
● 商业成功。产品经理还需要具备通过竞品分析、市场调研等方法来验证产品价值的能力。也要思考产品的商业化路径,制定 3-5 年的收益计划,并随时准备调整方向。最后,产品经理要向老板汇报成果,就如同 CEO 向投资者汇报一样。
汪晟杰指出,生成式 AI 技术为产品经理带来了新的机遇。传统的产品经理可向专注于 AI 功能设计、大模型基底方面的产品技术、偏 AI 效果等不同方向升级转型。不过,这也要求产品经理需要对智能体、API 与业务、提示词、大模型与多模态等生成式知识点有一定的理解。
谈及 AI 驱动的产品需要遵循的原则时,汪晟杰给出了自己独特的见解:
一、制定商业画布(AI Canvas),用于阐述产品理念,回答关于产品 Why、How、What 等关键问题。明确产品价值主张,即产品解决的核心问题和其独特价值。考虑解决方案的实施、目标客户、模型选择及策略。
二、找到「Product Market Fit」,确保产品赢得市场。其中,产品需遵循创意、验证、营销、扩张和效率等不同阶段的测试。而产品经理要理解 AI 运作方式,思考 AI 与业务的结合,并进行规模化、标品化思考。
三、生成式 AI 赋予软件产品能力新加持。如今人类与 AI 协同主要有三种模式,一是 Embedding 模式,将传统业务与 AI 特性结合,设计出带有 AI 功能的产品;二是 Copilot 模式,设计出 AI 效率工具产品 ,由 AI 自主,由人工确认后完成工作;三是 Agents 模式,从半自动化 Agent 到全自动化 Agent,让 AI 从思考、计划、反思、修正。
四、在 AI 时代,产品经理设计产品时需结合业务背景的第一性原理,设计新的交互方式,思考定价及「Product Model Fit」。和「Product Market Fit」相比,「Product Model Fit」的重要性也不容忽视,前者决定了产品的商业模式,后者则决定了产品的技术可行性。
五、B 端与 AI 结合的大模型产品,遵循 S(企业安全与可控)、M(基于多模态的产品)、A(面向业务的 Agent 智能体)、R(重新思考业务流程)、T(基于业务的模型训练与微调)这一 Smart 准则。
总体而言,汪晟杰表示,产品经理在 AI 时代需要重视产品模型的成本控制、标准化建设,并且找准痛点,不断迭代优化产品。赢得成功的关键在于制定出能够让老板在短期内看到希望,并在长期内实现盈利的产品价值主张(PMF)。
李佳芮:RPA+AI,打造大模型驱动的领先数字员工
在这个数字化转型的时代,我们正见证着 AI 技术以前所未有的速度重塑世界。在此背景下,句子互动创始人李佳芮选择从全新视角切入——大模型技术在构建数字员工方面的应用,深入探究下一代大模型驱动的领先数字员工该如何打造。
在进入正题之前,李佳芮首先明确了一个观点:“大模型不是银弹,即使 AGI 时代到来,大模型也不可能解决一切问题。”在她看来,技术决定的是下限,而业务决定上限,即未来大模型技术越来越强,业务才能更好地落地。
为此从 0 到 1 构建大模型应用的过程中,李佳芮重点提到了搭建数字员工的八大生命周期:运营反馈、平台渠道集成、需求分析、流程设计、数据处理、Prompt 撰写、系统测评和系统搭建。在这八大生命周期中,她着重介绍了后面四个方面:
● 数据处理:从不同渠道获取数据样本以进行数据收集,同时进行一系列的处理工作,比如清洗数据、去除 HTML 标签、优化图片等,许多如数据切割、扩充和更新等基础的数据处理也能通过现有的开源框架来完成。其中,RAG(Retrieve Augmented Generation,检索增强生成)技术在数据处理和生成式 AI 中的应用日益广泛。
● Prompt 撰写:提示工程(Prompt Engineering)远不止简单地写几行指令,其核心在于如何清晰、精准地表达需求,并且要懂得如何有效地向 AI 提问。例如:将指令放在 prompt 开头,并建议使用 Markdown 格式撰写;通过示例来帮助 AI 理解任务;在 prompt 中添加逻辑推理步骤,引导 AI 进行更细致的思考过程等等。
● 系统搭建:主要围绕大模型交互、增强生成和多智能体协作等方面展开。与大模型交互时,动态构造 Prompt 是一种常见的做法,传递动态参数能够实现更精准的响应;引入外挂数据库/检索增强生成(RAG),解决大模型的幻觉问题;采用多智能体工作流,通过进行多次 Prompt 交互、生成中间结果,以逐步构建更高质量输出的方式。
● 系统测评:可进行分段式测评,以帮助提升系统的整体性能。首先让客户参与系统测试,并为其提供具体的测试要求;基于客户的信息构建一个标准化测试集,用于系统内部的集成和调优;还可以利用大模型的自检功能,对系统进行深度评估;测试完成后再次进行评分,达标后将其交付给客户进行下一轮反馈——这样,一个完整的集成调优循环就完成了。
基于以上提出的八大生命周期概念,李佳芮认为:可采用 RPA(机器人流程自动化)+AI 的方式,来打造下一代大模型驱动的“数字员工”管家婆一码一肖100中奖 ,时代资料解释落实_标配版5.235。具体而言,“数字员工”的核心能力可分解为四个层次:
(1)模型层:最底层的能力,包含大模型、小模型、端侧模型等多种模型的联动与协作。
(2)数据层:包含结构化和非结构化数据,能够处理各种数据来源和格式。
(3)流程层(Workflow):这一层强调标准操作程序(SOP),连接了业务规则(RK)和异常处理(Badcase)等领域。
(4)工具层:底层的模型和外部的使用工具相连接,形成整体的工作流。
围绕“数字员工”的四大核心能力、以及搭建数字员工八大生命周期的概念,句子互动推出了 RPA+AI 两款产品:RPA-运营服务一体化平台,AI-智能体流程引擎。在演讲最后,李佳芮分享了一个将“数字员工”用作 AI 数字导购的完整案例:不同于传统人工导购存在的限制和弊端,在基于 RPA+AI 打造的“数字员工”的推动下,智能化门店新时代或许即将开启。
赵九州:AI 浪潮中的应用主义者
在这一场 AI 浪潮中,有人选择站在理论研究的前沿,探索AI技术的极限;而另一些人,则将目光投向了更加实际的应用场景,致力于让 AI 真正服务于用户——对于后者,金山办公 WPS AI 高级产品总监赵九州将其称之为:AI 浪潮中的“应用主义者”。
赵九州表示,目前金山办公主要产品月度活跃设备数达到了 6.02 亿,每一个功能的用户反馈量都相当庞大。而公司通过工单和用户反馈,结合AI能力来解决实际存在的问题。故而相比于探讨理论,金山办公推出 WPS AI 的初衷便是技术普惠,让大众用户能以低门槛、简单的方式接触并使用 AI 功能,专注于从用户角度出发,基于 AI 能力,并结合 WPS 已有能力,真正有效解决用户刚需且具体的痛点。
● AI 写作助手
举个例子,许多用户在使用写作助手时,通常面临如何提出有效提示词、控制 AI 写作质量以及处理创作中断等问题。为此,WPS AI 在写作助手中引入了 AI 伴写模式,旨在以更自然的交互方式,帮助用户无缝完成写作任务。
与传统的 AI 提示词机制不同,AI伴写模式能自动为用户提供联想句子,而无需额外的提示词输入。用户可以直接在写作界面中看到 AI 给出的建议,并决定是否采纳,并不打断写作流程。赵九州强调,这种交互设计更符合用户的传统写作习惯,尤其适合那些不熟悉如何与 AI 交互的用户。
● AI 数据助手
事实上,很多表格中的操作都是重复性、高度规则化的任务,类似于 RPA(机器人流程自动化)工具或自动化 Agent 能完成的事情。为此,WPS AI 对数据助手的要求是:一句话就能清楚地描述规则和需求,并让数据助手自动完成相应的操作。
不仅如此,WPS AI 还能理解并分析表格中的信息,例如自动分类售后工单类型,迅速找到哪些问题出现得最多以及对应的解决方案。就算用大白话向它提问,AI 也能根据用户需求,自动生成代码或公式,然后直接在表格中输出结果。
● AI 阅读助手
再者是 AI 阅读助手,它专门针对 PDF 和 OFD 格式的超长文档,帮助用户进行快速总结和处理。市面上虽已有不少类似工具,但赵九州强调以下三个功能的创新,可使其更加智能高效:
(1)AI 总结:即使是超长文档,获取信息也十分便捷;(2)AI 文档问答:回答可追溯,一切有据可依;(3)AI 翻译:外文翻译与提炼均一步到位。
通过这些功能,WPS AI 不仅帮助用户节省了大量阅读和总结的时间,还在工作流程上做到了智能串联,从文档处理、总结,到展示,完全自动化,极大提升了生产力。
● AI 设计助手
针对用户美化 PPT 过程中的多种痛苦,赵九州也进一步介绍了 WPS AI 在这方面的功能创新:一句简单描述,即可让 AI 生成 PPT;通过已写好的脑图大纲,亦可让 AI 一键生成 PPT 内容;上传演示文档,由 AI 进行风格克隆;快速对 PPT 中的图片切换不同风格的滤镜;可按照不同比例进行图片扩展;基于照片生成高质量且实用的个人写真。
● AI 语音助手
在多模态的探索中,WPS AI 也将语音识别和语音生成技术进行了高度整合,主要集中在两大方向:(1)基于 ASR+LLM 的AI语音速记,实时声纹识别区分说话人以输出精准的文字稿;(2)基于 TTS+LLM 的 AI 朗读,为用户提供更流畅、更拟真的阅读体验。
整体而言,WPS AI在C端用户产品的理念基本可概括为:不要让用户输入 Prompt,让 AIGC 回归创作本身;聚焦垂直用户的办公、效率场景;避开不能接受幻觉的领域;增强召回,减少噪音与幻觉;围绕工作流做上下游产品。
在演讲最后,赵九州表示,“AI 不是要替代人类的完整工作,而是在工作流程中和人形成协作。”同时,他还提出了一个倡议:“我们需要更多AI应用主义者。发布会上,Demo 越来越多,但 Demo 并不算产品,用户真正可用的才叫产品。”
贾安亚:心流与创新——Al Native 生产力工具的发展、价值与商业落地
在当今快速变化的科技时代,生产力工具正从传统的线性流程逐步向智能化、自动化的方向转型,其中 AI Native 生产力工具正在成为创新和效率提升的关键驱动力。围绕这个话题,商汤科技 Copilot 产品负责人贾安亚带来了深刻且富有洞见的演讲。
整体而言,生产力工具主要涵盖两大类别:一是面向开发者的软件研发工具,一是面向产品经理和数据分析师的办公类助手。从个人用户视角来看,全球超过 60% 的开发者正在使用 AI 驱动的编程类工具,独立任务对比实验中总体工作时间减少了 55%,带来了生产力的提升。
当从企业的角度来探讨 AI 应用时,情况则变得更加复杂。贾安亚指出,面向企业的 AI 解决方案不仅仅是一个面向开发者的代码类工具,而会逐步发展成为覆盖整个软件研发全生命周期的解决方案。具体来说,企业的真正需求是在开发者提效的基础上,进一步将其现有的 IT 资产与 AI 结合,以实现三个层面的提升:
● 个人效率
以个人开发者为例,很多代码补全、代码对话、Commit Message 撰写等重复性任务,AI 生产力工具都能高效完成,帮助其提升编码效率、缩短走查时长、减少测试成本等。
● 团队协作
在团队协作中,AI 赋能的重点在于与企业现有的协同工具进行深度集成。通过这种集成,AI 可以帮助团队优化协作流程,减少沟通成本,并在很大程度上解决资产沉淀难、规范落地难、技术债务积累多等问题。
● 企业管理
在企业的全流程管理中,AI 更是需要在整个研发生命周期中发挥作用。大模型的核心能力在于对各类任务的理解,而企业需求往往涉及特定的行业知识和内部知识,将这些内容与模型打通至关重要,并将其有效传递到研发过程中的每个环节,进行全流程优化。
尽管如此,当大模型实际投入企业的业务环境时,常常会与预期有一定差距。原因在于用户的输入往往更加随意,难以直接与模型的训练数据对齐。对此,贾安亚认为可通过工程化方法来优化模型的应用体验:
(1)Prompt 优化(外化 COT)+ Constrained Decoding + 内化 COT,即:在 AI 模型前面接入一个较小的模型或者利用工程化方式,将用户的输入变得更加结构化,帮助模型更好地理解用户意图;不只依赖于用户输入,还需参考其代码仓库、文档库等历史数据,帮助模型更好地理解用户背景;参考 OpenAI O1 等前沿模型,将提示链的过程内化到模型内部,通过模拟人类的思考链来提高模型输出的准确度。
(2)选择 All-in-One、以 GUI 交互为主的应用形态:“All-in-One” 这种设计理念尤其适用于生产工具领域,即用户能在一个集成环境中完成多个任务,无需在不同工具间切换,以此保持用户的心流状态;在创造性工作和生产力工具中,以 GUI(图形用户界面)为主,辅以 LUI(语言用户界面)的灵活性,可以为用户提供更顺畅的操作体验,避免过多的认知负担。
知行合一,商汤针对这两个方向分别推出了「小浣熊·智能软件研发助手」和「小浣熊·智能办公助手」,通过大量落地实践持续迭代。其中,「小浣熊·智能软件研发助手」可覆盖软件需求分析、架构设计、代码编写、软件测试等环节,支持 90+主流编程语言,提供网页版、IDE 插件版以及私有化部署、软硬一体机等使用场景服务;「小浣熊·智能办公助手」作为基于大模型的数据分析、文件处理工具,可协助用户完成数据文件优化及数据洞察、数据分析等工作,支持复杂表格、多表格、多文件的理解,广泛应用于市场调研、财务分析、销售预测、宏观分析、产品设计等场景。
展望未来的产品设计,贾安亚强调不仅要考虑 AI 带来的提效,还要思考 AI 如何在更复杂的环境中与用户协作。在她看来,LUI 和 GUI 结合、All-in-One 的设计理念以及慢思考的引入,都是当前 AI 产品设计中非常值得深入探讨的方向。
李宏宇:旅行产品在 AI 生态下的发展秘籍
近年来随着旅游热度的逐年攀升和国民新旅游时代的结构性变革,AI 应用在旅游业也爆发出了新机遇与新需求。然而,旅行场景如何在 AI 生态中建立优势?旅行产品又如何与 AI 能力做全方位结合以增强企业自身竞争力?为了解答这些问题,同程旅行 APP 事业部 CEO 李宏宇分享了旅行产品在 AI 生态下的发展秘籍。
根据公开数据显示,2023 年我国大模型市场规模已初步估算达到了 147 亿元,近三年复合增速高达 114%。与以往传统算法相比,大模型的能力在多个方面表现出了革命性提升:强大的语言能力、对话记忆、泛化能力和智能成本下降。
然而李宏宇指出,虽然通用大模型在语言理解和推理能力方面具有显著优势,但它面临着业务鸿沟的问题,即无法完全满足各个行业的特定需求——于是,垂类大模型应运而生。
作为旅游行业的领先者,同程旅行结合自身的行业经验,推出了旅游垂类的程心大模型,专注于满足旅游行业的特定需求。凭借多年沉淀的用户资产、完整的旅游供应链和高质量文旅数据,程心大模型致力于打造一个更智能、高效的旅游服务体系:
● 更强的学习推理能力,更丰富的文旅数据,更契合丰富多样的文旅业务场景。
● GB 级训练语料,文旅数据准备到知识检索,最终为用户提供更智能、准确的结果。
● 历经数月材料准备,完成生成式算法备案、大模型备案,双备案使其更可靠安心。
那么 AI 大模型在旅游过程中具体能实现哪些功能呢?李宏宇表示,AI 的应用可贯穿用户旅行的各个阶段:行前、行中和行后。
(1)行前阶段:可通过其语言能力和对话能力,为用户提供灵感和建议,例如智能生成旅行规划,提供完整的产品查询和预定服务等管家婆一码一肖100准 ,最佳精选解释落实_尊享版6.896。
(2)行中阶段:可化身为用户的“旅行助理”,帮助用户实时解决旅行中的问题,提供智能导游服务和目的地游玩推荐。
(3)行后阶段:帮助用户整理旅行照片、撰写游玩攻略等,协助用户进行内容沉淀。此外,大模型还可以提供客服支持,协助解决售后服务问题。
不仅如此,李宏宇透露,除了在旅游场景中的应用,程心大模型还在办公、运营、市场营销和研发等多个场景中发挥了作用,帮助提升效率。另外在数据预测分析、市场舆情分析以及翻译等方面,程心大模型也已逐步介入。
在创新生态合作方面,李宏宇也分享了程心大模型及其 Agent 在文旅行业中的多种应用及潜在价值,包括:与手机厂商合作,通过服务卡片的功能向用户直接推送符合需求的资源,提供更直观的体验;借助对话机器人,量身定做满足不同用户的个性化需求;行程中相关航班酒店火车和景点,用户只需通过语音确认,由 AI 负责快速查询,反复筛选并快速订票,实现最闭环的服务。
最后聚焦未来,李宏宇认为 AI + 旅行行业价值巨大:“干亿行业规模,万亿可创造价值。”她补充道,关于 AI 大模型在旅游行业中的下一步探索,应着重升级多模态能力,围绕用户需求、市场需求、打造行业高价值生态链。
刘慧:医疗健康场景的大模型产品探索
技术演进,“普惠”愈发重要。AI 大模型的发展实现了人机协同的工作模式,很多人因此也寄希望于 AI 技术可以提供始终在线的高质量医疗服务。然而,现实并没有那么容易新澳精准资料免费提供 ,收益成语分析落实_钱包版5.842。
京东健康医疗 AI 产品副总监刘慧在《医疗健康场景的大模型产品探索》主题演讲中指出,大模型虽然能力强,但其各项能力水平不一、表现不稳定且更新迭代快,因此在大模型上落地医疗产品如同在沼泽上落地。
那如何在不稳定的地基上建设产品,刘慧结合京东在健康场景的探索实践分享了六个步骤:首先根据场景需求用户痛点定义任务;其次按业务流程及 LLM 技术特点拆分任务,然后测评模型能力明确是否满足需求,确定使用的模型并利用 RAG 和 Agent 等技术加强模型效果,进而根据任务完成可靠性等设计产品技术方案,最后持续监测模型能力寻找更优解。
刘慧表示,医疗领域的任务具有复杂性,涉及专业知识、推理决策、沟通共情、医疗安全等多个方面。然而,大模型在专业知识的掌握上存在局限,容易产生幻觉。在知识迭代方面,更新速度较慢。在推理和角色扮演方面,需要处理多模态数据和复杂的推理任务,大语言模型在这方面具有一定能力,但与实际临床需求相比仍有差距。
这对产品的建设者产品经理也提出了巨大的挑战。刘慧认为,传统产品经理在向 AI 产品经理升级的过程中,至少需要掌握三种技能:
● 了解提示词工程(Prompt Engineering)。如果将大模型视为操作系统,那么写提示词(Prompts)就如同与操作系统交互。写提示词要求高度的定义能力和沟通能力,需要清晰地告诉模型所需完成的任务及其完成方式。
● 了解 RAG 技术。如今 RAG 在单模型系统中变得越来越重要,它从单纯检索增强降低模型执行错误发展为大模型产品的技术基石,使模型更像中央处理器,逐渐向工作流方向发展,与 AI 智能体更有机结合。
● AI 智能体,它在信息空间中拥有感知、决策和行动能力,如同智能身体。Agent 包括记忆、工具调用执行等功能,能够更好地理解用户意图,调用不同工具完成任务。
刘慧对身处于大模型时代的产品经理建议道:
一、 一定要充分理解技术,否则产品地基将不稳固。
二、 大模型能力参差不齐,需明确定义任务并详细划分,结合大模型基础特点进行任务划分,并对大模型能力进行充分测试。
三、 在众多落地场景中,需选择合适的产品形态。