Courses
我们与技术互动的方式在不断演进。最令人兴奋的最新进展之一来自人工智能(AI)领域——机器被训练得能像人类一样思考、学习,甚至交流。在诸如生成式 AI 等众多发展中,有一门正在崭露头角的微妙技艺:提示工程(prompt engineering)。
想象与一台机器对话,您给出一个线索或“提示”,它便以相关的信息或动作作出回应。这就是提示工程的本质。其核心在于编写恰当的问题或指令,引导 AI 模型,尤其是大型语言模型(LLM),产出所期望的结果。无论您是关心 AI 最新动态的技术爱好者,还是希望利用语言模型力量的专业人士,理解提示工程都至关重要。

在本文的旅程中,我们将揭开提示工程技术细节的神秘面纱,同时放眼其在更广泛 AI 版图中的意义。对于希望进一步深入 AI 与语言处理世界的读者,我们也准备了多种资源,助您拓展学习。
什么是提示工程?
从本质上说,提示工程就像通过提问来教孩子。恰到好处的问题能引导孩子的思维,同样,精心设计的提示也能将 AI 模型,尤其是大型语言模型(LLM),引向特定输出。让我们更详细地探讨这一概念。
定义与核心概念
提示工程是设计与打磨提示——问题或指令——以从 AI 模型中引出特定响应的实践。可以将其视为人类意图与机器输出之间的接口。
在 AI 领域,模型在海量数据集上训练,合适的提示可能决定模型是理解了您的请求,还是误解了它。
例如,如果您用过 Siri 或 Alexa 等语音助手,您就已经进行过一种基础的提示工程。您表达请求的方式——“放点轻松的音乐”与“播放贝多芬的交响曲”——可能产生截然不同的结果。
提示工程的技术面
提示工程虽植根于语言艺术,却与 AI 模型的技术细节密不可分。以下是技术层面的更近一步观察:
- 模型架构:OpenAI 的 GPT(Generative Pre-trained Transformer)、Anthropic 的 Claude、Google 的 Gemini 以及 Meta 的 Llama 等大型语言模型(LLM)皆构建于 Transformer 架构之上。该架构通过自注意力机制让模型处理海量数据并理解上下文。打造有效提示往往需要对这些底层架构有所了解。
- 训练数据与分词:LLM 在海量数据集上训练,会将输入数据分解为更小的片段(token)进行处理。分词方式(词级、BPE 等)的选择会影响模型如何理解提示。例如,某个词被不同方式分词,可能导致不同输出。
- 模型参数:LLM 拥有数以百万乃至数十亿计的参数。这些在训练过程中被微调的参数决定模型对提示的响应。理解这些参数与模型输出之间的关系,有助于打造更有效的提示。
- Temperature 与 Top-k 采样:在生成响应时,模型会使用如温度设置与 top-k 采样等技术来控制输出的随机性与多样性。比如,较高的温度可能产生更丰富(但可能不那么精确)的回答。提示工程师常通过调整这些设置来优化输出。
- 损失函数与梯度:在更深层次上,模型对提示的行为受其损失函数与梯度影响。这些数学构造引导模型的学习过程。尽管提示工程师通常不会直接调整它们,但理解其影响有助于洞察模型行为。
对于渴望理解此类模型内部机理的读者,我们的《Transformers 与 Hugging Face 入门教程》对热门 LLM 背后的机制有深入讲解。
为何提示工程重要
提示工程是确保人机高效沟通的桥梁。它不仅关乎得到正确答案,更关乎让 AI 理解每个问题背后的上下文、细微差别与意图。
提示工程的演进
提示工程虽是较新的学科,却深深扎根于自然语言处理(NLP)与机器学习的更长历史。理解其演进过程,有助于把握其当下的重要性。
NLP 的早期阶段
NLP 的起源可追溯到 20 世纪中期数字计算机的出现。早期 NLP 努力主要基于规则,依赖手工编写的规则与简单算法。这类系统僵硬,难以应对人类语言的复杂性与细微差异。
统计 NLP 与机器学习
随着算力提升与数据集增长,20 世纪末至 21 世纪初转向统计方法。机器学习算法开始发挥关键作用,使语言模型更灵活、更数据驱动。然而,这些模型在理解上下文与生成连贯长文本方面仍有限制。
基于 Transformer 的兴起
2017 年《Attention is All You Need》论文引入 Transformer 架构,成为转折点。Transformer 凭借自注意力机制,能处理海量数据并捕捉复杂语言模式。这推动了如 Google 的 BERT 等模型的发展,革新了文本分类、情感分析等任务。
OpenAI 的 GPT 带来的影响
OpenAI 的生成式预训练 Transformer(GPT)系列,尤其是 GPT-2 与 GPT-3,将 Transformer 推向新高度。这些拥有数十亿参数的模型在生成连贯、契合上下文、且常与人类难以区分的文本方面展现了前所未有的能力。GPT 的崛起凸显了提示工程的重要性,因为输出质量愈发依赖提示的精准与清晰。
当下的提示工程
随着基于 Transformer 的模型在产业、科研与日常应用中广泛采用,提示工程已成为关键学科。它是确保强大模型被有效利用的桥梁,使 AI 工具更易用、更友好。随着 OpenAI 的 o 系列、Anthropic 在 Claude 中扩展的“思考”、以及 DeepSeek 的 R1 等推理型模型兴起,对细腻且有效提示的需求也在变化。这些模型如今能在内部完成大量逐步推理。
与此同时,像Claude 的计算机使用这类具代理性的系统,以及更广泛的Model Context Protocol(MCP)生态,拓展了精心设计的提示在端到端自动化中的能力边界。
提示工程的最新进展
截至 2026 年,提示工程领域仍在快速演进,反映了 AI 及其应用的动态特性。近期的进步显著影响了我们与 AI 模型(尤其是 LLM)的互动方式。以下为一些关键进展:
更强的上下文理解
前沿模型如 GPT-5、Claude 4 与 Gemini 2.5 在理解上下文与细微差别方面展现出显著提升。
这些模型如今更善于解读复杂提示、考虑更广的上下文,并给出更准确、更细腻的回应。这一飞跃部分源自更复杂的训练方法与多元、广泛的数据集,使模型更有效地把握人类沟通的微妙之处。
自适应提示技术
自适应提示是一大新趋势:AI 模型会根据用户的输入风格与偏好调整响应。这种个性化旨在让人机互动更自然、更友好。比如,若用户偏好简洁提问,AI 也会相应给出简洁答案,反之亦然。这一发展在虚拟助手与聊天机器人等 AI 驱动应用中,尤为有助于提升用户体验。
多模态提示工程
AI 模型多模态能力的融合为提示工程打开了新前沿。多模态模型可处理并响应包含文本、图像,甚至音频在内的复合提示。这一进步意义重大,因为它为更全面的 AI 应用铺路,使其理解与互动更贴近人类的感知与交流方式。
实时提示优化
实时提示优化技术的进展让 AI 模型能够即时反馈提示的有效性。该技术会评估提示的清晰度、潜在偏见与与期望结果的匹配度,并给出改进建议。这种实时指导对新手与有经验的用户都极具价值,能简化打造有效提示的流程。
与领域特定模型的整合
提示工程也在与领域特定 AI 模型深度融合。这些专门模型基于行业数据训练,能对医疗、法律、金融等领域中的提示给出更准确、更相关的回答。将提示工程与此类定制模型结合,能显著提升 AI 在专业场景中的精度与实用性。
打造提示的艺术与科学
编写有效提示既是艺术也是科学。它是艺术,因为需要创造力、直觉与对语言的深刻理解;它是科学,因为其基于 AI 模型处理与生成响应的机理。
提示的微妙之处
提示中的每个词都重要。轻微措辞变化,都会让 AI 模型给出截然不同的输出。例如,“描述埃菲尔铁塔”与“讲述埃菲尔铁塔的历史”会得到不同结果:前者可能给出外观描述,后者则会探讨其历史意义。
理解这些细微差别至关重要,尤其在与 LLM 共事时。这些模型在海量数据上训练,能根据所接收的线索生成广泛的回应。关键不仅在于提出问题,更在于用与您期望结果相契合的方式来表述。
我们在如何使用 Midjourney创作视觉作品的指南中也看到这一点——在提示中为“space ship”一词设置不同权重,可能分别生成科幻飞船的图像,或是一艘在太空中航行的船。

提示的关键要素
我们来看一下一条好提示由哪些方面构成:
- 指令:这是提示的核心指示,告诉模型您希望它做什么。例如,“请总结以下文本”为模型提供了明确的动作。
- 上下文:上下文提供额外信息,帮助模型理解更广泛的情境或背景。例如,“考虑到经济下行,请给出投资建议”为模型提供了回答所依托的背景。
- 输入数据:这是您希望模型处理的具体信息或数据,可能是一段文字、一组数字,甚至一个词。
- 输出指示:在角色扮演等场景中尤为有用,引导模型所需的响应格式或类型。例如,“以莎士比亚的风格改写下面这句话”为模型给出了风格方向。
在我们的ChatGPT 提示工程专门指南中,我们给出了该工具的一些优质提示示例。

ChatGPT 提示工程实操
若想亲身实践,DataCamp《用 Python 构建聊天机器人》课程提供了为聊天交互编写提示的练习。
提示工程的技巧
打造完美提示常需要反复试验。以下技巧可助您一臂之力:
基础技巧
这些是普通用户即可用来改进提示的建议。
- 角色扮演:让模型扮演特定角色,如历史学家或科学家,可获得更契合的回复。例如,“以营养师的身份评估以下饮食方案”可能带来基于营养科学的回答。
- 迭代优化:从一个宽泛提示开始,依据模型反馈逐步细化。该迭代过程有助于将提示打磨至最佳。
- 反馈回路:利用模型的输出来调整后续提示。此动态互动能让模型的回应随时间更贴近用户预期。
进阶技巧
以下策略更为复杂,需要对模型行为有更深入理解。
- 零样本提示(Zero-shot)。不给示例,直接让模型执行其未在训练中“见过”的任务。此法测试模型的泛化能力。
- 少样本提示/上下文学习(Few-shot/In-context learning)。提供少量示例(shots)引导模型。借助上下文或过例,模型能更好地理解并生成期望输出。例如,在要求翻译新句子前展示若干翻译示例。
- 思维链(Chain-of-Thought, CoT)。引导模型按一系列推理步骤进行。将复杂任务拆解为中间步骤或“推理链”,可提升语言理解与输出准确度,类似于一步步带人解一道复杂数学题。
若想更深入了解这些技巧背后的方法,我们的《使用 spaCy 的高级 NLP》课程提供了动手练习与真实案例。
在具体与开放之间找平衡
提示越具体,回应往往越精准,但保留一定开放性也有价值。这样模型可发挥其广泛训练所得,提供不那么显而易见的见解或答案。例如,“告诉我一些关于太阳系的有趣知识”虽较开放,却可能产出颇具启发的内容。

借助 Google Gemini 等工具,您可按需具体或开放
提示工程如何运作
撰写首个提示只是开始。要真正发挥 AI 模型的威力并确保其契合用户意图,必须对提示进行打磨与优化。此迭代过程融合艺术与科学,需要直觉与数据驱动洞见兼备。
1. 创建合适的提示
我们在另一篇文章中探讨了营销领域的 ChatGPT 提示,并整理了涵盖该工具诸多细节的ChatGPT 备忘单。此外,还有许多涉及提示编写的框架(如 LangChain、LlamaIndex,以及 OpenAI 与 Anthropic 的 SDK)。
以下是为 AI 工具创建提示的一般规则:
- 清晰至上:确保提示清楚明了、毫不含糊。除非情境需要,否则避免使用行话。
- 尝试角色扮演:如前所述,让模型承担特定角色,常能得到更契合的回应。
- 使用约束:设定边界或限制可帮助模型朝期望输出收敛。例如,“用三句话描述埃菲尔铁塔”为长度设定了明确约束。
- 避免引导性问题:引导性问题可能使模型输出带偏见。保持中立,方能获得不偏不倚的回应。
2. 迭代与评估
优化提示是一个迭代过程。典型流程如下:
- 起草初始提示:基于当前任务与期望输出。
- 测试提示: 用 AI 模型生成响应。
- 评估输出: 检查响应是否契合意图并满足标准。
- 细化提示: 依据评估进行必要调整。
- 重复: 循环上述步骤,直至达到理想输出质量。
在此过程中,还应考虑多样输入与场景,确保提示在更广范围内有效。
3. 校准与微调
除打磨提示本身外,还可对 AI 模型进行校准或微调。这涉及调整模型参数,使其更契合特定任务或数据集。尽管此法更为高级,但对专业应用的性能提升显著。
若想深入了解模型校准与微调,我们的《LLM 概念》课程覆盖了微调技术与训练内容。
提示工程师的角色
随着 AI 持续塑造各行各业并重塑我们与技术的互动方式,一种新角色走上前台:提示工程师。此角色在衔接人类意图与机器理解方面至关重要,确保 AI 模型高效沟通并产出相关输出。
AI 领域的新职业路径?
自然语言处理(NLP)的快速进步与大型语言模型(LLM)的广泛采用,催生了对能编写有效提示专家的细分且关键需求。这些被称为提示工程师的人不仅是技术人员,也是懂语言、上下文与 AI 行为细微之处的“艺术家”。
正如《时代》杂志等媒体所报道,从科技巨头到初创公司都在认识到提示工程岗位的价值。随着 AI 驱动解决方案更深入地融入产品与服务,提示工程师的专业能力确保这些方案有效、易用且契合语境。
自 2023–2024 年的最初热潮以来,提示工程的就业市场已趋成熟。独立的“提示工程师”头衔有所降温,但这项技能已融入更广泛的 AI 岗位之中——AI 工程师、应用型 ML 工程师、AI 解决方案顾问与对话设计师等职位普遍将其列为核心要求。薪资差异较大:Coursera 报告的美国中位数约为每年 126,000 美元,而 ZipRecruiter 上的入门岗位更接近 63,000 美元。

Indeed 上发布的提示工程师职位(链接)
提示工程的技术技能
视具体岗位及技术要求不同,提示工程师需具备以下技术基础:
- 理解 NLP: 掌握自然语言处理技术与算法至关重要。
- 熟悉 LLM: 具有 GPT、Claude、Gemini、Llama 等模型及其底层架构的实践经验。
- 实验与迭代: 能够基于模型输出进行测试、打磨与优化提示。
- 数据分析: 分析模型回应、识别模式、据此做出数据驱动决策。
若希望获取或提升技术能力,我们的《Python 自然语言处理技能路径》为有志成为提示工程师的人提供了系统课程。
提示工程的非技术技能
除技术实力外,提示工程师还需具备一系列非技术能力:
- 沟通能力: 能清晰表达观点、与团队协作并理解用户需求。
- 领域专长: 视应用而定,特定领域知识往往极具价值。
- 语言素养: 在语言、语法与语义上的造诣,能帮助打造有效提示。
- 批判性思维: 评估模型输出、识别偏见并确保遵循 AI 伦理。
- 创造力: 跳出固有思维,尝试新提示风格并创新解决方案。
这些软技能与技术专长相结合,使提示工程师这一角色既具挑战性又颇具回报,为新一代的人机协作铺平道路。
提示工程的未来
站在 AI 驱动时代的门槛上,提示工程有望在塑造人机交互的未来中发挥关键作用。该领域虽仍然年轻,却蕴藏巨大潜力与增长空间。
持续的研究与发展
AI 世界瞬息万变,研究与创新层出不穷。在提示工程的语境下:
- 自适应提示:研究者正探索让模型根据上下文自适应生成提示,从而减少人工输入需求。
- 多模态提示:随着可同时处理文本与图像的多模态模型崛起,提示工程的范围正扩展至纳入视觉线索。
- 伦理性提示:随着 AI 伦理的重要性提升,人们更关注编写确保公平、透明并减轻偏见的提示。
若希望掌握最新进展,我们关于生成式 AI 伦理的文章覆盖了当前面临的一些重大问题。您也可参阅另一份指南,了解AI 工程师技能及其与提示工程的重叠之处。
长期价值与相关性
提示工程并非昙花一现。随着 AI 模型日益复杂,且被广泛集成到从医疗到娱乐的多样应用中,高效沟通的需求愈发关键。提示工程师将成为确保这些模型易用、友好且契合语境的关键人物。
此外,随着 AI 的普及,更多缺乏技术背景的人开始与这些模型互动,提示工程师的角色也将演变。他们将负责打造直观界面、编写用户友好的提示,并确保 AI 仍是增强人类能力的工具。
挑战与机遇
与任何新兴领域一样,提示工程也面临诸多挑战:
- 模型复杂性:随着模型规模与复杂度增长,编写有效提示更具挑战。
- 偏见与公平:确保提示不会无意引入或放大输出中的偏见。
- 跨学科协作:提示工程处于语言学、心理学与计算机科学的交叉地带,需要跨学科合作。
然而,这些挑战同样孕育机遇。它们推动创新、促进跨学科协作,并为新一代 AI 工具与解决方案铺路。
提示工程的伦理考量
随着 AI 成为诸多行业的“标配”,提示工程的伦理考量也愈发重要。提示工程师的职责不仅是编写有效提示——还需确保 AI 模型以公平、无偏、合乎伦理的方式与用户互动。以下为重点关注领域:
减轻偏见
提示工程师在降低 AI 输出偏见方面起关键作用,这些偏见可能源自训练数据或提示的措辞。策略包括:
- 中性提示设计:避免引导性问题或可能使模型偏向特定回答的提示。
- 公平性测试:用多样输入定期测试提示,确保在不同人群或情境下输出均衡。
- 关注数据偏见:了解用于训练 LLM 的数据集,并通过提示来抵消其中潜在的偏见。
公平的 AI 交互
为确保交互公平,提示工程师可以:
- 使用具备语境意识的提示:引导模型在回答中纳入更广阔视角,例如包含代表性不足的观点。
- 监测伦理标准:将伦理准则纳入提示工程实践,避免诱发有害或歧视性输出的提示。
透明与可解释性
提示工程师应通过设计促进清晰、可理解的人机互动来追求透明性。这包括:
- 在回应中强调 AI 的局限性。
- 设计鼓励模型引用来源或阐明推理过程的提示。
结语
人工智能领域广阔、精妙且不断演进。通过梳理提示工程的方方面面,不难发现,这一领域远不止技术实践——它是人类意图与机器理解之间的桥梁,是以恰当方式发问以引出理想答案的细腻艺术。
提示工程虽为新兴学科,却握有释放 AI 模型(尤其是大型语言模型)全部潜力的钥匙。随着这些模型日益融入我们的日常生活,高效沟通的重要性不言而喻。无论是帮助处理日常任务的语音助手、提供客户支持的聊天机器人,还是辅助研究人员的 AI 工具,交互质量都取决于引导它们的提示。
对数据爱好者、从业者乃至公众而言,理解提示工程不仅关乎更好的 AI 沟通,更关乎畅想一个 AI 与我们生活无缝融合、增强我们能力并丰富我们体验的未来。
就站在这一节点上看,提示工程的未来可期,既有待攻克的难题,也有待实现的里程碑。若您对该领域颇感兴趣,旅程才刚刚开始。通过我们的课程了解提示工程基础,在另一份指南中探索如何学习 AI,或在教程中学习如何用 PyTorch 训练自有 LLM。
提示工程常见问答
在 AI 语境下,“提示”究竟是什么?
提示是给予 AI 模型(尤其是大型语言模型,LLM)的一个问题或指令,用以引出特定回应。它充当人类意图与机器输出之间的接口。
为什么提示工程很重要?
提示工程确保 AI 模型产出准确且相关的结果。这是一门编写有效提示以引导模型行为的艺术,关乎实现高效的人机沟通。
理解提示工程是否需要 AI 或机器学习背景?
具备 AI 背景会有帮助,但并非必需。提示工程既关乎语言与沟通,也涉及技术专长。只要资源与学习得当,任何人都能掌握其基础。
提示工程与聊天机器人、语音助手有何关系?
聊天机器人与语音助手高度依赖提示。您提出的问题或下达的命令本质上就是提示。有效的提示工程可确保这些工具准确理解并回应用户请求。
提示工程是否存在风险?
与任何 AI 实践一样,提示工程也可能面临挑战。带偏见或设计拙劣的提示会导致模型输出不准确或有偏。进行提示工程时应谨慎行事,确保公平与透明。