ChatGPT的迅速崛起,推动了提示工程师的薪资水平不断攀升,如今已有部分从业者的年薪达到了25万到33万美元。
21世纪的重要技能:提示工程
随着人工智能技术的飞速发展,AI领域的竞争愈发激烈。谷歌发布了其基于大规模语言模型LaMDA的搜索聊天机器人Bard,微软则推出了由ChatGPT驱动的下一代Edge浏览器以及全新的必应搜索引擎。
尽管这一领域的技术早已在大型科技公司内部悄然发展,但自从OpenAI的ChatGPT广受欢迎后,各大巨头纷纷抢着向公众展示自己的AI实力。
生成式AI被普遍看作是替代从搜索引擎到故事创作、科学研究、家庭作业和学校教学等各种创造性或重复性工作的新技术,预计将重塑我们所处的世界。
如果这种人工智能范式的转变确实发生,21世纪的一项重要技能很可能就是如何有效地与机器对话,即所谓的「提示工程」。
DALL-E 2与Midjourney等图像生成模型,以及ChatGPT等文本生成工具,都是创造工作的新手段。然而,要成功利用这些工具,首先需掌握如何引导AI以实现预期的效果。
明确的提示与成功的输出
例如,当要求ChatGPT撰写一篇关于《动物农场》的五段式读书报告时,可能会得到令人印象深刻但并不准确的结果。然而,如果提供一个更清晰的提示:“请用优雅的散文风格撰写一篇大学水平的五段式读书报告,分析讽刺性寓言小说《动物农场》的历史,参考奥威尔的《我为什么要写作》,并解释作者在小说中的风格选择”,则可能会得到更成熟且有说服力的输出。
可以说,良好的提示不仅需要明确,还需更深入地反映出你希望AI完成的任务。
新兴职业:提示工程师
美国作家Charlie Warzel分享了他和自己8岁侄子去年夏天一起使用Midjourney的经历。他们本想创造一个有趣的场景:“一只跳蚤在海啸中冲浪,并与一只巨大的黄蜂战斗。”然而,最终效果并未如愿:最开始的图像显得不够卡通,而调整后的图像又过于超现实,超出了侄子的接受范围。
这名作家意识到,尽管他是以写作为生,但在指导AI时,他的描述依然过于模糊,至少对于AI而言是这样的。
不过,尽管与AI的对话存在困难,如今已经出现了一个新兴产业来帮助你掌控AIGC的使用——“提示专卖店”。
在网站PromptBase上,你可以以相对低廉的价格购买到能让AI稳定输出特定主题的提示。
在PromptBase上,各类提示应有尽有,从DALL-E到Midjourney以及Stable Diffusion,热门的提示之一是用DALL-E 2生成粘土风格的可爱3D emoji。
另一种提示则只需花费2.99美元,即可让Stable Diffusion无限生成相似风格的电影女主角。
PromptBase第六大卖家是一位昵称为Imagineer的西班牙人,他表示提示工程只是他的副业,自去年9月以来他仅赚了800多欧元。他将其视为一场游戏,认为这些提示就是他的“小宝贝”。
Imagineer的提示编写过程基于他在设计、插图与摄影方面的知识。当被问及为何认为自己擅长撰写提示时,他提到这是自然技能与策略的结合。他说:“我意识到我比其他人更擅长与Midjourney进行对话,并且在此过程中,经验的积累能够带来显著的成果。”
Imagineer强调,迭代是关键。当你生成大量图像并微调某些词语或参数时,一个好的提示能够产生一致、可预测的结果。专业知识在提示工程中也至关重要。
Dan Shipper是一位企业家兼作家,自ChatGPT发布以来,他一直使用该工具辅助撰写主题为人工智能工具未来的博客文章。
当他需要描述某个概念(例如撰写关于失宠的加密货币CEO Sam Bankman-Fried的文章时)时,会要求ChatGPT用几句话总结有效利他主义的关键点。输出文本后,他会检查其准确性,并用修辞手法美化文本。
Shipper将提示ChatGPT的工作比作管理一位聪明而热心的初级雇员。他认为,ChatGPT虽然热情和熟练,但仍缺乏经验,容易犯一些细微却重要的错误。一旦不知所措,它就容易胡说八道。
他总结说,创造成功提示所需的品味与经验不可或缺。例如,他会让ChatGPT撰写一篇长文的大纲:“我写了一堆要点,然后告诉ChatGPT:这些是我收集的各种名言、想法和短语。你能否将它们整理成一份论文大纲?”显然,Shipper在微调提示方面的努力越多,得到的输出质量就越高。
有时,提示的撰写本身也带来特殊的愉悦感。Meg Conley是一位业余时间使用AI工具的作家,她认为提示工程是一种挑战,类似于撰写有说服力的文章。“提示工程非常困难且常常失败,”她在推特上写道, “当文字组合出看起来与自己脑海中的世界相近的画面时,那种喜悦是纯粹的。”
职业与教育的新趋势
对于许多老师来说,ChatGPT是个潜在威胁,但部分开明的教授意识到,学习如何使用提示是学生们学业生涯中需掌握的重要技能。宾夕法尼亚大学教授Ethan Mollick在教授“创新与创业”课时,自ChatGPT发布后修改了教学大纲。
在新的课程中,Mollick要求学生把ChatGPT视作一个学生,通过提示教会这个机器人撰写关于特定课程概念的文章。在这个过程中,学生必须像教授一样帮助ChatGPT完善文章,直到其看起来完全掌握该主题。
Mollick希望这一练习能帮助学生通过解释的过程进行学习,同时培养写出巧妙提示的能力。他认为,提示工程位于语言学与解决问题之间。
“提示像是一种用散文编程的形式,会产生奇怪而随机的结果。而好的提示则奖励那些能迅速找到实验方法、具备发散性思维的人。它奖励的是那些拥有深度好奇心的人。”
在Midjourney的Discord服务器上,有一幅引人注目的图片是用详尽到痛苦的输入生成的,描述了一个具有形而上画派风格的场景。
这不仅说明了具体性的重要性,好的提示往往能反映出用户对媒介复制能力的认知。例如,某些术语的输入是指示Midjourney使用更新、更强大、实验性的模型版本。
虽然如今日益提升的用户友好性使搜索引擎变得更容易操控,但Prompt工程的出现则为人与AI之间的互动提供了新的思路。正如Mollick所言,提示工程是与人工智能互动的一种基础方式,通过明确的提示来引导AI,帮助我们创造所需的内容。
未来的AI工具将会更加智能,就像人类的个人助理。随着技术的不断进步,提示工程也有可能成为一种新兴的思维形式,介于查询与对话、编程与散文之间。它象征着在快速变化的时代中我们与AI互动的新方式,带有鲜明的人性化色彩。