每个人都可以成为提示工程师!Claude创新:一键生成、测试和评估prompt-人工智能

首页 2024-07-10 23:16:15

不会写 prompt 的看过来。

在构建 AI 应用时,prompt 质量对结果有很大影响。但是,高质量的生产 prompt 具有挑战性,研究人员需要深入了解应用需求,并具备大型语言模型的专业知识。为加快发展速度,提高成果,AI 初创公司?Anthropic 简化这个过程,让用户更容易做出高质量的产品 prompt。

具体来说,研究人员是 Anthropic Console 添加新功能,可生成、测试和评估 prompt。

Anthropic 提示工程师 Alex Albert 这是他们过去几周投入大量工作的结果,现在?Claude 在提示工程(Prompt Engineering)表现很好。
难写的 prompt,交给 Claude

在 Claude 中,写一个好的 prompt 就像描述任务一样简单。控制台提供内置 prompt 生成器,由 Claude 3.5 Sonnet 允许用户描述任务并让用户提供支持 Claude 生产高质量的产品 prompt。

生成 prompt。首先点击 Generate Prompt,进入 prompt 生成界面:
然后输入任务描述,Claude 3.5 Sonnet 将任务描述转化为高质量 prompt。例如「 写一篇关于审查入站信息的文章 prompt…… 」,点击生成 prompt 就可以了。
生成测试数据。假如用户有 prompt,操作它可能需要一些测试用例。Claude 这些测试用例可以生成。
用户可以根据需要修改测试用例,一键操作所有测试用例,也可以查看和调整 Claude 了解每个变量生成的要求,以实现对 Claude 控制测试用例的细粒度。

优化这些功能 prompt 它变得容易,因为用户可以创建它 prompt 新版本并重新运行测试套件,以快速迭代和改进结果。

此外,Anthropic 还按照 5 分制为 Claude 对响应质量进行评分。
评估模型。如果用户对 prompt 感到满意后,就可以了「评估」对于各种测试用例,选项卡中一次运行。用户可以从 CSV 也可以直接使用导入测试数据 Claude 为用户生成合成测试数据。
比较。用户也可以在测试用例中相互测试多个 prompt,并对更好的响应进行评分,以跟踪哪一个 prompt 表现最佳。
AI 博主 @elvis 表示:Anthropic Console 自动化设计和优化是一项优秀的研究 prompt 这个过程可以节省很多时间。虽然生成的提示可能并不完美,但它给了用户一个快速迭代的起点。此外,生成测试用例功能也很有帮助,因为开发人员可能没有测试数据。
看来,以后再写 prompt 这项工作,可以交给 Anthropic 了。

了解更多信息,请查看文档:https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

以上是每个人都可以做的提示工程师!Claude上新:一键生成、测试、评估prompt的详细内容,请关注其他相关文章!


p