AI 进阶用法 — 提示词技巧 + 避坑指南
拿到 ChatGPT / Claude / Gemini 之后怎么用得顺手。本文整理常用提示词框架、上下文管理、多模态使用、避坑场景。每个章节带具体例子。
买了订阅之后,真正开始用是另一个学习过程。本教程整理日常高频用法, 让你少走弯路。所有内容都基于实际使用经验,不是理论。
提示词框架
没有「最优」提示词,但有一个能复用的框架:
角色:你是一个 [具体身份,如「资深 Python 开发」] 任务:[一句话说清楚要 AI 做什么] 上下文: - [背景信息 1] - [背景信息 2] 输出格式: - [格式 1,如「Markdown 表格」] - [格式 2,如「保留代码块标识」] 限制: - [限制 1,如「不要输出免责声明」] - [限制 2,如「字数控制在 500 字以内」]
例子(让 AI 帮你写一段 Python 代码):
角色:你是一个资深 Python 后端开发,熟悉 FastAPI 和 PostgreSQL。 任务:帮我写一个用 FastAPI 实现的用户登录接口。 上下文: - 用户表已经存在,字段:id, email, password_hash, created_at - 密码用 bcrypt 加密 - 登录成功返回 JWT token,有效期 7 天 输出格式: - 完整 Python 代码块,包括所有 import - 关键逻辑加中文注释 限制: - 不要写测试代码 - JWT secret 用环境变量 JWT_SECRET 读取
上下文管理
AI 模型有上下文窗口限制(GPT-4o 约 128K tokens,Claude 3.5 Sonnet 约 200K tokens)。 长对话超出窗口后,模型会「忘记」前面的内容。管理技巧:
- 新话题开新对话:不要在一个对话里跨主题聊。混合的上下文会让模型混淆。
- 关键信息复述:长对话中,涉及关键决定时把背景再复述一遍,确保模型还记得。
- 用 system prompt(API 用户):把固定的角色 / 规则放 system,可变内容放 user。
- 定期总结:超长对话主动让 AI「总结到目前为止的关键决策」,然后开新对话用这个总结起手。
多模态使用
图片输入
- ChatGPT(Plus/Pro): 直接上传图片,可分析、识图、看图答题。
- Claude(Pro): 同样支持,长截图识别尤其稳。
- 用法举例:截屏报错给 AI 排查、把手写笔记拍下来让 AI 转 markdown。
文件上传
- PDF / DOCX / 代码文件 / Excel 都能上传。
- 大文件先让 AI 「先读完整篇,然后告诉我目录」,再针对章节追问。
语音
ChatGPT App 支持语音对话(Voice Mode),适合通勤 / 散步时用。Claude 暂不支持。
常见避坑
1. 幻觉(瞎编)
AI 在不知道答案时会编造看起来合理的东西。处理方式:
- 关键事实/引用要求 AI 明确说不知道(在提示词里加「如果不确定就直接说不知道」)。
- 带 URL 的引用要自己点开核实。
- 代码 API 调用要查官方文档,别信 AI 编的方法名。
2. 模型选错
ChatGPT Plus 默认 GPT-4o,Pro 用户能选 GPT-4 / o1 / o1-pro。 简单任务用 4o(快),严肃推理用 o1(慢但准)。
3. 不要把敏感信息发给 AI
商业机密 / 个人身份证号 / 银行密码,**不要发给任何 AI**。 默认所有对话可能被用于模型训练(可以在设置里关掉数据共享,但仍不建议发敏感信息)。
4. 中文 vs 英文
Claude / GPT 内部用英文思考效果最好,但中文输入也完全 OK。 遇到模型反应「不太对劲」,试试用英文重新提问,常常立刻改善。
推荐资源
- Anthropic 官方提示词手册:Claude 提示词最权威的参考。
- OpenAI Cookbook:ChatGPT API 调用的实例代码集。
- r/PromptEngineering(Reddit):社区驱动的提示词技巧分享。
常见问题
ChatGPT 和 Claude 有什么区别?
ChatGPT 综合能力强、生态最丰富(插件、Codex、GPT Store);Claude 在长文本、代码、严肃推理上更稳。日常聊天看个人喜好,代码 / 写作建议 Claude,通用任务 / 多模态用 ChatGPT。
提示词有标准模板吗?
没有「最优解」,但有「框架」:角色 + 任务 + 上下文 + 输出格式 + 限制。本文里有具体例子。
Codex 怎么用?
Codex 是 ChatGPT Pro 包含的功能,通过 Web / VS Code 插件 / CLI 三种入口都能用。具体看 OpenAI 官方文档。