用好deepseek等大模型的一些必备知识
原创一、基础使用原则
自然表达优先
直接描述需求即可,无需复杂指令或角色扮演(如“用学术语言分三点回答”),例如直接提问“如何用Python写计算器程序?”更高效。但需注意,部分场景下角色扮演(如“你现在是资深营养师”)仍可提升专业性。任务描述需具体明确
避免模糊指令(如“写好看的故事”),应细化要求(如“写800字悬疑小说,主角是快递员,结局反转”),并提供格式、风格和字数限制。多轮对话优化结果
若首次回答不完整,可通过追问补充细节(如“详细解释第二步”“换个更简单的说法”),无需一次性完美提示。
二、提示词核心技巧
提供示例与上下文
举例说明需求,例如要求生成数学题时,可给出类似“[GESP202412二级]数位和”的样例,并明确代码实现要求(如使用特定头文件和测试数据)。活用“魔法指令”
使用快捷指令提升效率:/步骤
:分步骤指导操作流程/简化
:将复杂内容转为大白话/示例
:生成实际案例(尤其代码场景)/续写
:自动继续中断的回答。避免五类常见错误
笼统描述需求
忽略格式和字数限制
未提供参考案例
混淆AI与人类认知差异(如依赖常识)
未分阶段追问优化结果。
三、功能与模式选择
模型版本适配场景
日常问答:优先使用基础模型(如DeepSeek 7B)。
复杂推理:切换到R1模型,其整合CoT(逐步推理)和Pro Search(情境感知搜索),擅长数学、编程和决策任务。
最新信息查询:开启联网功能,但需注意联网搜索与上传附件不可同时使用。
专业输出模式
勾选“深度思考”选项以增强逻辑严谨性,尤其在法律推理、工程问题等专业领域
四、技术特性与限制
推理能力优势
DeepSeek通过推理SFT(冷启动)和强化学习优化,在数学、代码、逻辑推理任务中表现突出,支持长上下文(128K tokens)和多模态理解
开源与成本优势
其开源版本(如DeepSeek-V3)训练成本低至280万GPU小时,企业可免费使用或部署蒸馏后的小模型(32B/70B),节省数百万授权费
五、高级功能与技巧
角色扮演与记忆功能
连续对话中模型会自动记忆前文设定,可通过角色指令(如“作为资深营养师”)定制输出风格。数据与安全合规
涉及企业数据时需注意隐私保护,结合知识图谱和RAG技术可增强风控能力(如NabulaGraph+LLM方案)。本地部署与扩展
支持本地部署(如DeepSeek-V3、R1模型),需掌握Python、API调用及PyTorch框架基础,B站提供保姆级教程
六、学习资源与路径
系统学习建议
入门:从Prompt工程和本地部署教程入手(如B站3分钟部署指南)。
进阶:学习Transformer架构、微调技术(如DPO)及多模态应用(如JanusFlow框架)。
企业应用:参考《DeepSeek入门宝典》和《2025大模型白皮书》,掌握AI提效路径
注意事项
版本差异:不同模型变体(如DeepSeek-R1、V3)功能侧重不同,需根据任务选择。
输入限制:单次输入需控制字数,避免过长导致信息丢失。
伦理风险:输出内容需人工审核,尤其在法律、医疗等高风险领域。
通过结合上述要点,可充分发挥DeepSeek在效率、推理和成本方面的优势,适应多样化场景需求。


版权声明
如有错误或侵权,请联系我删除,QQ123242726。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。