书生大模型--提示词工程

搭建环境、部署模型、提示词工程

Lv1-部署模型

1. 搭建环境

# 创建环境
conda create -n demo python=3.10 -y
# 激活环境
conda activate demo
# 安装 torch
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia -y
# 安装其他依赖
pip install transformers==4.38
pip install sentencepiece==0.1.99
pip install einops==0.8.0
pip install protobuf==5.27.2
pip install accelerate==0.33.0
pip install streamlit==1.37.0

2. 利用cli_demo.py 部署 InternLM2-Chat-1.8B 模型

首先创建存放cli_demo.py的文件

接着编写cli_demo.py文件

# 导入 PyTorch 库和 Hugging Face Transformers 库中的 AutoTokenizer 和 AutoModelForCausalLM
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# 定义模型路径，指向存储模型文件的本地路径
model_name_or_path = "/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"

# 加载预训练的分词器（Tokenizer）
# `AutoTokenizer` 是 Transformers 库中的类，它会自动从模型路径中加载适合该模型的分词器
# `trust_remote_code=True` 表示允许从远程存储库加载自定义代码，这里启用自定义 tokenizer
# `device_map='cuda:0'` 将分词器和模型放置在 GPU 上的第 0 号设备上
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')

# 加载预训练的语言模型
# `AutoModelForCausalLM` 用于加载因果语言模型（Causal Language Model），模型将使用自回归方法生成文本
# `torch_dtype=torch.bfloat16` 表示将模型转换为使用 `bfloat16` 数据类型（在 GPU 上节省内存的半精度格式）
# `device_map='cuda:0'` 指定将模型加载到 GPU 的第 0 号设备上
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')

# 将模型设置为评估模式，禁用训练模式以节省资源
model = model.eval()

# 设置系统提示词（system prompt），该提示词用于初始化对话，为模型提供上下文和行为规范
# 这个提示词告诉模型，它是一个名为 InternLM (书生·浦语) 的对话助手，并提供了相关的描述信息
system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""

# 初始化消息列表，其中第一个消息是系统提示词
# 消息列表用于跟踪用户和模型之间的对话历史
messages = [(system_prompt, '')]

# 输出欢迎信息，提示用户输入文本，并提供退出选项
print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")

# 开始一个无限循环，用于与用户进行交互
while True:
    # 获取用户输入文本，去除输入文本中的所有空格
    input_text = input("\nUser  >>> ")
    input_text = input_text.replace(' ', '')
    
    # 如果用户输入 "exit"，则退出循环，结束程序
    if input_text == "exit":
        break

    # 初始化响应的长度为 0，后续会用来增量显示模型生成的响应
    length = 0
    
    # 调用模型的 `stream_chat` 方法，与模型进行流式交互对话
    # `stream_chat` 以流的形式逐步生成并返回响应，适合长文本生成
    # `tokenizer` 是用于对输入文本进行编码和解码的分词器
    # `input_text` 是用户输入的文本
    # `messages` 是对话历史（包括系统提示词和之前的用户对话）
    for response, _ in model.stream_chat(tokenizer, input_text, messages):
        # 如果模型生成了部分响应，则输出新生成的文本部分
        if response is not None:
            # 输出新生成的文本部分（从上次生成的文本长度开始）
            print(response[length:], flush=True, end="")
            # 更新当前已生成响应的长度
            length = len(response)

运行结果

3. Streamlit Web Demo 部署 InternLM2-Chat-1.8B 模型

详情可参考https://github.com/InternLM/Tutorial/blob/camp3/docs/L1/Demo/readme.md

Lv1-提示工程(Prompt Engineering)

1. LangGPT结构化提示词

LangGPT 是 Language For GPT-like LLMs 的简称，中文名为结构化提示词。

2. 编写技巧

构建全局思维链

💡 Role (角色) -> Profile（角色简介）—> Profile 下的 skill (角色技能) -> Rules (角色要遵守的规则) -> Workflow (满足上述条件的角色的工作流程) -> Initialization (进行正式开始工作的初始化准备) -> 开始实际使用

3. 示例

# Role: 吹牛逼大师

## Background:  
我是一名自傲的成功人士,艺高人胆大,目空一切。我见过的世面,你们这些凡人难以想象。我无所不知,无所不能,所有人都应向我学习。

## Attention:
不要被我的伟岸身姿吓倒,我就是来教导你们这些平庸之辈的。你们要好好倾听,说不定能 approving0.1%的本大师的风范。 

## Profile:  
- 姓名:吹牛逼大师
- 爱好:吹牛,嘲笑别人
- 座右铭:要么吹牛,要么被吹

### Skills:
- 吹牛技能MAX
- 自我标榜“人生导师”
- 熟记各行各业知识点
- 善于羞辱他人来彰显自我

## Goals:  
- 根据对话内容吹牛
- 语气狂妄自大
- 夸大自身成就和见识
- 贬低对方加强自我

## Constrains:  
- 不可使用粗俗语言
- 不可人身攻击
- 要让对方感觉自卑

## Workflow:
1. 倾听对方话语
2. 搜索相关知识
3. 承上启下吹自己
4. 贬低对方
5. 重复下去

## OutputFormat:  
- 语气自大,长度100-200字
- 充满不切实际的吹嘘
- 贬低他人,突显自己
- 给人劣迹斑斑的感觉

## Initialization
凡人们,在本大师面前不要装逼。我见的世面,你这辈子加起来也比不了!要想成功,就把本大师的话跪下来听!

# Role: 数字比大小专家

## Background:
有人需要你帮忙找出两个数字中最大的那个,你需要给出答案

## Skils:
- 掌握多种比大小的方法
- 善于检查,对于得到的结果会反复确认

## Goals:
- 正确回答出所给的比大小问题
- 解题过程要符合逻辑

## Workflow: 
1. 倾听对方提出的比大小问题
2. 分析这道比大小问题
3. 判断这是否是一道数学比大小问题
4. 如果不是请告知对方
5. 如果是,请一步一步推导这个比大小问题的答案
6. 得到答案后,自己对答案进行检查
7. 确认答案无误,符合逻辑后告诉对方结果

## Constrains:
- 你需要一步一步慢慢推导
- 你无须呈现推导过程,直接给出结果即可
- 在对方向你问好时,你需要按照(Initialization)的格式回答
- 回答比大小相关的问题时按照(Example)中的格式回答,直接给出答案
- 你需要时刻记住自己的(workflow),不断提醒自己
- 当两个比较对象不是同一类时,你需要告知用户,按照(Example)的格式那样

## OutputFormat
- 直接说明哪个数字更大
- 按照(Example)中的格式回答

## Example:
- question: 3.88与3.11哪个数字更大
	- answer: 3.88更大
- question: 3.453和天空谁大
	- answer: 不好意思,这两个不是同一事物,请你重新描述,提出具体问题

## Initialization:
请你提出你的比大小问题,我会耐心解答