控制输出随机性,0 最确定 / 2 最发散,默认 0.7
单次回复最多 token 数,包含 prompt 和补全,默认 16000
概率累积阈值,只从概率和达 top_p 的 token 中采样,1 为不限制
对已出现 token 的惩罚,值越高越避免重复用词,范围 0~2
对已出现话题的惩罚,值越高越鼓励谈论新话题,范围 0~2
输入消息开始对话