NVIDIA Nemotron Chat Model 节点#
使用 NVIDIA Nemotron Chat Model 节点,通过对话式 agent 访问 NVIDIA Nemotron 模型。该节点适用于托管在 build.nvidia.com 上的 Nemotron 模型,也适用于自托管的 NVIDIA Inference Microservices (NIM)。
本页介绍 NVIDIA Nemotron Chat Model 节点的参数,并提供更多资源链接。
凭据
你可以在此处找到此节点的身份验证信息。
子节点中的参数解析
子节点在使用表达式处理多个项目时的行为与其他节点不同。
大多数节点,包括根节点,接受任意数量的项目作为输入,处理这些项目,并输出结果。您可以使用表达式引用输入项目,节点会依次为每个项目解析表达式。例如,给定五个 name 值的输入,表达式 {{ $json.name }} 会依次解析为每个名称。
在子节点中,表达式始终解析为第一个项目。例如,给定五个 name 值的输入,表达式 {{ $json.name }} 始终解析为第一个名称。
Node parameters 节点参数#
Model 模型#
选择用于生成补全的 Nemotron 模型。
n8n 会从你在凭据中配置的端点动态加载 Nemotron 模型。如果 n8n 无法访问该端点,它会回退到一组精选的常用 Nemotron 模型 ID。
Node options 节点选项#
使用这些选项进一步细化节点行为。
Frequency Penalty 频率惩罚#
使用此选项控制模型重复自身内容的概率。值越高,模型重复自身内容的概率越低。
Maximum Number of Tokens 最大 token 数#
输入要使用的最大 token 数,用于设置补全长度。使用 -1 表示采用模型默认值。
Response Format 响应格式#
选择 Text 文本或 JSON。JSON 可确保模型返回有效 JSON。选择 JSON 时,请在 chain 或 agent 的提示中包含 json 一词。
Presence Penalty 存在惩罚#
使用此选项控制模型谈论新主题的概率。值越高,模型谈论新主题的概率越高。
Sampling Temperature 采样温度#
使用此选项控制采样过程的随机性。较高的温度会产生更多样化的采样,但会增加幻觉风险。
Timeout 超时#
输入最长请求时间(毫秒)。
Max Retries 最大重试次数#
输入请求的最大重试次数。
Top P#
使用此选项设置补全应使用的概率。使用较低的值可忽略概率较低的选项。
模板和示例#
相关资源#
请参阅 NVIDIA build catalogue 获取 Nemotron 模型列表,并参阅 NIM 文档了解自托管指导。由于 NVIDIA API 兼容 OpenAI 规范,你也可以参考 LangChain 的 OpenAI 文档了解底层客户端的更多信息。
查看 n8n 的高级 AI文档。