NVIDIA Nemotron Chat Model 节点#

使用 NVIDIA Nemotron Chat Model 节点，通过对话式 agent 访问 NVIDIA Nemotron 模型。该节点适用于托管在 build.nvidia.com 上的 Nemotron 模型，也适用于自托管的 NVIDIA Inference Microservices (NIM)。

本页介绍 NVIDIA Nemotron Chat Model 节点的参数，并提供更多资源链接。

凭据

你可以在此处找到此节点的身份验证信息。

子节点中的参数解析

子节点在使用表达式处理多个项目时的行为与其他节点不同。

大多数节点，包括根节点，接受任意数量的项目作为输入，处理这些项目，并输出结果。您可以使用表达式引用输入项目，节点会依次为每个项目解析表达式。例如，给定五个 name 值的输入，表达式 {{ $json.name }} 会依次解析为每个名称。

在子节点中，表达式始终解析为第一个项目。例如，给定五个 name 值的输入，表达式 {{ $json.name }} 始终解析为第一个名称。

Node parameters 节点参数#

Model 模型#

选择用于生成补全的 Nemotron 模型。

n8n 会从你在凭据中配置的端点动态加载 Nemotron 模型。如果 n8n 无法访问该端点，它会回退到一组精选的常用 Nemotron 模型 ID。

Node options 节点选项#

使用这些选项进一步细化节点行为。

Frequency Penalty 频率惩罚#

使用此选项控制模型重复自身内容的概率。值越高，模型重复自身内容的概率越低。

Maximum Number of Tokens 最大 token 数#

输入要使用的最大 token 数，用于设置补全长度。使用 -1 表示采用模型默认值。

Response Format 响应格式#

选择 Text 文本或 JSON。JSON 可确保模型返回有效 JSON。选择 JSON 时，请在 chain 或 agent 的提示中包含 json 一词。

Presence Penalty 存在惩罚#

使用此选项控制模型谈论新主题的概率。值越高，模型谈论新主题的概率越高。

Sampling Temperature 采样温度#

使用此选项控制采样过程的随机性。较高的温度会产生更多样化的采样，但会增加幻觉风险。

Timeout 超时#

输入最长请求时间（毫秒）。

Max Retries 最大重试次数#

输入请求的最大重试次数。

Top P#

使用此选项设置补全应使用的概率。使用较低的值可忽略概率较低的选项。