AgenticModel - ARK

基于 Eino 的火山引擎 Ark 模型实现,实现了 AgenticModel 组件接口。这使得该模型能够无缝集成到 Eino 的 Agent 能力中,提供增强的自然语言处理和生成功能。

功能特性

  • 实现了 github.com/cloudwego/eino/components/model.AgenticModel 接口
  • 易于集成到 Eino 的 agent 系统中
  • 可配置的模型参数
  • 支持 Responses API
  • 支持流式响应 (Streaming)
  • 支持工具调用 (Tools),包括函数工具 (Function Tools)、MCP 工具 (MCP Tools) 和服务器工具 (Server Tools)
  • 支持前缀缓存 (Prefix Cache) 和会话缓存 (Session Cache)

安装

go get github.com/cloudwego/eino-ext/components/model/agenticark@latest

快速开始

以下是如何使用 AgenticModel 的一个快速示例:

package main

import (
        "context"
        "log"
        "os"

        "github.com/bytedance/sonic"
        "github.com/cloudwego/eino-ext/components/model/agenticark"
        "github.com/cloudwego/eino/schema"
)

func main() {
        ctx := context.Background()

        // 获取 ARK_API_KEY 和 ARK_MODEL_ID: https://www.volcengine.com/docs/82379/1399008
        am, err := agenticark.New(ctx, &agenticark.Config{
                Model:  os.Getenv("ARK_MODEL_ID"),
                APIKey: os.Getenv("ARK_API_KEY"),
        })
        if err != nil {
                log.Fatalf("failed to create agentic model, err: %v", err)
        }

        input := []*schema.AgenticMessage{
                schema.UserAgenticMessage("what is the weather like in Beijing"),
        }

        msg, err := am.Generate(ctx, input)
        if err != nil {
                log.Fatalf("failed to generate, err: %v", err)
        }

        meta := msg.ResponseMeta.Extension.(*agenticark.ResponseMetaExtension)

        log.Printf("request_id: %s
", meta.ID)
        respBody, _ := sonic.MarshalIndent(msg, "  ", "  ")
        log.Printf("  body: %s
", string(respBody))
}

配置

可以使用 agenticark.Config 结构体配置 AgenticModel

type Config struct {
    // Timeout 指定等待 API 响应的最大持续时间
    // 如果设置了 HTTPClient,则不会使用 Timeout。
    // 可选。默认值:10 分钟
    Timeout *time.Duration
    
    // HTTPClient 指定用于发送 HTTP 请求的客户端。
    // 如果设置了 HTTPClient,则不会使用 Timeout。
    // 可选。默认值 &http.Client{Timeout: Timeout}
    HTTPClient *http.Client
    
    // RetryTimes 指定失败 API 调用的重试次数
    // 可选。默认值:2
    RetryTimes *int
    
    // BaseURL 指定 Ark 服务的基准 URL
    // 可选。默认值:"https://agenticark.cn-beijing.volces.com/api/v3"
    BaseURL string 
    
    // Region 指定 Ark 服务所在的区域
    // 可选。默认值:"cn-beijing"
    Region string
    
    // 以下三个字段与认证有关 - 需要 APIKey 或 AccessKey/SecretKey 对之一
    // 有关认证的详细信息,请参阅:https://www.volcengine.com/docs/82379/1298459
    // 如果同时提供,APIKey 优先
    APIKey string 
    
    AccessKey string 
    
    SecretKey string 
    
    // 以下字段对应于 Ark 的 responses API 参数
    // 参考:https://www.volcengine.com/docs/82379/1298454
    
    // Model 指定 ark 平台上的端点 ID
    // 必填
    Model string 
    
    // MaxTokens 指定响应中要生成的最大令牌数。
    // 可选。
        MaxTokens *int
    
    // Temperature 指定要使用的采样温度
    // 通常建议修改此项或 TopP,但不能同时修改
    // 范围:0.0 到 1.0。值越高,输出越随机
    // 可选。默认值:1.0
    Temperature *float64
    
    // TopP 通过核心采样控制多样性
    // 通常建议修改此项或 Temperature,但不能同时修改
    // 范围:0.0 到 1.0。值越低,输出越集中
    // 可选。默认值:0.7
    TopP *float64
    
    // Stop 序列,API 将在这些序列处停止生成更多 token
    // 可选。示例:[]string{"
", "User:"}
    Stop []string
    
    // FrequencyPenalty 根据频率惩罚 token 以防止重复
    // 范围:-2.0 到 2.0。正值降低重复的可能性
    // 可选。默认值:0
    FrequencyPenalty *float64 
    
    // LogitBias 修改特定 token 在补全中出现的可能性
    // 可选。将 token ID 映射到 -100 到 100 的偏置值
    LogitBias map[string]int32
    
    // PresencePenalty 根据存在与否惩罚 token 以防止重复
    // 范围:-2.0 到 2.0。正值增加新主题的可能性
    // 可选。默认值:0
    PresencePenalty *float64
        
    // LogProbs 指定是否返回输出 token 的对数概率。
    LogProbs *bool
    
    // TopLogProbs 指定每个 token 位置返回的最可能 token 的数量,每个都带有相关的对数概率。
    TopLogProbs *int 
    
    // RepetitionPenalty 基于 token 在目前为止的文本中的现有频率对其进行惩罚。
    // 范围:0.0 到 2.0。1.0 表示无惩罚。
    RepetitionPenalty *float64

    // Thinking 控制模型是否设置为激活深度思考模式。
    // 默认设置为启用。
    Thinking *responses.ResponsesThinking

    // Reasoning 指定模型的推理力度。
    // 可选。

    // EnablePassBackReasoning 控制模型是否在下一次请求中传回推理项。
    // 注意 doubao 1.6 不支持传回推理项。
    // 可选. 默认值:true
    EnablePassBackReasoning *bool

    // MaxToolCalls 限制聊天补全中生成的最大工具调用数。
    // 可选。
    MaxToolCalls *int64

    // ParallelToolCalls 控制模型是否设置为执行并行工具调用。
    // 可选。
    ParallelToolCalls *bool

    // ServerTools 指定模型可用的服务器端工具。
    // 可选。
    ServerTools []*ServerToolConfig

    // MCPTools 指定模型可用的 MCP 工具。
    // 可选。
    MCPTools []*responses.ToolMcp

    // Cache 指定模型的缓存配置。
    // 可选。
    Cache *CacheConfig

    // CustomHeader 请求模型时传递的 http 标头
    CustomHeader map[string]string 
}

高级用法

工具调用 (Tool Calling)

AgenticModel 支持工具调用,包括函数工具、MCP 工具和服务器工具。

函数工具示例

package main

import (
        "context"
        "errors"
        "io"
        "log"
        "os"

        "github.com/bytedance/sonic"
        "github.com/cloudwego/eino-ext/components/model/agenticark"
        "github.com/cloudwego/eino/components/model"
        "github.com/cloudwego/eino/schema"
        "github.com/eino-contrib/jsonschema"
        "github.com/volcengine/volcengine-go-sdk/service/arkruntime/model/responses"
        "github.com/wk8/go-ordered-map/v2"
)

func main() {
        ctx := context.Background()

        // 获取 ARK_API_KEY 和 ARK_MODEL_ID: https://www.volcengine.com/docs/82379/1399008
        am, err := agenticark.New(ctx, &agenticark.Config{
                Model:  os.Getenv("ARK_MODEL_ID"),
                APIKey: os.Getenv("ARK_API_KEY"),
                Thinking: &responses.ResponsesThinking{
                        Type: responses.ThinkingType_disabled.Enum(),
                },
        })
        if err != nil {
                log.Fatalf("failed to create agentic model, err=%v", err)
        }

        functionTools := []*schema.ToolInfo{
                {
                        Name: "get_weather",
                        Desc: "get the weather in a city",
                        ParamsOneOf: schema.NewParamsOneOfByJSONSchema(&jsonschema.Schema{
                                Type: "object",
                                Properties: orderedmap.New[string, *jsonschema.Schema](
                                        orderedmap.WithInitialData(
                                                orderedmap.Pair[string, *jsonschema.Schema]{
                                                        Key: "city",
                                                        Value: &jsonschema.Schema{
                                                                Type:        "string",
                                                                Description: "the city to get the weather",
                                                        },
                                                },
                                        ),
                                ),
                                Required: []string{"city"},
                        }),
                },
        }

        allowedTools := []*schema.AllowedTool{
                {
                        FunctionName: "get_weather",
                },
        }

        opts := []model.Option{
                model.WithAgenticToolChoice(&schema.AgenticToolChoice{
                        Type: schema.ToolChoiceForced,
                        Forced: &schema.AgenticForcedToolChoice{
                                Tools: allowedTools,
                        },
                }),
                model.WithTools(functionTools),
        }

        firstInput := []*schema.AgenticMessage{
                schema.UserAgenticMessage("what's the weather like in Beijing today"),
        }

        sResp, err := am.Stream(ctx, firstInput, opts...)
        if err != nil {
                log.Fatalf("failed to stream, err: %v", err)
        }

        var msgs []*schema.AgenticMessage
        for {
                msg, err := sResp.Recv()
                if err != nil {
                        if errors.Is(err, io.EOF) {
                                break
                        }
                        log.Fatalf("failed to receive stream response, err: %v", err)
                }
                msgs = append(msgs, msg)
        }

        concatenated, err := schema.ConcatAgenticMessages(msgs)
        if err != nil {
                log.Fatalf("failed to concat agentic messages, err: %v", err)
        }

        lastBlock := concatenated.ContentBlocks[len(concatenated.ContentBlocks)-1]
        
        toolCall := lastBlock.FunctionToolCall
        toolResultMsg := schema.FunctionToolResultAgenticMessage(toolCall.CallID, toolCall.Name, "20 degrees")

        secondInput := append(firstInput, concatenated, toolResultMsg)

        gResp, err := am.Generate(ctx, secondInput)
        if err != nil {
                log.Fatalf("failed to generate, err: %v", err)
        }

        meta := concatenated.ResponseMeta.Extension.(*agenticark.ResponseMetaExtension)
        log.Printf("request_id: %s
", meta.ID)

        respBody, _ := sonic.MarshalIndent(gResp, "  ", "  ")
        log.Printf("  body: %s
", string(respBody))
}

服务器工具示例

package main

import (
        "context"
        "errors"
        "io"
        "log"
        "os"

        "github.com/bytedance/sonic"
        "github.com/cloudwego/eino-ext/components/model/agenticark"
        "github.com/cloudwego/eino/components/model"
        "github.com/cloudwego/eino/schema"
        "github.com/volcengine/volcengine-go-sdk/service/arkruntime/model/responses"
)

func main() {
        ctx := context.Background()

        // Get ARK_API_KEY and ARK_MODEL_ID: https://www.volcengine.com/docs/82379/1399008
        am, err := agenticark.New(ctx, &agenticark.Config{
                Model:  os.Getenv("ARK_MODEL_ID"),
                APIKey: os.Getenv("ARK_API_KEY"),
        })
        if err != nil {
                log.Fatalf("failed to create agentic model, err=%v", err)
        }

        serverTools := []*agenticark.ServerToolConfig{
                {
                        WebSearch: &responses.ToolWebSearch{
                                Type: responses.ToolType_web_search,
                        },
                },
        }

        allowedTools := []*schema.AllowedTool{
                {
                        ServerTool: &schema.AllowedServerTool{
                                Name: string(agenticark.ServerToolNameWebSearch),
                        },
                },
        }

        opts := []model.Option{
                agenticark.WithServerTools(serverTools),
                model.WithAgenticToolChoice(&schema.AgenticToolChoice{
                        Type: schema.ToolChoiceForced,
                        Forced: &schema.AgenticForcedToolChoice{
                                Tools: allowedTools,
                        },
                }),
                agenticark.WithThinking(&responses.ResponsesThinking{
                        Type: responses.ThinkingType_disabled.Enum(),
                }),
        }

        input := []*schema.AgenticMessage{
                schema.UserAgenticMessage("what's the weather like in Beijing today"),
        }

        resp, err := am.Stream(ctx, input, opts...)
        if err != nil {
                log.Fatalf("failed to stream, err: %v", err)
        }

        var msgs []*schema.AgenticMessage
        for {
                msg, err := resp.Recv()
                if err != nil {
                        if errors.Is(err, io.EOF) {
                                break
                        }
                        log.Fatalf("failed to receive stream response, err: %v", err)
                }
                msgs = append(msgs, msg)
        }

        concatenated, err := schema.ConcatAgenticMessages(msgs)
        if err != nil {
                log.Fatalf("failed to concat agentic messages, err: %v", err)
        }

        meta := concatenated.ResponseMeta.Extension.(*agenticark.ResponseMetaExtension)
        for _, block := range concatenated.ContentBlocks {
                if block.ServerToolCall == nil {
                        continue
                }

                serverToolArgs := block.ServerToolCall.Arguments.(*agenticark.ServerToolCallArguments)

                args, _ := sonic.MarshalIndent(serverToolArgs, "  ", "  ")
                log.Printf("server_tool_args: %s
", string(args))
        }

        log.Printf("request_id: %s
", meta.ID)
        respBody, _ := sonic.MarshalIndent(concatenated, "  ", "  ")
        log.Printf("  body: %s
", string(respBody))
}

更多示例请参考 examples 目录。