Chuyển tới nội dung chính

Tích hợp

Hermes Agent kết nối với các hệ thống bên ngoài để suy luận AI, máy chủ công cụ, quy trình công việc IDE, truy cập theo chương trình, v.v. Những tích hợp này mở rộng những gì Hermes có thể làm và nơi nó có thể hoạt động.

Nhà cung cấp và định tuyến AI

Hermes hỗ trợ nhiều nhà cung cấp suy luận AI ngay lập tức. Sử dụng hermes model để định cấu hình tương tác hoặc đặt chúng trong config.yaml .

  • Nhà cung cấp AI — OpenRouter, Anthropic, OpenAI, Google và mọi điểm cuối tương thích với OpenAI. Hermes tự động phát hiện các khả năng như tầm nhìn, phát trực tuyến và sử dụng công cụ cho mỗi nhà cung cấp.
  • Định tuyến nhà cung cấp — Kiểm soát chi tiết về việc nhà cung cấp cơ bản nào xử lý các yêu cầu OpenRouter của bạn. Tối ưu hóa chi phí, tốc độ hoặc chất lượng bằng cách sắp xếp, danh sách trắng, danh sách đen và thứ tự ưu tiên rõ ràng.
  • Nhà cung cấp dự phòng — Tự động chuyển đổi dự phòng sang nhà cung cấp LLM dự phòng khi mô hình chính của bạn gặp lỗi. Bao gồm dự phòng mô hình chính và dự phòng tác vụ phụ trợ độc lập cho tầm nhìn, nén và trích xuất web.

Máy chủ công cụ (MCP)

  • MCP Servers — Kết nối Hermes với các máy chủ công cụ bên ngoài thông qua Model Context Protocol. Truy cập các công cụ từ GitHub, cơ sở dữ liệu, hệ thống tệp, ngăn xếp trình duyệt, API nội bộ, v.v. mà không cần viết các công cụ Hermes gốc. Hỗ trợ cả truyền tải stdio và SSE, lọc công cụ trên mỗi máy chủ và đăng ký tài nguyên/nhắc nhở nhận biết khả năng.

Phần cuối của Tìm kiếm trên Web

Công cụ web_searchweb_extract hỗ trợ bốn nhà cung cấp phụ trợ, được định cấu hình qua config.yaml hoặc hermes tools :

Phần cuốiEnv VarTìm kiếmTrích xuấtThu thập thông tin
Bắn pháo (mặc định)FIRECRAWL_API_KEY
Song songPARALLEL_API_KEY
TavilyTAVILY_API_KEY
ExaEXA_API_KEY

Ví dụ thiết lập nhanh:

web:
backend: firecrawl

# firecrawl

| parallel | tavily | exa

Nếu web.backend không được đặt, phần phụ trợ sẽ tự động được phát hiện từ bất kỳ khóa API nào có sẵn. Firecrawl tự lưu trữ cũng được hỗ trợ thông qua FIRECRAWL_API_URL .

Tự động hóa trình duyệt

Hermes bao gồm tự động hóa trình duyệt hoàn chỉnh với nhiều tùy chọn phụ trợ để điều hướng trang web, điền biểu mẫu và trích xuất thông tin:

  • Browserbase — Trình duyệt đám mây được quản lý với công cụ chống bot, giải CAPTCHA và proxy dân dụng
  • Sử dụng trình duyệt — Nhà cung cấp trình duyệt đám mây thay thế
  • Chrome cục bộ qua CDP — Kết nối với phiên bản Chrome đang chạy của bạn bằng /browser connect
  • Crom cục bộ — Trình duyệt cục bộ không có giao diện thông qua agent-browser CLI

Xem Tự động hóa trình duyệt để biết cách thiết lập và sử dụng.

Nhà cung cấp dịch vụ thoại & TTS

Chuyển văn bản thành giọng nói và chuyển giọng nói thành văn bản trên tất cả các nền tảng nhắn tin:| Nhà cung cấp | Chất lượng | Chi phí | Khóa API | ||----------|---------|------|--------| || ** Edge TTS** (mặc định) | Tốt | Miễn phí | Không cần thiết | || ElevenLabs | Xuất sắc | Đã trả tiền | ELEVENLABS_API_KEY | || OpenAI TTS | Tốt | Đã trả tiền | VOICE_TOOLS_OPENAI_KEY | || MiniMax | Tốt | Đã trả tiền | MINIMAX_API_KEY | || NeuTTS | Tốt | Miễn phí | Không cần thiết |

Tính năng chuyển giọng nói thành văn bản hỗ trợ ba nhà cung cấp: Whisper cục bộ (miễn phí, chạy trên thiết bị), Groq (đám mây nhanh) và OpenAI Whisper API. Phiên âm tin nhắn thoại hoạt động trên Telegram, Discord, WhatsApp và các nền tảng nhắn tin khác. Xem Giọng nói & TTSChế độ giọng nói để biết chi tiết.

Tích hợp IDE & Trình chỉnh sửa

  • Tích hợp IDE (ACP) — Sử dụng Tác nhân Hermes bên trong các trình chỉnh sửa tương thích với ACP như VS Code, Zed và JetBrains. Hermes chạy như một máy chủ ACP, hiển thị tin nhắn trò chuyện, hoạt động của công cụ, khác biệt về tệp và lệnh đầu cuối bên trong trình chỉnh sửa của bạn.

Truy cập theo chương trình

  • API Server — Hiển thị Hermes dưới dạng điểm cuối HTTP tương thích với OpenAI. Bất kỳ giao diện người dùng nào sử dụng định dạng OpenAI — Open WebUI, LobeChat, LibreChat, NextChat, ChatBox — đều có thể kết nối và sử dụng Hermes làm phụ trợ với bộ công cụ đầy đủ của nó.

Bộ nhớ & Cá nhân hóa

  • Bộ nhớ tích hợp — Bộ nhớ liên tục, được quản lý thông qua các tệp MEMORY.mdUSER.md. Tác nhân duy trì các kho lưu trữ giới hạn các ghi chú cá nhân và dữ liệu hồ sơ người dùng tồn tại qua các phiên.
  • Nhà cung cấp bộ nhớ — Cắm phụ trợ bộ nhớ ngoài để cá nhân hóa sâu hơn. Bảy nhà cung cấp được hỗ trợ: Honcho (lý luận biện chứng), OpenViking (truy xuất theo cấp độ), Mem0 (trích xuất đám mây), Hindsight (biểu đồ tri thức), Holographic (SQLite cục bộ), RetainDB (tìm kiếm kết hợp) và ByteRover (dựa trên CLI).

Nền tảng nhắn tin

Hermes chạy như một bot cổng trên hơn 14 nền tảng nhắn tin, tất cả đều được định cấu hình thông qua cùng một hệ thống con gateway:

Xem Tổng quan về Cổng nhắn tin để biết bảng so sánh nền tảng và hướng dẫn thiết lập.

Tự động hóa ngôi nhà

  • Home Assistant — Điều khiển các thiết bị thông minh trong nhà thông qua bốn công cụ chuyên dụng ( ha_list_entities , ha_get_state , ha_list_services , ha_call_service ). Bộ công cụ Home Assistant tự động kích hoạt khi HASS_TOKEN được định cấu hình.

Plugin

  • Hệ thống plugin — Mở rộng Hermes bằng các công cụ tùy chỉnh, móc vòng đời và lệnh CLI mà không sửa đổi mã lõi. Các plugin được phát hiện từ ~/.hermes/plugins/ , dự án cục bộ .hermes/plugins/ và các điểm vào được cài đặt bằng pip.
  • Xây dựng plugin — Hướng dẫn từng bước để tạo plugin Hermes bằng các công cụ, hook và lệnh CLI.

Đào tạo & Đánh giá- RL Training — Tạo dữ liệu quỹ đạo từ các phiên tác nhân để học tăng cường và tinh chỉnh mô hình. Hỗ trợ môi trường Atropos với các chức năng phần thưởng có thể tùy chỉnh.

  • Xử lý hàng loạt — Chạy song song tác nhân trên hàng trăm lời nhắc, tạo ra dữ liệu quỹ đạo có định dạng ShareGPT có cấu trúc để tạo hoặc đánh giá dữ liệu đào tạo.