Cấu hình Model
Hermes sử dụng hai loại khe mô hình:
- Mô hình chính — điều mà tác nhân nghĩ đến. Mọi tin nhắn của người dùng, mọi vòng lặp lệnh gọi công cụ, mọi phản hồi theo luồng đều đi qua mô hình này.
- Mô hình phụ trợ — các công việc phụ nhỏ hơn mà nhân viên giảm tải. Nén ngữ cảnh, tầm nhìn (phân tích hình ảnh), tóm tắt trang web, tìm kiếm phiên, chấm điểm phê duyệt, định tuyến công cụ MCP, tạo tiêu đề phiên và tìm kiếm kỹ năng. Mỗi cái có một khe riêng và có thể được ghi đè độc lập.
Trang này bao gồm việc định cấu hình cả hai từ trang tổng quan. Nếu bạn thích tệp cấu hình hoặc CLI, hãy chuyển đến [Phương thức thay thế](#phương thức thay thế) ở phía dưới.
Trang Người mẫu
Mở trang tổng quan và nhấp vào Mô hình trong thanh bên. Bạn nhận được hai phần:
- Cài đặt kiểu máy — bảng trên cùng, nơi bạn chỉ định kiểu máy cho các vị trí.
- Phân tích mức sử dụng — thẻ xếp hạng hiển thị mọi mô hình đã chạy phiên trong khoảng thời gian đã chọn, cùng với số lượng mã thông báo, chi phí và huy hiệu khả năng.

Thẻ trên cùng là bảng Cài đặt mẫu. Hàng chính luôn hiển thị những gì nhân viên hỗ trợ sẽ thực hiện cho các phiên mới. Nhấp vào Thay đổi để mở bộ chọn.
Đặt mô hình chính
Nhấp vào Thay đổi trên hàng Mô hình chính:

Bộ chọn có hai cột:
- Trái — nhà cung cấp được xác thực. Chỉ những nhà cung cấp bạn đã thiết lập (bộ khóa API, OAuth'd hoặc được xác định là điểm cuối tùy chỉnh) mới hiển thị ở đây. Nếu thiếu nhà cung cấp, hãy đi tới Khóa và thêm thông tin xác thực của nhà cung cấp đó.
- Đúng — danh sách mô hình được tuyển chọn cho nhà cung cấp đã chọn. Đây là các mô hình đại lý mà Hermes đề xuất cho nhà cung cấp đó, không phải kết xuất
/modelsthô (trên OpenRouter bao gồm hơn 400 mô hình bao gồm TTS, trình tạo hình ảnh và trình xếp hạng lại).
Nhập vào hộp bộ lọc để thu hẹp theo tên nhà cung cấp, phần mềm hoặc ID mẫu.
Chọn một mô hình, nhấn Switch và Hermes ghi nó vào ~/.hermes/config.yaml trong phần model. Điều này chỉ áp dụng cho các phiên mới — bất kỳ tab trò chuyện nào bạn đã mở sẽ tiếp tục chạy bất kỳ mô hình nào mà nó đã bắt đầu. Để trao đổi nóng cuộc trò chuyện hiện tại, hãy sử dụng lệnh gạch chéo /model bên trong cuộc trò chuyện đó.
Cài đặt các mô hình phụ trợ
Nhấp vào Hiển thị phụ trợ để hiển thị tám vị trí nhiệm vụ:

Mọi nhiệm vụ phụ đều được mặc định là auto - nghĩa là Hermes cũng sử dụng mô hình chính của bạn cho công việc đó. Ghi đè một tác vụ cụ thể khi bạn muốn một mô hình rẻ hơn hoặc nhanh hơn cho công việc phụ.
Các mẫu ghi đè phổ biến
| Task | When to override |
|---|---|
| Title Gen | Almost always. A $0.10/M flash model writes session titles as well as Opus. Default config sets this to google/gemini-3-flash-preview on OpenRouter. |
| Vision | When your main model is a coding model without vision (e.g. Kimi, DeepSeek). Point it at google/gemini-2.5-flash or gpt-4o-mini. |
| Compression | When you're burning reasoning tokens on Opus/M2.7 just to summarize context. A fast chat model does the job at 1/50th the cost. |
| Session Search | When recall queries fan out — default max_concurrency is 3. A cheap model keeps the bill predictable. |
| Approval | For approval_mode: smart — a fast/cheap model (haiku, flash, gpt-5-mini) decides whether to auto-approve low-risk commands. Expensive models here are waste. |
| Web Extract | When you use web_extract heavily. Same logic as compression — summarization doesn't need reasoning. |
| Skills Hub | hermes skills search uses this. Usually fine at auto. |
| MCP | MCP tool routing. Usually fine at auto. |
Ghi đè theo từng tác vụ
Nhấp vào Thay đổi trên bất kỳ hàng phụ nào. Cùng một bộ chọn mở ra, hành vi tương tự - chọn nhà cung cấp + kiểu máy, nhấn Chuyển đổi. Hàng cập nhật để hiển thị nhà cung cấp · mô hình thay vì tự động (sử dụng mô hình chính).
Đặt lại tất cả về chế độ tự động
Nếu bạn đã điều chỉnh quá mức và muốn bắt đầu lại, hãy nhấp vào Đặt lại tất cả để tự động ở đầu phần phụ trợ. Mọi vị trí đều quay lại sử dụng mô hình chính của bạn.
Phím tắt "Sử dụng làm"
Mỗi thẻ mẫu trên trang đều có menu thả xuống Sử dụng làm. Đây là con đường nhanh chóng — chọn một mô hình bạn thấy trong phân tích của mình, nhấp vào Sử dụng làm và gán mô hình đó cho vị trí chính hoặc bất kỳ tác vụ phụ trợ cụ thể nào chỉ bằng một cú nhấp chuột:

Trình đơn thả xuống có:
- Mô hình chính — giống như cách nhấp vào Thay đổi trên hàng chính.
- Tất cả các tác vụ phụ — gán mô hình này cho tất cả 8 khe cắm phụ trợ cùng một lúc. Hữu ích khi bạn chỉ muốn mọi công việc phụ trên một mẫu đèn flash giá rẻ.
- Tùy chọn tác vụ riêng lẻ — Tầm nhìn, Trích xuất web, Nén, v.v. Mô hình hiện được chỉ định cho từng tác vụ được đánh dấu
current.
Thẻ được gắn huy hiệu main hoặc aux · <task> khi chúng hiện được gán cho một thứ gì đó — vì vậy, bạn có thể xem nhanh mô hình lịch sử nào của mình được kết nối ở đâu.
Điều gì được ghi vào config.yaml
Khi bạn lưu qua bảng điều khiển, Hermes sẽ ghi vào ~/.hermes/config.yaml:
Mẫu chính:
mô hình:
nhà cung cấp: openrouter
mặc định: anthropic/claude-opus-4.7
base_url: '' # đã xóa khi chuyển đổi nhà cung cấp
api_mode: chat_completions
Ghi đè phụ trợ (ví dụ — tầm nhìn trên gemini-flash):
phụ trợ:
tầm nhìn:
nhà cung cấp: openrouter
mô hình: google/gemini-2.5-flash
cơ sở_url: ''
api_key: ''
thời gian chờ: 120
ngoại_người: {}
tải_thời gian chờ: 30
Phụ trợ trên ô tô (mặc định):
phụ trợ:
nén:
nhà cung cấp: ô tô
người mẫu: ''
cơ sở_url: ''
# ... các trường khác không thay đổi
provider: auto với model: '' yêu cầu Hermes sử dụng mô hình chính cho nhiệm vụ đó.
##Khi nào nó có hiệu lực?
- CLI (
hermes chat): lệnh gọihermes chattiếp theo. - Gateway (Telegram, Discord, Slack, v.v.): phiên mới tiếp theo. Phiên hiện có giữ mô hình của họ. Khởi động lại cổng (
khởi động lại cổng hermes) nếu bạn muốn buộc tất cả các phiên thực hiện thay đổi. - Tab trò chuyện trên bảng điều khiển (
/chat): PTY mới tiếp theo. Cuộc trò chuyện hiện đang mở vẫn giữ mô hình của nó — sử dụng/modelbên trong cuộc trò chuyện đó để trao đổi nóng.
Các thay đổi không bao giờ làm mất hiệu lực bộ đệm nhắc nhở trên các phiên đang chạy. Đó là cố ý: việc hoán đổi mô hình chính trong một phiên yêu cầu đặt lại bộ đệm (lời nhắc hệ thống chứa nội dung dành riêng cho mô hình) và chúng tôi dành điều đó cho lệnh gạch chéo /model rõ ràng trong trò chuyện.
Khắc phục sự cố
"Không có nhà cung cấp được xác thực" trong bộ chọn
Hermes chỉ liệt kê một nhà cung cấp nếu nhà cung cấp đó có chứng chỉ hoạt động. Kiểm tra Khóa trong thanh bên — bạn sẽ thấy một trong: khóa API, OAuth thành công hoặc URL điểm cuối tùy chỉnh. Nếu nhà cung cấp bạn muốn không có ở đó, hãy chạy hermes setup để kết nối hoặc đi tới Keys và thêm env var.
Mô hình chính không thay đổi trong cuộc trò chuyện đang diễn ra của tôi
Hy vọng. Bảng điều khiển ghi config.yaml, phiên mới sẽ đọc. Cuộc trò chuyện hiện đang mở là một quy trình tác nhân trực tiếp — nó giữ bất kỳ mô hình nào được tạo ra. Sử dụng /model <name> bên trong cuộc trò chuyện để trao đổi nóng phiên cụ thể đó.
Ghi đè phụ trợ "không có hiệu lực"
Ba điều cần kiểm tra:
- Bạn đã bắt đầu phiên mới phải không? Các cuộc trò chuyện hiện tại không đọc lại cấu hình.
Nhà cung cấpcó được đặt thành cái gì khác ngoàiautokhông? Nếu trường hiển thịauto, tác vụ vẫn đang sử dụng mô hình chính của bạn. Nhấp vào Thay đổi và chọn nhà cung cấp thực sự.- Nhà cung cấp có được xác thực không? Nếu bạn đã gán
minimaxcho một tác vụ nhưng không có khóa API MiniMax thì tác vụ đó sẽ quay trở lại mặc định của openrouter và ghi lại cảnh báo trongagent.log.
Tôi đã chọn một mẫu nhưng Hermes đã chuyển nhà cung cấp cho tôi
Trên OpenRouter (hoặc bất kỳ trình tổng hợp nào), tên mô hình trần sẽ phân giải * bên trong * trình tổng hợp trước tiên. Vì vậy, claude-sonnet-4 trên OpenRouter trở thành anthropic/claude-sonnet-4.6, vẫn giữ nguyên quyền xác thực OpenRouter của bạn. Nhưng nếu bạn gõ claude-sonnet-4 trên bản xác thực Anthropic gốc, nó sẽ vẫn là claude-sonnet-4-6. Nếu bạn thấy sự chuyển đổi nhà cung cấp không mong muốn, hãy kiểm tra xem nhà cung cấp hiện tại của bạn có đúng như bạn mong đợi hay không — bộ chọn luôn hiển thị thông tin chính hiện tại ở đầu hộp thoại.
Phương pháp thay thế
Lệnh gạch chéo CLI
Bên trong bất kỳ phiên hermes chat nào:
/model gpt-5.4 --provider openrouter # session-only
/model gpt-5.4 --provider openrouter --global # also persists to config.yaml
--global thực hiện điều tương tự như nút Thay đổi của bảng thông tin, ngoài ra nó còn chuyển phiên đang chạy tại chỗ.
Bí danh tùy chỉnh
Xác định tên ngắn của riêng bạn cho các mô hình mà bạn thường sử dụng, sau đó sử dụng /model <alias> trong CLI hoặc bất kỳ nền tảng nhắn tin nào:
# ~/.hermes/config.yaml
model_aliases:
fav:
model: claude-sonnet-4.6
provider: anthropic
grok:
model: grok-4
provider: x-ai
Hoặc từ shell (dạng ngắn, nhà cung cấp/model):
hermes config set model.aliases.fav anthropic/claude-opus-4.6
hermes config set model.aliases.grok x-ai/grok-4
Sau đó /model fav hoặc /model grok trong cuộc trò chuyện. Bí danh người dùng che khuất các tên ngắn tích hợp (sonnet, kimi, opus, v.v.). Xem Bí danh mô hình tùy chỉnh để tham khảo đầy đủ.
lệnh phụ hermes model
hermes model # Interactive provider + model picker (the canonical way to switch defaults)
mô hình hermes sẽ hướng dẫn bạn cách chọn nhà cung cấp, xác thực (luồng OAuth mở trình duyệt; nhà cung cấp khóa API nhắc nhập khóa), sau đó chọn một mô hình cụ thể từ danh mục tuyển chọn của nhà cung cấp đó. Lựa chọn được ghi vào model.provider và model.model trong ~/.hermes/config.yaml.
Để liệt kê các nhà cung cấp/mô hình mà không cần khởi chạy bộ chọn, hãy sử dụng trang tổng quan hoặc điểm cuối REST bên dưới. Để kiểm tra những gì CLI thực sự sẽ sử dụng ngay bây giờ: hermes config get model và hermes status.
Chỉnh sửa cấu hình trực tiếp
Chỉnh sửa ~/.hermes/config.yaml và khởi động lại bất cứ thứ gì đọc nó. Xem Tham khảo cấu hình để biết lược đồ đầy đủ.
API REST
Bảng thông tin sử dụng ba điểm cuối. Hữu ích cho việc viết kịch bản:
# List authenticated providers + curated model lists
curl -H "X-Hermes-Session-Token: $TOKEN" http://localhost:PORT/api/model/options
# Read current main + auxiliary assignments
curl -H "X-Hermes-Session-Token: $TOKEN" http://localhost:PORT/api/model/auxiliary
# Set the main model
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"main","provider":"openrouter","model":"anthropic/claude-opus-4.7"}' \
http://localhost:PORT/api/model/set
# Override a single auxiliary task
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"auxiliary","task":"vision","provider":"openrouter","model":"google/gemini-2.5-flash"}' \
http://localhost:PORT/api/model/set
# Assign one model to every auxiliary task
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"auxiliary","task":"","provider":"openrouter","model":"google/gemini-2.5-flash"}' \
http://localhost:PORT/api/model/set
# Đặt lại tất cả các tác vụ phụ về tự động
Curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope:"phụ trợ","task":__reset__","provider","model""}' \
http://localhost:PORT/api/model/set
Mã thông báo phiên được đưa vào HTML của trang tổng quan khi khởi động và luân phiên mỗi lần khởi động lại máy chủ. Lấy nó từ công cụ phát triển của trình duyệt (window.__HERMES_SESSION_TOKEN__) nếu bạn đang viết tập lệnh cho một trang tổng quan đang chạy.