TUI, Media, API/ACP
기준일: 2026-06-07
난이도: 중급
공식 기준: TUI, Browser, Vision, Image Generation, TTS, Voice Mode, API Server, ACP
Hermes는 CLI만의 도구가 아닙니다. 터미널 UI, 브라우저 조작, 비전 입력, 이미지 생성, TTS, 음성, OpenAI 호환 API, ACP 에디터 통합까지 여러 표면을 제공합니다.
핵심 개념
| 표면 | 적합한 경우 |
|---|---|
| CLI | 가장 단순한 대화와 작업 실행 |
| TUI | 세션, 오버레이, 입력 상태를 더 시각적으로 다루고 싶을 때 |
| Browser | 웹 페이지 탐색, 검색, 폼 입력, 브라우저 기반 워크플로우 |
| Vision | 스크린샷, 다이어그램, 이미지 기반 디버깅 |
| Image Generation | 결과물을 시각 자료로 만들거나 아이디어를 빠르게 시안화할 때 |
| TTS | 텍스트 응답을 음성 출력으로 변환해야 할 때 |
| Voice | 이동 중 음성 지시, 음성 메시지 응답 |
| API Server | 다른 프론트엔드나 자동화에서 Hermes를 호출 |
| ACP | VS Code, Zed, JetBrains 같은 ACP 호환 에디터에서 사용 |
선택 기준
- 개발 중인 로컬 작업은 CLI/TUI가 기본입니다.
- 팀 채널은 Gateway, 앱 통합은 API Server가 더 맞습니다.
- 에디터 중심 개발자는 ACP를 검토합니다.
- Browser와 Vision은 웹 세션, 쿠키, 스크린샷에 민감 정보가 섞일 수 있어 승인 범위를 먼저 정합니다.
- Image Generation과 TTS는 provider 비용, 결과물 저장 위치, 로그 보존 정책을 먼저 확인합니다.
- Voice 기능은 마이크 권한, 오인식, 대화 기록 보존 정책을 먼저 정합니다.
실습
hermes
hermes --tui
hermes acp
미디어 기능 사용 전 점검:
Hermes에서 Browser, Vision, Image Generation, TTS, Voice를 켜기 전에
필요한 provider, 접근 권한, 비용, 기록 보존, 민감 정보 노출 위험을
기능별로 점검해줘.
Hermes에 입력할 프롬프트
내 사용 사례에 맞는 Hermes 실행 표면을 추천해줘.
CLI, TUI, Browser, Vision, Image Generation, TTS, Voice,
Gateway, API Server, ACP를 비교하고
처음 켤 기능과 나중에 켤 기능을 나눠줘.
체크리스트
- CLI로 기본 대화가 되는 상태에서 추가 표면을 켠다.
- API/Gateway/Voice는 승인과 접근 제어를 먼저 정한다.
- Browser와 Vision은 쿠키, 토큰, 내부 화면 캡처 노출을 제한한다.
- Image Generation과 TTS는 provider 비용과 생성물 저장 정책을 확인한다.
- 에디터 통합은 프로젝트 지침 파일과 함께 테스트한다.
- 미디어 기능은 provider 비용과 로그 보존을 확인한다.