OpenClaw 2026.5.4 릴리즈는 Google Meet 음성 통화 응답성 개선, Windows Gateway localhost 바인딩 수정, 공식 외부 플러그인 migration 안내 보강를 중심으로 읽을 수 있다. GitHub 릴리즈 노트의 Highlights, Changes, Fixes 항목을 기준으로 다시 묶었다.
핵심 3가지
Google Meet 음성 통화 응답성 개선: Twilio dial-in으로 들어온 Meet 참가자 음성이 realtime Gemini voice bridge를 통과하도록 바뀌었고, paced audio streaming, backpressure buffer, barge-in queue 정리로 OpenClaw 음성 에이전트 반응이 더 빨라졌다.
Windows Gateway localhost 바인딩 수정: Windows에서 기본 loopback Gateway listener를 127.0.0.1에만 묶어 libuv의 dual-stack ::1 동작 때문에 localhost HTTP 요청이 멈추는 문제를 피한다.
공식 외부 플러그인 migration 안내 보강: plugins.entries나 plugins.allow가 설치되지 않은 공식 외부 플러그인을 가리킬 때, 유효한 설정을 삭제하라고 하지 않고 openclaw plugins install 명령으로 이어지는 catalog-backed install hint를 보여준다.
Highlights 전체 요약
Google Meet 음성 통화 응답성 개선
Twilio dial-in으로 들어온 Meet 참가자 음성이 realtime Gemini voice bridge를 통과하도록 바뀌었고, paced audio streaming, backpressure buffer, barge-in queue 정리로 OpenClaw 음성 에이전트 반응이 더 빨라졌다. 근거: Highlights #1
주요 변경사항
Codex 음성 전사 metadata 라우팅 정리: Codex audio transcription 지원을 runtime과 manifest metadata에 노출하고, active Codex chat model id를 그대로 전사 API에 보내지 않도록 OpenAI transcription 기본값으로 라우팅한다. 근거: Changes #3
에이전트 workspace metadata 재사용: BTW, compaction, embedded-run model generation, PDF model setup 경로에 resolved workspace를 넘겨 agent-dir model refresh가 현재 workspace의 plugin metadata snapshot을 재사용한다. 근거: Changes #5
플러그인 metadata scan 반복 감소: unscoped model catalog와 manifest-contract reader가 workspace-compatible plugin metadata snapshot을 재사용해 control-plane hot path에서 cold plugin metadata scan이 반복되는 비용을 줄인다. 근거: Changes #6
플러그인 auto-allowlist 식별자 선택 수정: configured channel을 자동 허용할 때 built-in channel alias보다 claiming plugin manifest id를 우선해 WeCom·Yuanbao 같은 alias가 설치된 plugin id로 해석된다. 근거: Changes #7
SecretRef metadata 보존 수정: provider-target secret을 scrub할 때 plaintext 값은 남기지 않으면서 auth-profile의 keyRef와 tokenRef 필드를 보존해 canonical SecretRef metadata가 유지된다. 근거: Changes #8
운영 관점에서 볼 점
에이전트 workspace metadata 재사용: BTW, compaction, embedded-run model generation, PDF model setup 경로에 resolved workspace를 넘겨 agent-dir model refresh가 현재 workspace의 plugin metadata snapshot을 재사용한다. 근거: Changes #5
플러그인 metadata scan 반복 감소: unscoped model catalog와 manifest-contract reader가 workspace-compatible plugin metadata snapshot을 재사용해 control-plane hot path에서 cold plugin metadata scan이 반복되는 비용을 줄인다. 근거: Changes #6
플러그인 auto-allowlist 식별자 선택 수정: configured channel을 자동 허용할 때 built-in channel alias보다 claiming plugin manifest id를 우선해 WeCom·Yuanbao 같은 alias가 설치된 plugin id로 해석된다. 근거: Changes #7
보안과 버그 수정
이번 릴리즈의 수정사항은 아래 항목들을 중심으로 보면 된다.
WhatsApp allowlist ID 정규화: setup과 pairing allowlist 항목을 WhatsApp의 숫자-only phone id로 canonicalize하면서 E.164, JID, whatsapp: 입력도 계속 받아 WhatsApp Web sender id와 매칭되게 했다. 근거: Fixes #2
생성 도구 provider plugin 로드 수정: image, video, music generation 기본값을 소유한 provider plugin을 Gateway 시작 시 로드해 재시작 후 생성 도구가 catalog-only 상태로 남지 않게 했다. 근거: Fixes #3
Windows media attachment 저장 수정: 저장된 attachment temp file을 fsync 전에 read/write로 열어 Windows WebChat과 chat.send media offload가 durability flush 중 EPERM으로 실패하지 않게 했다. 근거: Fixes #7
Gateway startup model log 보강: agent model startup log에 resolved thinking과 fast-mode default를 포함하고, unset startup thinking은 reasoning visibility와 섞지 않고 medium으로 표시한다. 근거: Fixes #13
업그레이드
npm install -g openclaw@latest
openclaw --version
자동화, 채널, 플러그인, Gateway 운영 경로처럼 실제 운영에 닿는 항목이 포함된 릴리즈라면 업데이트 뒤 채널 연결과 크론 동작을 한 번 확인하는 편이 안전하다.
요약
| 영역 | 핵심 포인트 |
|---|---|
| 협업 | Google Meet 음성 통화 응답성 개선 - Twilio dial-in으로 들어온 Meet 참가자 음성이 realtime Gemini voice bridge를 통과하도록 바뀌었고, paced audio streaming, backpressure buffer, barge-in queue 정리로 OpenClaw 음성 에이전트 반응이 더 빨라졌다. |
| 운영 | Windows Gateway localhost 바인딩 수정 - Windows에서 기본 loopback Gateway listener를 127.0.0.1에만 묶어 libuv의 dual-stack ::1 동작 때문에 localhost HTTP 요청이 멈추는 문제를 피한다. |
| 플러그인 | 공식 외부 플러그인 migration 안내 보강 - plugins.entries나 plugins.allow가 설치되지 않은 공식 외부 플러그인을 가리킬 때, 유효한 설정을 삭제하라고 하지 않고 openclaw plugins install 명령으로 이어지는 catalog-backed install hint를 보여준다. |
릴리즈 노트
https://github.com/openclaw/openclaw/releases/tag/v2026.5.4
Release openclaw 2026.5.4 · openclaw/openclaw
2026.5.4 Highlights Google Meet/Voice Call: make Twilio dial-in joins speak through the realtime Gemini voice bridge with paced audio streaming, backpressure-aware buffering, barge-in queue cleari...
github.com