Explore ADK Bi-Directional Streaming: A visual guide to real-time multimodal AI agent development with WebSockets and Gemini Live.
https://youtu.be/vLUkAGeLR1k?si=RgTjLM1nZkX0hudw
魔法不在于提示词(Prompt),而在于事件循环(Event Loop)。
大多数 AI Agent 依赖 HTTP 协议(请求 → 等待 → 响应),这会产生延迟,且让“打断” AI 变得不可能。我们通过 双向流(Bi-Directional Streaming) 打破了这一循环,也就是大家熟知的 ADK Bidi-streaming。通过与 Gemini 建立持久的 WebSocket 连接,我们创建了一个客户端输入(音频/视频/文本)与服务端输出(音频/文本/工具调用)同步流动的会话。我们可以利用 ADK 来控制 Gemini Live 并为其配备强大的工具。

/ws/{user_id}/{session_id} 实现实时双向流。Google Search 工具。