DeepFlow 深度分析系列文章

云融合安全检测

架构分析报告

策略下发机制

流量采集技术

DeepFlow 策略下发与实现机制深度解析

1. 策略架构：中央集权与分布式执行

DeepFlow 采用“控制面集中配置，数据面分布式执行”的架构，确保在大规模集群下策略的实时性与一致性。

控制面 (Controller)：负责将用户定义的业务逻辑（如：Namespace A 访问 Service B）翻译成 Agent 可识别的物理规则（IP/MAC 列表）。
数据面 (Agent)：负责在流量产生的瞬间执行规则匹配，并根据指令执行“打标”、“采样”或“联动抓包”。

翻译与分发：Controller 中的 Trisolaris 模块实时监听 K8s/云平台元数据，将逻辑策略计算为物理 ACL 规则。
gRPC 增量同步：
- Agent 定期（每分钟）通过 SyncRequest 发起心跳。
- Server 比较策略版本号（version_acls），通过 SyncResponse 返回 Protobuf 格式的增量策略数据。
动态加载：Agent 接收到新策略后，在内存中动态更新规则树，无需重启进程，策略秒级生效。

L4 策略主要通过 ACL (访问控制列表) 实现，解决“谁访问了谁”以及“网络表现如何”的问题。

匹配特征：[源 IP/组, 目的 IP/组, 协议, 目的端口, 采集位置]。
执行动作 (Action)：
- Tag (打标)：为流日志注入特定的 PolicyID，作为后端告警的“红标签”。
- PCAP (联动抓包)：自动触发原始报文镜像采集。
- Sample (采样)：针对特定流量执行差异化采样率。

多维匹配树：Agent 利用 Rust 实现了一套高性能匹配引擎。它将数万条 ACL 规则编译为一棵多维前缀树，确保在处理百万级 PPS 流量时，单次匹配耗时在纳秒级别。

L7 策略解决了“发送了什么”以及“内容是否合规”的问题，核心是 协议解析器 + WASM 插件。

DeepFlow 的告警遵循 “Agent 实时标记，Server 异步判定” 的原则：

命中与贴标：当流量触碰 ACL 或 WASM 定义的异常特征时，Agent 立即给该流盖上“违规戳记”（PolicyID / Custom Tag）。
入库存储：带标记的 L7FlowLog 进入 ClickHouse。
告警判定：Server 端的告警模块扫描 ClickHouse，发现带有特定标记的记录后，立即触发 Webhook 推送。
自动化取证：如果策略开启了 PCAP Action，管理员在收到告警的同时，可以直接在界面下载由 Agent 自动抓取的、包含攻击详情的原始报文文件。

报告生成时间: 2026-03-08 由 Gemini CLI 分析生成