載入中...
Akvorado 部署完成後,真正有價值的不是「看到漂亮圖表」,而是能把流量資料轉成可重複判讀的營運問題。常見問題包含:哪台設備或哪個 VLAN 長期吃掉出口頻寬、備援線路是否真的承擔流量、異常尖峰是否來自單一主機、對外連線是否集中到不合理的 ASN 或國家,以及容量擴充是否有數據支撐。
在開始分析前,先確認資料品質。Exporter 必須穩定送出 flow,Inlet 要能穩定接收封包,Outlet 要能持續把資料寫入 ClickHouse,Console 才能用來判斷趨勢。若資料來源本身不穩,後續任何 Top Talkers(在指定時間窗內流量最高的來源、目的或分類對象)或地理分布都可能只是 exporter 中斷、sampling 調整或 SNMP enrichment 失敗造成的假象。
本文會反覆使用幾個 Akvorado 術語,先用中文說明如下:
flowchart LR A["確認資料正在進來<br/>Inlet / exporter 封包"] B["鎖定時間窗<br/>平日、尖峰、事件時間"] C["先看總量<br/>出口、介面、方向"] D["拆 Top Talkers<br/>來源、目的、ASN、國家"] E["交叉比對<br/>SNMP、Syslog、NMS 告警"] F["產出判讀<br/>容量、異常、改善動作"] A --> B B --> C C --> D D --> E E --> F
這個流程的重點是不要一開始就鑽進單一 IP。先確認時間窗,再確認總量,接著拆出主要 talkers 與流量方向,最後才把結果與 SNMP、Syslog、NMS 告警對齊。對 IT 監控與管理系統 而言,flow 分析通常是「解釋為什麼指標異常」的第二層資料,而不是取代原本的告警系統。

Console 首頁適合作為第一步檢查點。圖中標示可依序閱讀:
Top Talkers 指的是在指定時間範圍內,依流量大小排序後最主要的來源、目的或分類對象,例如某個 IP、VLAN、ASN、國家或 port/protocol。這是最容易被理解的 Akvorado 使用情境,但也最容易被誤用。若直接把最大流量 IP 當成問題來源,可能會誤判 NAT Gateway、Proxy、VPN Server 或備份伺服器。比較穩定的做法是依序切換維度:
分析時要保留「正常基準」。例如同一間辦公室每天上午固定有雲端備份,或每週固定有系統更新流量,這些不是異常。真正需要處理的是流量型態偏離基準:時間不對、目的地不對、來源設備不對、方向不對,或同一行為突然放大到影響服務品質。
異常流量不一定代表資安事件,也可能是使用者行為、備份排程、雲端同步、弱網路設計或設備設定錯誤。Akvorado 的價值在於先縮小範圍,再決定是否要進一步用封包側錄、端點調查或防火牆 log 驗證。
流量分析若只用在事件發生後排障,價值會被低估。Akvorado 也可以支援容量規劃,尤其是辦公室 Internet Edge、資料中心出口、站點 VPN、備援線路與大型檔案同步場景。
tcpdump 確認 UDP flow port 是否有封包進來。akvorado_inlet_flow_input_udp_packets_total 這類指標是否出現 exporter。use-src-addr-for-exporter-addr。Akvorado 適合被放進固定巡檢,而不是只在異常時打開。建議每月或每季至少整理一次出口總量、Top Talkers、站點流量、ASN/國家分布與重大尖峰。若企業已有 Zabbix、LibreNMS、Grafana 或 Graylog,Akvorado 的報告應與既有告警時間軸對齊,讓頻寬、錯誤率、設備狀態與 flow 證據可以放在同一個事件脈絡中。
行雲資訊在網路與監控服務中,會把這類資料轉成可追蹤的改善項目:例如調整備份時間、重新規劃 VLAN、限制特定出口、擴充線路、補強防火牆規則或改善遠端站點回傳路徑。工具本身不是成果,能把觀測資料變成可執行決策,才是流量分析真正的價值。
可先閱讀《Akvorado Flow Collector 架構與基礎部署》:SNMP/NMS 適合確認設備健康、介面錯誤與可用性,Akvorado 則補上流量來源、目的、Top Talkers 與容量趨勢分析。
可依《Akvorado 流量分析教學》 先確認 exporter 持續送出 flow、Inlet 有封包計數、Outlet 正常寫入 ClickHouse,並檢查 sampling 與 SNMP enrichment 是否穩定。