問題描述
用於分佈式監控和跟踪網絡延遲/丟包的良好設置 (A good setup for distributed monitoring and tracking latency/drops in a network)
首先我想說的是,我從未參加過網絡課程,但我正在工作中學習。諸如 TCP/IP 網絡之類的東西我有一個非常基本的掌握,如果你認為這會阻礙我的嘗試,請告訴我。
我手頭的任務是:我有一個 Open Stack 網絡有一堆可以相互通信的節點,所有運行 CentOS 虛擬機(只是為了簡單起見),應用程序運行在它們之上。任務基本上是找到一種方法來監視每個節點的 ping,並在某種消息(可能通過 http)報告發生的情況時報告。檢查實際延遲問題的邏輯不是我正在努力解決的問題,它是完成這項任務的最佳結構。
我' 我正在考慮使用 Nagios 並建立一個分佈式監控系統。基本上我的計劃是在編寫我的插件後在每個節點上安裝 nagios(除非它已經提供或存在),一旦它的設置和其他節點 ping 它一旦它已經加入網絡,它就會簡單地 ping 網絡中的所有其他東西被檢測到。我不確定這到底有多大的可擴展性,因為如果節點數量增加很多,那麼讓每個節點 ping 其他每個節點實際上是一件好事嗎?最終會不會給網絡帶來很大壓力?
這是個壞主意嗎?我知道一個更有效的解決方案是只要檢查每個節點(不一定必須讓每個節點都連接到每個其他節點)效率更高。將其可視化為具有幾個點的圖,它將是一個雙向圖,只有一條路徑連接每個點,而不是每個可能的點之間都有邊。但我不知道這是否是我應該考慮的水平。
簡而言之,我要問的是:如何在一個人之間建立一個 ping 監控系統一堆開放堆棧節點?
讓我知道這個問題是否有意義。謝謝。
如何在一堆 Open Stack 節點之間建立一個 ping 監控系統?讓我知道這個問題是否有意義。謝謝。
如何在一堆 Open Stack 節點之間建立一個 ping 監控系統?讓我知道這個問題是否有意義。謝謝。
參考解法
(by frei)