August 20,2009 12:27

其實,我才是「網路災情通報系統」的專家(誤)

莫拉克颱風造成的八八水災,有許多網友自發的整理、彙報災情。今天看到 黑貘 這篇 政府是該禁還是不該禁網路災情通報系統? ,不禁怒從中來,在 推特 一連發了好幾推。

底下把我的推轉貼過來:(資訊揭露:我已於 08 年中離開電信業,記憶也許不甚精確)

禁個頭啦,要不要把電信三雄的網管中心都禁掉? RT @tmas68: 看: "黑貘 (Gene) 說 "政府是該禁還是不該禁網路災情通報系統?" on plurk ( http://www.plurk.com/p/1mc2qm )

@tmas68 @yesonline 大家以為電信三雄怎麼知道自己基地台倒台?靠天眼通嗎?我04~08年工作的重要項目之一就是「沒有距離電信」裡面 NETeXPERT 系統的建置、維護。這種 維運支援系統 標榜是 manager of managers (網管系統的網管系統)

這種 Operation Support System ,可以彙整各家設備商(諾基亞、易利信、朗訊, you name it)的網管系統的告警,顯示在單一畫面。運用設定好的filter,值班工程師盯著他的負責項目(有人專看傳輸、有人專看3G...),在單一告警按右鍵就可開工單。

工單系統是另一家廠商做的,我們這端會利用網址傳送參數(告警編號,工程師員工編號等等),讓工程師幾乎不用再手動輸入任何資訊就可以派工單。(派工出去細節我不熟,不過應該是派給地方分區的工程師或是協力廠商,到基地台倒台的現場維修

其實電信三雄都有買這套,不過在 另外兩家 這套系統只有彙整部份的網管系統,還要再往上向別的系統彙報。我離開那個工作之後,聽說現在 沒有距離電信 把 素伯 的告警也灌進來了。NETeXPERT國外也有電力公司在採用,業界也有別家的系統。

看大家談「網路災情通報系統」,前幾天突然意識到,我以前在電信業做的就是這東西啊!在把別的廠商做的派工系統算進來,那就「通報」「派修」都有了。只是我們救設備,不是救人、救橋救路。所以救災我強調未來政府公部門 資料源 必須即時可靠、格式固定,這是當年跟各家設備商做告警界接的經驗啊!

而且現實一點講,不管是電信業的 維運支援系統 或是 大家談的 網路災情通報系統 ,其實都是商機(或者利,或者名)。面對商機的健康態度應該是「資訊透明,公平競爭」,所以再次強調,未來政府公部門 資料源 必須即時可靠、格式固定,讓有意願競爭的團體可以各自努力。

==
後來冷靜想想,沒什麼好怒的,黑貘說的跟我關心的不太一樣,他想描述的也許是 「在毫無準備的情形下,政府遇上了來自民間的 message/alarm storm(怎麼翻好?訊息/告警暴風?),到底會縮回去,還是勇敢站出來?」

當年在電信業做 OSS(Operation Support System),我們也是最怕 alarm storm (現在我猜應該也還是,何況告警還更多了),不過一方面我們建置的系統本身有一定的承受能力,一方面我們也建立了監控機制,如果偵測到各家設備商的網管系統送來大量告警,我跟客戶的工程師都會收到簡訊。我們會儘快登入系統,查出是哪個網管系統吐大量告警,然後採取必要的措施,上策是 bar (阻擋)特定單一設備的告警(當然還是要開工單去處理該設備),如果設備商的系統不支援這功能,就只好用下策,暫時關閉跟他們的界接(負責該系統的值班工程師就得多盯著那套設備的監控螢幕),等到 alarm storm 過去再恢復界接。

不知道該做什麼結論,就寫到這邊收筆吧。


  • ystuan 發表於樂多回應(0)引用(1)眾人滋事/姿勢/知識/之事編輯本文
    樂多分類:新聞評論 │昨日人次:0 │累計人次:552
    Ads by Roodo! 

    引用URL

    http://cgi.blog.roodo.com/trackback/9800917
    引用列表:
    原文引用自此
    噗浪Plurk熱門話題排行榜 - PlurkTop【PlurkTop】 at October 8,2009 20:04