IT之家 11 月 1 日消息,科技媒體 BornCity 昨日(10 月 31 日)發(fā)布博文,報(bào)道稱微軟近期為 Azure Local 發(fā)布解決方案更新 2510(版本號(hào) 11.2510.1002.87),導(dǎo)致集群系統(tǒng)頻繁出現(xiàn)錯(cuò)誤代碼為 0x139 的藍(lán)屏死機(jī),大約每 20 小時(shí)崩潰一次。
IT之家注:Azure Local 是微軟提供的一種混合云解決方案。它允許企業(yè)在自己的數(shù)據(jù)中心或本地服務(wù)器上運(yùn)行一部分 Azure 云服務(wù),就像在本地?fù)碛幸粋€(gè)迷你的 Azure 站點(diǎn)一樣,特別適用于需要低延遲或數(shù)據(jù)本地化處理的場(chǎng)景。
微軟于 10 月下旬為 Azure Local 發(fā)布的解決方案更新 2510,在部分生產(chǎn)環(huán)境中引發(fā)了嚴(yán)重的系統(tǒng)穩(wěn)定性問(wèn)題。
一名為醫(yī)療保健行業(yè)提供服務(wù)的 IT 技術(shù)人員報(bào)告稱,在為一個(gè)客戶的 Azure Local 集群系統(tǒng)安裝該更新(版本 11.2510.1002.87)后,所有主機(jī)節(jié)點(diǎn)開始頻繁遭遇藍(lán)屏崩潰,系統(tǒng)顯示的錯(cuò)誤檢查代碼為 0x139。
這次事故對(duì)該醫(yī)療客戶造成了巨大沖擊。據(jù)報(bào)告,系統(tǒng)藍(lán)屏大約每 20 小時(shí)發(fā)生一次,導(dǎo)致承載著約 100 臺(tái)虛擬機(jī)的多個(gè)主機(jī)節(jié)點(diǎn)相繼宕機(jī)。
對(duì)于分秒必爭(zhēng)的醫(yī)療系統(tǒng)而言,這種“超級(jí)災(zāi)難(Super-GAU)”級(jí)別的故障無(wú)疑是致命的。技術(shù)團(tuán)隊(duì)在事故發(fā)生后立即嘗試更新所有驅(qū)動(dòng)程序和 BIOS,但未能解決問(wèn)題,系統(tǒng)崩潰依舊持續(xù),根本原因一度不明。
在本地排查無(wú)果后,技術(shù)團(tuán)隊(duì)攜帶小型轉(zhuǎn)儲(chǔ)文件(Minidump)聯(lián)系了微軟官方支持。支持部門確認(rèn),錯(cuò)誤代碼 0x139 是一個(gè)已知問(wèn)題,其根源在于 2510 更新本身包含的一項(xiàng)錯(cuò)誤變更。
為解決此問(wèn)題,微軟提供了一個(gè)注冊(cè)表修復(fù)命令,用于禁用該錯(cuò)誤功能。在收到多個(gè)問(wèn)題報(bào)告后,微軟最終正式撤回了版本號(hào)為 11.2510.1002.87 和 12.2510.1002.88 的 Azure Local 更新。
reg add HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Policies\Microsoft\FeatureManagement\Overrides /v 556278415 /t REG_DWORD /d 0 /f
官方發(fā)布說(shuō)明指出,正在對(duì)兩個(gè)問(wèn)題進(jìn)行調(diào)查:一是更新后節(jié)點(diǎn)平臺(tái)版本不匹配的錯(cuò)誤;二是 Hyper-V 套接字存在一個(gè)可能導(dǎo)致節(jié)點(diǎn)崩潰的問(wèn)題。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。