東証社長、「投資家に迷惑をかけた」と陳謝 機器故障が原因
システム障害の原因については「ディスク装置のメモリー故障が発生した」と述べ、
外部からの不正アクセスではなく、機器の不具合だったと説明。
システムを再び立ち上げることで、2日は市場を再開すると強調した。

東証社長、「投資家に迷惑をかけた」と陳謝 機器故障が原因、再発防止で経営責任果たす
日本取引所グループ(JPX)傘下の東京証券取引所の宮原幸一郎社長は1日、システム障害で株式全銘柄の売買を終日停止したことを受け会見し、冒頭、「多くの市場参加者や…
東証「システムダウンの原因がわかりました メモリーが故障してました 再起動したら直った」
コメント
だからたまにはカバー外して中の埃掃除しなさいって言ってるでしょ!
しょぼい。というか冗長構成になってないのか。
バックアップもあったけど、繋がらなかったらしい
去年サーバをPRIMEQUESTからPRIMERGYに全部変えたらしい
PRIMERGYはごく普通のIAサーバだから単体内部での冗長機能は普通のRAIDと普通のペアメモリと普通の二重電源くらいしかない
だから複数サーバによる冗長の実現に掛かってくるが上手く働かなかったってことだけど
もしもSystemwalkerの物理サーバ冗長機能がダメだったとしたら話は東証どころか全世界にユーザ企業あるから大事だろう
再起動って一番最初に試す事じゃないのか
いやいや多重化してるだろ
そんなアホな説明で納得できねーって
まさかハード的問題とは
孫請けブラック企業が残してた脆弱性だとみんな思ってたのに
落ちちゃいけないシステムはFOを最低2系統用意とかしとかないとダメだわ
今はスケールする作りが当たり前になりつつあるけど昔のは弱いな
再起動したら治ったテヘッてスマホじゃないんだから…
東証、システム障害で謝罪 詳細な経緯説明、当面は「人的監視」で対応
https://www.itmedia.co.jp/news/articles/2010/01/news156.html
午前7時4分ごろ、「arrowhead」(アローヘッド)と呼ばれる株式売買システムの内部に
2台あるストレージシステム「共有ディスク装置」の1号機に異常が発生したと説明する。
異常の原因は装置のメモリ故障という。
通常であれば1号機に異常が発生しても2号機に自動的に切り替わる設定になっている
はずだったが、何らかの理由で切り替わらなかったとしている。この結果として、
arrowheadの情報配信処理や売買監視システムに異常が発生したことから、
午前8時54分にネットワークを遮断し、取引を停止したとしている。
トップがきちんと理解してるし責任から逃げてなくて素晴らしい会見だったから見たほうがいい
後はNewsPicksの記者がアホすぎてやばかった
今回の事を解説すると、発生箇所は外部に情報提供する為の、非主要部分の出力系で起きた。当然主要部分のフェイルセーフに対してはシミュレートしてたが、補助的部分が起因して全体が復帰不能になる事は考えて無かったと言う事だろう。
インフラやってた身からすると、顔面蒼白を通り越してると思う。
分散型オンライントランザクションの場合、
1台が故障すると同期コミットできずシステム停止する。
今回、メモリーTOメモリーのフェールオーバで失敗してるから、
その時に保持していたメモリ内のデータが破損。
他の全サーバのトランザクションをロールバックするか、
保証なしの強制同期コミットするか判断にせまられた。
単なるWebサーバだったら直ぐ復旧できるけど
東証みたいなのやつでトランザクション中にCPUやメモリが
故障したら基本無理。
インフラ障害なんて想定外の事象だらけだからな
素人にはそれがわからんのよね
どんなに頑張っても金掛けても想定外からは逃れられない
メモリ結構死ぬよね。