特許技術はメーカーの財産である 王者intelはDECの屍から特許をむしり取り 残りカスのalpha開発技術者をAMDに押し付けた あれから20年 当時WindowsNT4.0で圧倒的最速を誇るモンスターCPU、DEC Alpha 21264 を世に送り出した天才ジム・ケラー率いる狂人エンジニア軍団が 再びintelに挑戦状を叩きつけた メーカーの本当の財産は技術者である
当たり前や 脳みそがブッとんでる奴は段々酷くブッとぶが、ブッとんだ技術はそのものはそこまでだからな 昨日までの自分をタコ殴りにしながら進め それを実践できるのは実の所一握りだけだという証明でもある 悲しいなぁ
ジムケラーはとっくに逃亡してるのはどういうことかね? それでなくとも退職後に人事発表が出る(=計画外人事につきポストに穴が空いてる)のが常態化してる勢力にクーデターは起こせん 研究開発費が右肩下がりで推移していったころの成果物が出るのはこれからだしな
DEC Alphaはクレイジーだった 高速クロックを目指しRISC命令を選択 WindowsNTが投げたCISC命令をAlpha内部のデコーダで 数個〜百数十個にデコードしたのRISC命令をNTに返し 徐々にNT内部をRISCに書き換えてゆく 次に同じ命令が発行された時にはデコードする必要が無い 使えば使う程高速になる 貪欲に最高速度を目指したモンスターCPU 当時AlphaのM/BとCPUのセットは数十万位した とても手が出ない憧れのCPUだった しかしRyzenはお手頃価格で手に入る 買わない理由がない
本とか嘘か知らんが、Jim Kellerは、1世代目zenだけじゃなく、2世代目zenの基本設計までしてから退職したとかなんとか
多分他のCPUもやってるよ 短期プランAのzen系と長期プランBの例のアレ
>>14 その時代と一緒にすんなw 実際K8の後PlanAのK9がポシャってPlanBのK10が出てきたろうが 新型Radeon挿すとRyzenの封印が解除されるとかないかしら
>>11 前半が嘘ばっかしなんだけど 当時のNTにホットスポットコンパイラのような仕組みはない 最適化も適当なとこで止めないと 最適化に無駄に負荷とられるだけ
Bプランとか言う前にK12出せよ PC向け作ってきたのにARM版WindowsでQualcommが最初とかAMD見くびられ過ぎだろ。
>>23 開発の経緯見るにプランAがK12でプランBがZenだったと思う。 K12がPC向けということはない セミカスタム向けのコアという扱いになってる
BulldozerにはPlanBはなかったようだけどね
http://www.geocities.jp/andosprocinfo/wadai17/20170520.htm 1.Googleが第二世代のTPUを発表 公開された写真では,ボードには大きなフィンを付けたCloud TPUが4個搭載されています。 フィンの大きさから見て100W級の発熱ではないかと思われます。 TPU1ではボード上にあったDRAMが無く,TPU1の論文で最大の性能改善項目と書かれていた HBMを採用しているのではないかと思われます。 そして,このボードを2次元トーラスで接続し,ポッドとよぶ単位を構成します。 ポッドは最低64ボードで,11.5PFlopsとのことで,計算は合います。 そして,記事には,このポッドの写真が掲載されています。 一つのラックに8段×4枚で,2ラックで1ポッドを構成しているようです。 >>26 ソケット互換目指してた開発当初はセミカスタム向けじゃなかったと思うよ。 >>29 ソケット互換の話は20nmのSkyBridgeでしょ K12に関しては最初からデータセンターロードマップに登場してたしPC向けというのは無い TwitterのトレンドにNVIDIAが入るとかちょっと笑った
>>29 普通にセミカスタム向けだったよ(少なくとも表向きは >>28 データセンターではGPUは安泰と言われてたが 高レベルAPIなTPUのおかげでそれも危うくなってきたね 何より京クラスの演算が無料でってのが凄い 出遅れてるから 無料にでもしないとだれもつかわない
>>38 そうなんだ、プログラマブル性においてどう出遅れてるの? メイン用途は既に確立してるけどその他の用途でも使い道あるんじゃね?ってだけかと。 自社抱えの研究者に開拓させるよりは社外にタダで使わせた方が人件費かからない。 ASICは焼き増しのコストは相対的に安く済むし、うまく商用化できる分野が見つかればGCPのユーザー獲得にもつながり丸儲けというわけ。 どっかの名前のコロコロ変わるエンプラ向けGPUと一緒にするべきではない。
NVIDIA広報「興味を惹く為の釣りタイトルだと思いますが...」 日経ビジネスに"謎の半導体メーカー"と扱われた件でコメント [無断転載禁止]©2ch.net
機会学習はすでに端末側の争いに移行 端末側に合わせてサーバーを選ぶ 車の自動運転を皮切りに自律ロボットへ
>>41 松岡氏もネタにしてる Satoshi Matsuoka @ProfMatsuoka これから謎な場所で謎の企業のAlシンポジウムで詳細が謎なマシンに関するタイトルが謎な講演を行う。。。 >>42 端末に合わせてサーバー選ぶとか昨今の流れとは真逆なのでやらないんじゃないっすかね んで結局出遅れてるてのはなんなんだろ? ここからどう動くか見物だな 制御はエッジ側では尚更無理ゲー 現状のデバイスではRecurrentがへっぽこ過ぎる
懐かし過ぎて久々は \ ∩─ー、 ==== \/ ● 、_ `ヽ ====== / \( ● ● |つ | X_入__ノ ミ そんな餌で俺様が釣られクマ―― 、 (_/ ノ /⌒l /\___ノ゙_/ / ===== 〈 __ノ ==== \ \_ \ \___) \ ====== (´⌒ \ ___ \__ (´⌒;;(´⌒;; \___)___)(´;;⌒ (´⌒;; ズザザザ
https://www.nextplatform.com/2017/05/22/hood-googles-tpu2-machine-learning-clusters/amp/ Google’s first generation TPU consumed 40 watts at load while performing 16-bit integer matrix multiplies at a rate of 23 TOPS. Google doubled that operational speed to 45 TFLOPS for TPU2 while increasing the computational complexity by upgrading to 16-bit floating point operations. A rough rule of thumb says that is at least two doublings of power consumption – TPU2 must consume at least 160 watts if it does nothing else other than double the speed and move to FP16. The heat sink size hints at much higher power consumption, somewhere above 200 watts. The TPU2 board has huge heat sinks sitting on top of the TPU2 chips. They are the tallest air-cooled heat sinks I have seen in many years. Racks B and C are a different story. Power delivery of 30 kilowatts would enable 200 watt power delivery to each TPU2 socket; 36 kilowatt per rack would enable 250 watt power delivery to each TPU2 socket. 36 kilowatts is a common high performance computing power delivery spec. We believe 250 watt power consumption per chip is also the only reason Google would pay for those huge TPU2 heat sinks shown in above. Power delivery for a single TPU2 stamp is therefore probably in the 100 kilowatts to 112 kilowatts range and is probably closer to the higher number. That means the TRC consumes nearly half a megawatt of power while operating at full capacity. While four stamps is expensive to deploy for research, it is a one-time capital expense and doesn’t occupy a lot of data center space. However, half a megawatt of electricity is a lot of operating expense to fund on a continuing basis for academic research, even for a company of Google’s size. If the TRC is still operating in a year, that will indicate Google is serious about finding new use cases for its TPU2.
Google chose to scale out its original TPU as a coprocessor directly linked to a processor. The TPU2 can also scale out as a direct 2:1 accelerator for processors. However, the TPU2 hyper-mesh programming model doesn’t appear to have a workload that can scale well. Yet. Google is looking for third-party help to find workloads that scale with TPU2 architecture.
で、どうみたら機械学習で出遅れてるの? 最後の行なんて当たり前のことしか書いとらんが……
演算力倍とFP16にしたから単純に160W超えちゃってるだろうけど 今まで見た中で一番長いヒートシンク使ってるし200Wは超えてるね。 4スタップで0.5megaWの電力はgoogleクラスでも結構な痛手だし 一年たってもTRCやってればTPUの新しい使い方に探すのに本気だってことだろうね。 NVIDIAはソフトウェアインフラストラクチャとワークロードベースを1つのGPUからGPUのクラスタにまで拡大している。 一方TPU2ハイパーメッシュ・プログラミング・モデルは、うまく拡張できるワークロードを持たないようだ。 googleはTPU2アーキテクチャに対応したワークロードを見つけるためのサードパーティを探している。
スケールアウトはどこも課題になってるし GPUなんて無茶苦茶プログラミング難しいんだけど、theanoみても四苦八苦してるし あなたのその上の行の見解はどこから?
>>59 NVIDIAとGPUてとこがザッと見て見当たらんかったんで そのGPUはスケールアウトとプログラマブルであるという見解はどこから?と聞いた んで、どこからなの? リンク先に書いてるけど? Nvidia is growing its software infrastructure and workload base up from single GPUs to clusters of GPUs.
>>61 ん、ああなんだここに書いてあったのか 引っ張ってきたのからはなかったのでね ただこの見解はかなり間違いだね、GPUはほんとに扱うのが難しい というかこのサイトはスペックとんでもない間違いしてるし、公表値からかなりズレたこと書くしで 一応書いてる人って情報工学か或いは他分野で計算を行ってた人の出だと思ってるんだが 書いてる内容はあまり良いものではないと思う nvidiaもハードアクセラレータ積んできたし xavierではオープンソースのアクセラレータも積む オープンソースにしてもサーバーや シミュレーションでのトレーニングで儲けられるとふんでるんだろうけど
NANDとNAND以外の不揮発性メモリではビットコストが違いすぎるからNANDみたいな低性能メモリがいまだに生き残る ビットコストがNAND波でNANDより高性能な不揮発性メモリが出ればNANDを駆逐できる
>低性能メモリがいまだに生き残る DRAMにも同じこと言いたいわ
DRAM代替の不揮発性メモリとか、ほとんどUFOテクノロジーだよ この宇宙の物理法則を無視している
>>64 ○マイニング メモリ帯域が不要(インタフェースはUSBで済む) 汎用性不要(完全に同じ計算しかしない) ○AI メモリ帯域も必要 汎用性も必要(いろんな計算をする) 完全にマイニング化するわけではないな 半精度やら8bitやらのAI向け演算に最適化したコア+AIでよくつかわれる処理をASIC化 みたいになるのでは? CNNでの画像認識は入力画像とフィルターを使いまわせるので GPUのようなストリーミングタイプのプロセッサよりデータフロー型のプロセッサのほうが効率が良い だからnvidiaがxavierで載せるDLAはデータフロー型のeyerissそのものか それに似たものになるだろう
帯域が必要なのはLSTMやMLP、CNNでは特にいらんはず まあDataflowやCISCタイプの方が効率が良いのは面白いよね DataflowではWave Computingが今のところ進んでるのかな
>>75 それを言うならノイマン型だろ チューリングマシンは並列モデルもある 頭悪そう >>76 Qbit増えたニュース見て思った 流れと無関係なのはすまない こうしてやたらと攻撃的な>>76 が浮いたのであった >>78 量子コンピューターにもチューリングマシンのモデルあるから >>79 知ったかすんのが悪い 量子コンピュータのチューリングマシンって、量子チューリングマシンのこと指して書いてる?
そろそろデータ揃えたりコード書いたりから解放されたい
エクサスケールの予算、十数年前のスパコン予算と比べて少なくなったのう いかにして政治で勝つかの方が大事になってきとる その分ポスト京は、1300億円は確約されてるから気が楽
スパコンなんてXeonあれば十分だ 並列化で足りる
>>87 割とこういう見解を持ってきた人が多いから 予算が昔ほど大盤振る舞いでなくなったてのもあるんじゃない 結構手厳しい批判もされてたりするし 汎用でエクサが行けるのであれば、アプリケーションに特化した専用ハードウェアとかで コストあたり性能を2桁上げられれば、もうちょっとでゼタに届く気がしないでもない。2020年代前半? 最近だと機械学習とかなら採算合うのかなあ
AMDしか使えない精神の不自由な人のことも考えてやれよ
>>93 おめーはAMDも買っとけ 取り敢えずスリッパかEPYC APUが出たらそっちでも良いかもな >>91 Lake Crestじゃ倍精度は使えないでしょ、多分 アルゴンヌはディープラーニング専用システム組みたいわけではないし、棲み分けも示されてる >>94 スリッパでAMDゴキブリを叩く作業が捗るな ネイティブ32コアは10年内に出そうかい? まあ、やっぱり違うだろうな つか会計が現金主義という、多くのアメリカ人ですら知らないことも この記事内容の推測に関係してそうだが
会計っていってもいろいろやりかたがあるからね 契約した、正式に発注うけた(納品はまだ) 納品した・検収をうけた 金が振り込まれた どの段階で売り上げを立てるかは基準による 日本では、納品・検収がよく使われる
発生主義か現金主義かであって 多くの国の予算は発生主義、アメリカ含む世界中の企業もそうなんだけど アメリカ連邦政府予算は現金主義ということ そしてこのことは、多くのアメリカ人ですら知らない
>>97 個人的な予想だがA72ベースだと思う このスレの用語使うとA73はプランBだろう。 既定路線に回帰するという可能性はあるだろ。 それにしてもA53売れすぎ 最も売れたCPUとしてギネスに載ってもおかしくないな
Cortexは一応汎用性を求めてるらしいので パフォーマンス重視路線にしたのでは
A72-A73-A75 >>98 少なくともPre-Exaがどういう位置づけか知ってればこんな的外れな憶測は出来ないはずだな >>104 最も売れた(売れてる)コアは、組み込み用の4bitとか8bitの低性能CPUでは? 情報家電以外の家電なんてほとんど16bit以下だろ スマホよりたくさん数が出てる 現金主義(爆笑)云々以前に、LakeCrestの部分的採用の可能性は書いてあるがKnightsHillを置き換えるなんて誤訳してるバカは一人しかいないよ 原文読めないなら無理すんなよ
>>97 読む限りではDynamIQ対応コアじゃないっぽい? >>110 いやこの記事でAuroraが予算にないのは何かあったのかとか書いてるんだけれど あと現金主義(爆笑)って何?実際に現金主義なんだけれども このアホはPre-Exaの意味も理解できないのかよ DGEMMだけじゃなくてFFTやCG法も含めて足回りをトータルで設計 ディープラーニング専用コア全面採用なんてコンペの目的すら無視したちゃぶ台返しもいいところだ
>>114 不明だがKNHに何か問題があるのではないかと書いてて 一方では機械学習に焦点を充てたものがあり、Lake Crestといったものがある、ということを記事で紹介してるんだから 可能性があると書いてもおかしくはないと思うが >>116 ディープラーニング専用コアで疎行列なんて扱えるかよ まあKnightsHillが落ちたらCoffeeLakeよろしくKnights MillがプランBになるだけだろうけどな >>117 それがAuroraと呼ばれるかどうかは分からないが ってところを書いた記者に書いてくれよ パーツの納期の遅れ程度で計画そのものを大幅変更しない(というかできない)のはDOE案件見てりゃわかるだろ 稼働年数の方が長いんだし ほんとうに無理になったら計画そのものを中止してコンペからやり直すよ 東大のOakforest-PACSだって2年遅れだし、中間世代として急遽用意したPre-Post-T2Kのほうがそれよりも後だし
top500は質低いんだろ 取材してたくさん紹介してくれるのは有り難いけどな
>>97 GeekbenchでA73の1.34倍だとシングル2500近い結構なレベルになるが 単純に3命令にすると電力が肥大しそう A73比でモバイルにおける最高性能が20%以上アップで 持続性能はSameって書いている控えめさからは爆熱スマホ誕生の予感 DOEはPre-Exa世代ではHPLだけでなくExaを見据えて帯域にフォーカスする(疎行列やFFTの性能でも高いものを目指す)と明言してるので
アメリカが豆腐をパクったようなインターコネクト出せばすぐに出せるのでは? ただし、豆腐は配線がかなり多くなるのが欠点か? でも初代地球シミュレータのクロスバーほどじゃないが
京の様にラック当たりのFLOPSが低いという代償を支払って0.5Byte/Flops PEZY-SC2のように磁界結合のような新規に挑むリスクを負って1.0Byte/Flop アメリカのシステムは何を選んで何Byte/Flopsでいくのかな
問題は、京やESみたいなのが優秀な分野の計算がどんどん少なくなってきてること コスパ・ワッパで考えると、○の計算するならPCクラスタだね、◯の計算するならGPUクラスタだねって感じで、 どんどん京やESが必要な種類の計算が少なくなってきてる
逆だろ 実態として疎行列の利用頻度高いのに反映されてなかったからHPLが時代にそぐわなくなってきた GEMMでも疎行列は扱えるがリソースの無駄遣いになるし同じメモリサイズで扱える行列のサイズも小さくなる
>>134 全くの逆だよ つかGPUクラスタは評判あんま良くないよ HPのメモリセントリックがものになれば疎密区別なく扱える時代がくるだろうか
hpのやつはそんなに電力効率上がる気がしないんだよな。データの移動コストが高そうに見える。 googleが発表してたトランザクションレベルでメモリアクセスするってやつは、規格がしっかり決まればブレイクスルーになり得る気がした。
バッテリーに関しては、スマートフォンはテクノロジードライバーには成り得て無いな むしろ寿命が来たか、来る前に新しい奴に買い換えを強要させるビジネスモデルだから当然か
ESってES2、ES3と増強してるけど京は京2や京3にしないのか? 完成してから何年も経ったよね?
2012年完成らしいから5年が契約期間だとすると 今年までになる。 でも京の建屋使ってエクサスケールやるので どういう更新サイクルになるのかわからん。
>>139 HMCのロジック層にgather/scatter内蔵してくれればだいぶ帯域セーブできるかな、これは疎行列に限らずだけど ARM CPUコアアーキテクチャ刷新の土台となる「DynamIQ」の実態 http://pc.watch.impress.co.jp/docs/column/kaigai/1051691.html big.LITTLEはトランジスタ利用効率が低く無駄が多いが、フトウェア側の対応がほとんど不要、 DynamIQは、nvidiaの4+1コアを柔軟にした感じだが、トランジスタ利用孤立が高いがソフトの対応が必要 ただし、すでにLinuxカーネルは対応が済んでるといえる その他nvidiaのtegraで動くOSは基本対応済みだといえる big.LITTLEは過渡期の技術で、nvidiaの後追いでDynamIQになっていくんだろうな すでにandroidはnvidiaの4+1対応してるので、DynamIQもすぐに対応できるでしょう あと、Intelは遥か前からbig.LITTLEやそれの類似を提示してるが 実装では殆どしてないのを見るに ソフト以外にも何らかの問題があるんじゃね
>>147 Windowsモバイル端末で軒並みbig.LITTLE無効になってるの見ればNTカーネルに問題あるのわかるでしょう WindowsはIntelにとって未だ大きな影響力を持つ市場 別の見方をすると、Hotchipsでなにもなければ HMCはお仕舞いか
どのみち大口顧客に引っ張られるだろうしな LINQのコレクションフィルタみたいなものをHMCのロジック層に処理させたいな メモリ側で必要なデータだけ選り分けてCPUで処理する ビッグデータ時代に全データCPUにロードさせて総なめなんてナンセンスぜよ
GoldmontはA72とA75の中間的なアプローチだね 整数が分散型、FP/SIMDが統合型 このあたりはZenと同じ設計思想だ なんか某氏がARMも統合スケジューラ!効率的!って言ってた気がするが・・
A73,A75はIntとFPでレジスタセットが独立してて整数間とFP/SIMD間で統合してるし、整数レジスタとFP/SIMD間の転送を頻繁に使うことを想定してない。 IntelのCore*はFP/SIMDレジスタと整数レジスタとのデータ交換だけで2桁の命令数がある。 それらを効率的に処理するには同期して動く必要がある。だから単一の統合スケジューラで管理してる。 逆にGoldmontはIPC重視してないから。 Atom系アーキ依然クロックあたり性能でCore*の半分程度の性能しか持たない スケジューラが簡素でコアをコンパクトにできるからAtom/Celeron/Pentium向けのような低価格のSoCやコアを大量に積むXeon Phi向けの
Gemini Lakeとはなんぞ 14 nmだからアーキテクチャ変更なのか
林檎は今度はクアルコムから人材引き抜いてるらしいな。 本当にオールアップルにする気か。
iPhoneが生命線だからな なんとしてでも守りたいんだろう
Windowsっていつになれば、4+1構成とか、big.LITTLE構成に対応するの?
国連が間違っていると閣議決定 既に国連に喧嘩売っているし 正式に勧告受ける前に是正しなさいと助言してくれる人間を個人攻撃とか、北朝鮮ぐらいしか知らない
big.LITTLEってやはり中途半端 全てのコアが超低消費電力で駆動するなら無用仕組み
性能はずっと据え置いたまま、ひたすら省エネを極める方向に開発を進めると思っていたけど
>>174 人権無視や諸々の弾圧だらけで日本より遥かに悪質な中国や北朝鮮ほったらかして 日本だけ槍玉に挙げる国連のなにが正しいのか説明してからだな。腐れパヨクちゃんよ。 >>177 Intelが辿ってきた歴史のようにも思えるな。 >>178 そんなしょうもない人権四流国家と一緒に語って悲しくないのかね 最早経済すら先進国と言えなくなってasean諸国からの尊敬や信頼も大分なくなっていくと思う 真に日本のことを愛して将来を案じている真の愛国者ほど安部政権を危惧していると思うぞ 言論の自由を失うことは中華や朝鮮みたいな国になるということ >>175 正式に国連の人権委で取り上げることになったよ せっかく大事になる前に改善しろとアドバイスされていたのにね 世界へ恥をさらすことになる 日本は土人国家扱いになる 敢えて言わせてもらうが、スレチだ馬鹿。他でやれ こういったローカルの自治に従えないやつは赤の手先だよ 両者ともな
閣議で報告者関係ないって決まったし 都合が悪い人がいるんだろうね
スレタイも読めないのかこのバカ共は ここまで知能低いと生きてるの大変そうだな
他人から見る大変さと自覚する大変さが大きく違うタイプ
>>184 国連の人権委で取り上げられることが決まったんだがな スレ千だから止める 騒いでんのは当事者か、よほど暇な奴 学生、年寄り、学校関係者とかな 普通は日々仕事でそんなん興味もないし 自分が対象になるとも思わない
といって無関係なはずのパンピーまでもが逮捕されまくったのが現実ですけどね
>>193 それって戦前の法律だろ。 今は憲法で言論、集会結社の自由等が保証されているから大丈夫。 お前のようなパヨクが反対できる時点で戦前とは違う >>189 では、中国のウイグル民族浄化は明らかなのに国連の人権委員会で取り上げないの? その時点で国連が中国やロシアの道具になってることがバレてる。 だからアメリカが分担金をあまり払ってない >>189 天安門による人権弾圧は? 文化大革命による人権弾圧は? プラハ蜂起による人権弾圧は? >>180 同様の法律を作って運用しているのは世界の8割の国なんだけど、言論弾圧されてるか? 嘘つくなよ パヨク どこのニュースだ? PCIeのやつは少し前にでたけど
スパコンは半導体のプロセスの進化に合わせてチップを進化させていかないと陳腐化する SX-ACEは、いまなら14nmFinFETあたりにあわせてCPUを再設計する必要があるのでは?
ホイホイと再設計していられないからな PCIeボード作るのももしかしたらそのためなのかもしれない。 新ラインナップで需要掘り起こしつつ1世代分微細化とか。 実際Auroraボードがどうなのかは知らないけどさ。
>>172 スナドラ835はbig.LITTLEの4+4だが ARM版Win10のCPUスケジューリングはどうなってるんだろうな >>207 これってbig優先で処理を発行してくのかね? LITTLE側はプロセス優先度でも見て機械的に割り振るのか Android版のようにスケジューラが別途で判定処理を持ってるのか 実装がちゃんとした物ならx86でもヘテロCPUチップを作れそう Windows上でこのように表示されてるって事は 後はCPUドライバ次第なんじゃないか ARMでできるからx86ヘテロが作れるとか、その逆とかではなく。
だから、私は約30秒を紹介するために過ごすことができます。 誰もがゲームを考え、熱狂的で、非常に積極的で、最高のパフォーマンスを考え、エイサーは常に非常に積極的です。 何人かの人々はそれほど傲慢ではありませんが、実際にカジュアルゲーマーである多くのゲーマー、ニーズ? カジュアルゲームとは、ゲームのPCを会議室に持ち込むことができるということですが、恥ずかしい気がしません。 だからこそPCのカジュアルゲームが必要です。 リサスー それは、あなたが会議室でゲームをしていることを意味します。 ジェリー・カオ 正直言って、私はちょうどゲームをしていた。 さて、このラインは実際にはエイサーのカジュアルゲームノートブックであり、AMD 7世代とRX 550 GPUが搭載されており、最も重要なことはデザインを見ていることです。 それは情熱的ですが、静かなデザインです。 つまり、あなたがそれを開いたときに、情熱的なものが欲しいなら、あなたは気づかないが、会議室に入れることができる。 また、穏やかなデザインに加えて、臨場感あふれる体験のような特別なカジュアルゲームのような特別な機能も備えていますので、170度フルHD、15インチLCDディスプレイ、 Adobe Audio Premiere plus Acer Trueハーモニーテクノロジーで、オーディオとビデオの非常に良い臨場感あふれる体験を提供することができます。 また、Coolboostを実行するAcerの特殊な熱技術もあります。 Coolboostは熱需要の技術であり、実際には誰もが熱対策をPCに組み込んでいますが、多くの人が熱デバイスを使用する必要があるときや、Acer Coolboost技術を使用して決定する必要はありません。 これは私たちのノートです。 リサスー すごく良かった。 ありがとうございました。 ジェリー・カオ そして次の1つは、Aspire GX-281とCPUです。 これは今、世界でより良いCPUを推進しています。 リサスー 私はそれがRyzenのCPUだと思う。 ジェリー・カオ はい、Ryzen 7が内部にあり、AMD GPU内部にあります。
big Littleプロセッサが成り立つのは待ち時間なしで電源ONOFFを 繰り返せるMRAMがプロセッサキャッシュに搭載されるまでの間だな、 MRAMが省エネじゃないという奴がいるけど電源きれるほうが 明らかに省エネである。 TDP枠が大きくなるが平均消費電力が下がればいいだけ。
MRAMって、14nmFinFETとかの汎用CMOSロジックプロセスに混載できるの? 専用プロセスが必要ならどっちにしろ無理では?
212がとんちんかん過ぎて後々理解して見返したら赤面するだろうな
さて今後のCPUアーキテクチャとして要注目なのはIntelがNetburst以来20年ぶりにフルスクラッチしていると思われる新世代x86アーキだ 今のところ採用できそうなネタは Heterogeneous Many Core Near-Threshold Voltage New CPU cash Technology Full On-die I/O 現行のCoreはヒルズボロが32bit命令処理に特化させたP6を起源としており、約30年も前に設計されたものである。それをハイファが魔改造し、更にヒルズボロがNetburstで培った技術を移植、SkylakeでAVX-512まで盛り込む凄まじい増改築ぶりでZENとは対照的だ 今IntelにはZENのように高効率/高性能、ARMのように低消費電力/低コスト、そして既存のコードも走らせられる次世代CPUが求められている。それはIA64やWillametteであってはならない。必要なのはCoreやRyzenが霞んでしまうリアリークールな新世代なのだから
現行のSRAMより遅かったらダメだけどな 載せられんことは無いだろう、今んとこ1x層でCPU作っちゃいるから、間に何枚かMRAMを挟めば作れんことは無いと思う ただ、今の所現実的とは言い難いな
>>216 Jaguarを大幅拡張+μOPSキャッシュ追加でZenになったみたく Goldmontを大幅に拡張して新コアを作ると思う AVX-512は標準でついてくる IntelはAMDと違ってカネあんだからバックプランとして それぐらいできなきゃおかしいがな SkykakeまでのSandybridge refreshの繰返しはもはや 通用しない >>219 zenは確かにJaguarと共通点こそ多いけど、ベースじゃ無いよ 同じようにフロムスクラッチならベースというのは存在しない SkylakeがP6だっていうならGoldmontはP54Cベースだろ 演算ユニットのファンアウト最適化のために長い内部命令と高コストなデコーダを積んだのが前者、 内部命令は比較的コンパクトでデコーダの負担も軽いがALUのデータ移動コストが増大して性能が上げられない(高クロック化が困難)のが後者 電子の移動速度が変わらないならどちらが高性能化しやすいかわかるだろ Atom系統コアのハイエンド実装ならXeon Phiがある
>>223 このクソ革ジャンめ 自分たちの欠点もよく分かってやがるな、だがやり方が気に入らない ほんとコイツに比べたら団子が天使に見えるぜ >>224 どうなると見る? 俺は現存より更に重コア振りにすると思うんだけど VEX/EVEXネイティブなハードウェアでレガシーアプリをソフト的にダイナミックトランスレーションで実行するとかいうわりと先鋭的なハードだと言われてるが Crusoeの再来?としか ただネイティブのハードもx86だからその辺は多少はね μOPsに変換することで命令セットの制約をクリアしてるように見えて実は元の命令に起因するペナルティ多いから そのへんがうまく解決されればね… サーバには強そうだけどレガシー上等の業務アプリでメリット見出しにくいな
>>223 そりゃ12nmで800mm2なんてバケモノ作るから 次以降伸び悩むのは当然だわな >>230 レガシーは性能も(ある種)求められてないから切り捨てが妥当 そもそも動かないわけじゃないし悪くてもHaswell相当あれば文句は出ないだろう >>231 itanium>…と当時は思ってたんです。 VLIWは至高だ 実性能とか気にしないこと、いいね
denverもハード的にin orderなnative armだけど 動的最適化で性能稼ぐ 別にvliwじゃない
3D MarkのPhysics上位勢は全部Core系なんだよな もうこれで進んでくしかないんじゃねえの?量子コンとか別にして
>>231 コイツらは次でコレを超えなければいけない EUVや何やら出て来てこういう作り方が許容できるかどうかだよね シングル重視に走るしか無いよな しかしどうやって上げるか、、、 トランスレート層が噛む前提だったら、表層のISAがx86_64である必然性も薄れるのかなあ 例えばARMが動かせたりする可能性が出てくるのかね(さすがに、そんなに単純じゃないんだろうけど)
買収したSoftMachinesの技術でなんかしようとしてるかもね
AVXユニットの片レーンが80ビット浮動小数点を扱えるようにいびつな構造になってるのだが、x87をエミュレーションにしてしまえば64ビット×8, 32ビット×16の完全にシンメトリックな構造にできるから、そこが決め手なんじゃないの? nonVEXで無効命令例外はどうかなあ 現行のWindows x64 ABIでいうと一部のSIMDレジスタの退避復帰がYMMの上位下位でcaller-saveだったりcallee-saveだったり分かれるのがスッゲー糞なんでそこなんとかして
具体的には初期K8の64ビットモードでのx87と同様のペナルティが生じるかもね SuperPiがクッソ遅くなるか、あるいは代替パスが自動生成されるか知らないけど
つーか、コアあたりのトランジスタ数を減らす意義の大きいPhi向けならまだわかるんだけど、x87(あるいはレガシーSSE)を廃止することが劇的なパフォーマンスアップにつながるってのはにわかに信じがたい KNCにすらx87ユニットが載ってて高階関数関数はx87を使うようになってた そもそもvdivpsすらなかったからね、KNCは エミュレーション云々は情報が少なすぎてどうとも言い難いわ
gatherのコストがわからないバカは足し算すらできないことを自覚したら
32コアOpteronデュアル機を組むのを楽しみにしてます 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ
宣言通りに買うのかどうか知らんが MSがWindows10Proのワークステーション版を出すとかなんとか
Phiといや4オペランドてどうなるんかね? プログラマー発狂の感じがするんだが
>>251 デコーダーがシンプルになることのほうが大きいんじゃない? 性能的にもエネルギー的にも ついで整数はトレースキャッシュ的な仕組みを導入したら基本的なパイプラインを変えなくても それなりに性能/ワッパは向上しそう >>251 高階関数www 無理に知らない言葉使わなくて良いよ >>259 既にμOPs Cacheの平均ヒットレートが8割程度なんで、残り2割のケースを改善しても劇的には上がらないと思うよ ただ、μOPs Cacheも用量を大きくすればいいというわけではなく、高速・高バンド幅のキャッシュを2倍、3倍と容量を増やせばそのぶん消費電力も増大。 x87を削ることでμOPsキャッシュの効率が劇的に改善できるなら画期的なことだ 懐疑的だけどね 電力効率が大幅に改善されるのはどっちかというと逐次デコードのXeon Phiの方だと思うよ。 (一応、命令の長さ情報を記憶し再利用するプリデコードキャッシュはKNLやApolloLakeは持ってる) >>258 KnightsMillで導入されるAVX512_4FMAPSのこと? あれはハマるパターンなら最強だと思うよ vfmadd231psがたとえばレイテンシ5サイクルだとすると4回同じ値に乗算値を加算すると20サイクルのレイテンシ そこを4回ぶんの加算をいっぺんにまとめてやると、8サイクルとかですむ まあ普通にDL特化命令ですなー RYZENの予測分岐はニューラルネットで 優れもの コレはかなわない
>>263 90年代のCPUに既に載ってるパーセプトロンがどうしたって? まあ既存技術をさも新しい言葉で置き換える「欺術」の賜物ですな x87は、速度でなくてもいいが互換性のために残すって感じでいいでしょ? x87命令を高速化するために複雑になったり、他が犠牲になるみたいなことさえしなければいい いまの5分の1の性能があればいい いっそマイクロコード実装でもいいくらい superπベンチが下がる以外に問題はおきない
ついでにSSEネイティヴ実行廃止の噂もあるけどソフト開発者に発破かける意味合いの方が大きいと思うけどね OpcodeテーブルはVEXエンコーディングとほぼそのまま互換だから 切ったところで劇的にリソースの合理化できるわけではない まあ、盲腸を切り捨てようとするとクソメデイアが変なミスリードして性能が下がっただのと叩いてビュー数を稼ぐのだろうが
>>261 そこは8割の確率で共有リソースを使わないのは性能・ワッパ的に良さそうだななって PARRATだかRARRATだか忘れたけど よく使われる2割の命令はトレースキャッシュ的なグループ、それ以外の命令は共有パイプみたいな感じ >>266 市場の8割を占めるIntelのすることは善、AMDがすれば悪 AMDのRyzenではデコーダーを二段(デコーダーではほぼデコードせず命令の切り目見つけるだけ)にしたみたいに 命令の切り目を見つける工程を簡略化できるのは大きいんじゃない? MS「x86切り捨てんぞ」 Intel「Windows切り捨てんぞ」 Goldmontでようやくmulps/pdが1パス実行できるようになったしAtom系統もAVXサポートしていい頃合いかもね 逆にAVX未サポートのCPUが市場に残ってる状況でSSEは切れない
何でも良いけどあの辺て「CPUが」扱えると書いて良いのか?
>>272 x87は扱える sin, cos, log(1+x), exp(x)-1など >>275 あ、扱えるんだ、すごい(小並感 でもx87ってことは古いその辺で定義されて結局それ以降の拡張には無いのか 意外と使わないのかな 何百サイクルもかかるし他の命令の実行をロックするから、より効率的なソフト実装があるならそちらを使った方がいいよ レガシーコードとは無縁そうなXeon Phiに残ってるのは検算用という意味合いが大きい
なんやこれ、Intel以外は詐称しまくりやんけw http://egg.2ch.net/test/read.cgi/jisaku/1496677423/175- 175 Socket774 2017/06/07(水) 19:24:40.19 ID:hfgLQHEb ASMLの微細化指標である標準ノードで比較した場合 32/28 22/20 16/14 10nm 7nm 5nm 25 NA 17 NA 9.2 7.1 GF 31 21 13 9.5 5.9 ? Intel 27 20 17 12 9.2 7.1 Samsung 27 18 18 12 9.2 7.1 TSMC >>276 単独なら直接命令を使った方が速い 複数ならSIMDのソフト実装の方が速い >>277 検算もソフト実装使った方がよさそう x87はもう捨てても良いんじゃ無いかと思い始めた 超越関数という訳は、一瞬「お?」となる けれども誤解を招くのを防ぐためだったのかな、とふと考えたり
>>280 検算用とか団子が適当に言ってるだけ >>281 「超越数」 から来る 多項式の解にならない数 >>282 なるほど、純粋に日本語の枠組みで考えたのね 有理数 <===> 有理関数 無理数 <===> 無理関数 超越数 <===> 超越関数 無理数、有理数も、 無比数、有比数 の誤訳とか言われてる 対数も、対数の数表に書かれた「対応表」の誤訳
高階関数はこれらとは全く概念が異なる 関数自体を扱う関数 乱暴に言うと、C++のラムダ式みたいな物
昔の Visual Studio のヘルプ Complex Number ライブラリ 「複雑な数を扱うライブラリ」 とか、なかなか楽しい
三角関数は超越関数じゃなくね?定数係数線形微分方程式の解だから 代数関数ではないけど超越関数じゃなくて初等関数な
>>289 これは楽しいなw某K君も昔はこういうのをここに貼ってたのかもしれん >>286 素直に汎関数て呼べばいいじゃん(いいじゃん) >>290 超越関数の定義は代数関数じゃない関数、つまり多項式係数の多項式の解にならない関数 微分方程式の解になっているかどうかは関係ない 三角関数、対数、指数関数は超越関数関数であると同時に初等関数でもある >>290 それなら指数関数も解になるから、超越関数ではないということになるのでは 三角関数も指数関数も初等関数でもあるけれども >>278 これがIntelより速く量産に漕ぎ着ける理由だよ 但しファウンドリ向けのプロセスとしてはIntelが数周遅れてることに間違いない >>291 呼称に関しては、専門によって変わるだけの話だから >>296 ++は言明されてないからわからんぞ 恐らく7nm1stがコケた時用のPlanBだろうとは思うが それにこの14自体サムから引っ張ってスタートして、初出P10から使ってるんだ +は割と投入は近いんじゃ無いかな Vで+使うってんならタイミング的にV20/11だろうが、リスク分散とコストの兼ね合いからV11でミッドの置換と見るのが妥当かと あとzen方面はこれも同様に理由でSummitRidgeポジの置換でZen2と同時投入 APUは現段階でアレが出てるし、当面は14LPPのままだけどV11/zen2から多少遅れて更新じゃ無いかな 7nmは従来型の初期/EUVの後期が有るけどどうするかわからない >>296 逆だっての 今度のは高性能向けプロセスって事 今使ってる14LPPはスマートフォン向けの製造プロセスで1〜2.2GHzを想定してるのに無理やりぶん回してるに過ぎないのだよ Skylake-Xのコアの大きさを殻割り画像やダイ写真から推測するとコア+L2C+L3Cで約16mm2 ちなみに、Skylake-Sは12.5mm2
>>299 ずいぶん増えてるな L2増量の所為かな? L3は減ってるでしょ なおキャッシュ帯域幅はSkylake-Sの2倍
ダイサイズ測るついでにSkylake-XとSkylake-Sを同じ縮尺で並べてみた 14+同士で比較するならKabylake-Sのほうがいいかも やっぱり同じSkylakeでもコアが別物だな。
>>298 それはない モバイル向けプロセッサとして作っても3GHzはまわる(冷却さえやれば) >>297 そういやRaven Ridgeは二代目zenという話もあったな >>305 それがオーバークロックとか難しい事しなくともRyzen 7 1800Xは自動で4.1GHzに回るように出来てるんだよ >>305 十分可能性は有る だけど時期的に考えて初版はznver1だと思うね もし間に合ってるならRyzenで3をAPUに当てないし、TRやEPYCもznver2にするだろう 問題はGFのキャパだな ちょっと売れ過ぎてると感じる intelみたいに各地にバカスカ450mmのFabが有るわけじゃねぇし、コッチはdGPUも抱えてるしな 450mmなんてIntelはおろかTSMCも導入してないよ
>>304 いや、基本的な設計はほぼ同じみたいだよ -Sのコアを切り取って-Xのコアの横に並べてみるとよく分かる 右がSKL-Sで左がSKL-Xね SKL-Xの青枠はSKL-Sと共通と思われる部分、赤枠はAVX512のために追加された回路、緑枠はおそらく増量されたL2C それ以外の部分はL3Cとチップ内ネットワーク用の回路と推測 ああ、右上のブロックがFMA(×2)だろうなとは察してたよ Skylake-Xeonのサブセットとして-Sが設計された格好だね
団子は乗算器の回路規模なんて大したこと無いとかほざいてたけど結構な面積じゃん
AVX512_4VNNIWとかいう固定小数点の畳み込み演算用命令がKnightsMillで追加されるが AMDはExcavatorまで独自に類似の命令を実装してたぜ 皮肉かよ
>>315 俺も聞いた気がする amdの128bit幅とIntelの256bit幅の対比だった気はするが・・ >>317 変な命令ばっかりかと思ったらそんなもん付いてたのか 何に使うんだそれは 固定小数点の畳み込みなんてラーニング関連でないと使わないだろう。
補助なし300Wまで可能にするとかいう話があったな
>>323 Skylake-Eで対応するとか噂があった4.0ですらリビジョン0.9なのにw >>326 シャア少佐、一手先で勝ててません! シャア少佐ー >>317 用途は畳み込みに限定されてないけど 行列のかけ算にも使えるよ あ、ごめん団子はかけ算が苦手だったね 糞手を100手読んでも無意味 全ての分岐に対して100手読めたらすごいな 観測可能な全宇宙の資源全てを使っても無理だろうけど
>>328 へえ、pmaddwdのデータの並び順でデータを整列するところからだね 君は相変わらずgatherのコストを考えるのが苦手なようだね 行列の積の定義は覚えたの???? じゃあ次はキャリーレス乗算の定義と使い方www
繰り返すけど4MIMWは16ビット整数値の畳み込み演算特化で行列積なんぞに使いようがない あ、ただし特定のビデオコーデックの符号化で使えるかも(名指しはしない) 4FMAPSのほうは重加算ステージで内部精度46ビットで処理するならSGEMMでも副次的に効果はあるかもね
こんな馬鹿と論ずる価値なし 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ
畳み込み専用とかwww まったく応用の利かないアホwww
AMDファンボーイの発狂具合が面白いがTwitterのハッシュタグ #Ryzen_SEGV_Battle 面白いことになってんな マイクロコードで修正できない系の不具合だと最悪リコール来るんじゃない?
> 繰り返すけど4MIMWは16ビット整数値の畳み込み演算特化で行列積なんぞに使いようがない www
おいィ? エラッタリストにも追加されてないバグのロジックレベルの修正がEPYC発売までに間に合うとかどんな冗談だ CPUの製造工程舐めてね?
>>347 32コアOpteronデュアル機を組むのを楽しみにしてます 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>348 だからハードウェアバグだって言われてる しかもAMDがまともにとりあってない マイクロコード修正で直る、修正作業中で次のリビジョンで直る、黙殺する、 現状だとどれもありそうだ 事前の負荷試験で見つかりそうなもんだけどなあ。意外に分からんものなのか、ちゃんとやってないのか
もともと高速なスイッチングが得意でないモバイルプ用のロセスルール使ってかつ普通はCPUに使わない高密度のセルマクロライブラリを強引に動かしてるから負荷によって何かエラー起こっても仕方ないと思いますけどw たとえば電磁ノイズによる演算エラーの線も否定できないね
>354 ほー 電磁誘導がデカいそうだ、HDまみれのGPUも無視ってのはポイント高いですねぇ 電流は寧ろ低いんですけどねぇ、不思議な話ですねぇ
話は変わるがクソファンボーイ大絶賛のInfinityFabricはダイを並べるだけでスケールする魔法のインターコネクト技術という風潮があるが 普通にXeonの内部バス帯域にはるかに及ばんからな だって最大クロックで動かして1ダイあたり51.2GB/sの転送レートだろ Xeon Gold/Platinumがオプションで対応するMCDRAMの帯域が480GB/s この事実はそれが活かせるだけの内部ファブリックが標準で備わってるということ 逆にいうとEPYCにHBMポン付けしても全く活かせない
>>356 逆 そういうのは考えてないからそんくらいに抑えてある、と考えるのが普通 dragonflyBSDにそれっぽいのがあるのと、gccでしかナンタラっつーのも 錯綜してんな 来年は Cascade Lake で Intel persistent memory(3D XPointのDIMMタイプ)も 加わって、メモリ周りはワークロードに最適なソリューションが選べるようになって 面白くなるのかな。
Xeon PlatinumがMCDRAMを載せるのか、載せるとしたらどんな構成なのかは知らないが、 1リンクあたりの速度とファブリック全体の速度を比べるのはフェアじゃないな 例えばKNLだって8個のMCDRAMが分散配置されてるわけだから、内部の2Dメッシュは 1リンクあたりの速度が480GB/sなんてことにはならないでしょう そもそもEPYCはDDR4しか使わないのでそれに対応した速度であれば問題ないと思うけどね
多くのアプリではダイまたぎの通信が多少遅くても大して性能低下しない ダイまたぎの通信がボトルネックになる一部のアプリだけXeon使えばいい
>>359 Google Compute Engine の Skylake 32C版とかなら、32C/64TのVMを 1 CPU上に割り当ててくれるんじゃないの? そうすると、NUMA最適化とかしなくてもちゃんと性能出るから、使う側のコスト 下がるってのもあるかね。 2 CCX構成やらNUMAへの最適化って、PGには辛い仕事だよね。 >>361 沢山のスレッドが動くサーバーなんかだと、メモリアクセスの面でも MCMは不利じゃない?メモリアクセスのレイテンシが大きくても性能上がった コアを出来るだけ活かすためのSMT化とも言えるか? Intel persistent memory(6chの内2chだけ刺すとかになる?) なんかも、 そいう面で4T/Cとか考えてないのかね。 メモリ2chで8チップのNUMA構成自体はそれこそDDR1の時代のOpteron 8000番台からずっと実績あるからそれで行こうと思ったんでしょう 4つ繋げたからって8chと表記するのも大概おかしいんだけどw 130GB/s超のロード帯域を1ダイであつかえるわけじゃあるまいに
InfinityFabricてそもそもPHYがPCIeでしょ 名前のハッタリに騙されすぎ
そもそも全ダイがメモリフルロードしたらバス帯域飽和してダイ間通信に割り振れる帯域もない
>>366 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ ブロック図改めて見て Opteronの頃はメモリコントローラとHyperTransportが並列で動いてたけど FSBでノースブジッジに繋いでた頃に退行してるな、と思ったわ バスが全二重という違いがあるとはいえ
>>365 ちゃう 外部向けの実装ではPCIeのコントローラとコンパチにしてあるってだけ >>369 32コアOpteronデュアル機を組むのを楽しみにしてます 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ MCMのゴミを買うと言った覚えはない モノリシックダイで再設計しろやカス
Broadwell の性能を越える が買う条件だ 約束は守れ
Are you native ? を自ら裏切る会社に守る約束などない
InfinityFabricは内部バスの簡易化と共通化がメイン CPUやAPUの世代ごとに専用の複雑なバスを作るのがコストやリソース的に厳しくなったから、世代に関係なく使いまわせる汎用性の高いバスとして作られた PCIeとの互換もあるからMCMや2Way向けに使ってるけど、プロセッサ内部の数百以上あるセンサー類や、各モジュール間の通信を簡単にできるから、開発スピードをかなり上げることができるようになる コレのお陰で、高歩留まりの8コアや、2チップのTRや4チップ使ったEPYCを、矢継ぎ早に出すことが出来るようになった 色んなのを2つのFabricに繋げて、制御や通信を行っている InfinityFabricは開発の効率向上とスピードアップに貢献する技術 そして恐らく高歩留まりにも寄与している 帯域がどうとか言ってる程度の認識だとIntelも今後更にやばくなるだろうな だって本当に帯域狭いじゃん せめて4倍くらいの転送レートにしないとネイティブダイ並みの性能は出せんよ まあ、シングルタスクを64並列で処理するならあれでいいだろうけどな あれで相互作用系の演算は無理だよ AMDがいくら自社のクソ技術を大言壮語しようともDOEスパコンコンペ全落選という実績が示した客観的評価は動かない
中の人も未把握のSEGV出してる時点で歩留0%やん
AMDの中の人「uopcache無効にしてみろ(震え声」 それが解決策かよっていう
ある種のワークロードではコア間インターコネクトの性能(レイテンシ/スループット)が必要だが、 比較的そうでないものもある、ぐらいまでしか一般論では言えないだろうなあ Intelは内部のインターコネクトについて概要しか公表してない(はず)で、それがどれぐらい良いものなのかはよくわからない 性能は出てるっぽいので強く文句があるわけではないけど
少なくとも片側2車線道路が東西南北4方向に走ってるのを8車線道路って言ったら大嘘でしょ
まあ今のAMDの立場からすると8コアのMCMで開発コストを下げて ソケットあたりコア数で優位に立って取れるところを取るってのは間違ってないと思うよ
Intelが同じことをやれるのにトータルのスケーラビリティを犠牲にするので敢えてやらないことをやるのを賢いとは思わないけどね ノード全体で8チップの縛りの中でやってるだけですもん この会社が5年後も生存してたら8チップMCMで「これからはシングルソケットの時代」とか言ってる可能性すらあるよ
MCMによる高密度実装とみなすなら、 無理矢理Intelのラインナップに当てはめると、Skylake-SPというよりXeon D系かもしれない
雑に言えば16とか24とかのネイティブダイを設計してバリデーションする金も人も無いって話だと思うよ だから8Cと4C+iGPUの2種類のダイだけを作ってそこから全部派生させようとしてるんじゃないかと
てか、わざわざMCMででかいCPUに仕立て上げる必要あるのかね。コア数で Skylake-SPに張りあっても方向性全然違うし。 シングルダイでXeon Dみたいな製品として低クロックで安く出して、小さいところ から始めた方が良かったんじゃない? ※もっとも、Xeon Dは次は10nmになってまたワッパで差をつけられちゃうかな。
色々なトレードオフの結果としてMCMを選択する前提なら、 詰め込めるだけ詰め込んだ方が密度的には有利なのでは
TDP 180W、パワーリミット240Wとかだと、それなりのCPUクーラー必要で密度 上がらんでしょ。Xeon Dなら1ブレード3CPU(16Cx3なら48C)なんて実装例も書 いてある。
8C Ryzenダイと 4C+VegaのAPUダイの2つだけでIntel倒せそうなのがなんとも 絶対性能じゃ多少劣るだろうけど、歩留まり高いからそれを補って余りまくるほど生産効率が良さそう
>>391 そこはさすがにクロック下げるんじゃない むしろパッケージがとても大きそうなのでブレードにうまく収まるのか、あんまりよく分からない >>393 あれじゃ単一ノードで4ソケットや8ソケットの製品作れない 子供の4人5脚でオリンピック選手に勝てるのはトータルの体重だけだよ >>394 1ダイ当たりXeon Dと同じ45Wまで下げても4ダイなら180Wで、下の画像 のようなCPUクーラーが必要になって、普通のラックマウントだと1U厳しいんじゃ ない? そんなのブレードタイプで載せられるかな。IntelのE5だとクロック&TDP低目の でブレードタイプはあるね。 >>389 フラグシップのSkylake-SPを初っ端なボコったほうがいい宣伝になって後々商売しやすいからだよ XeonDとやらはTRをサーバー向けで省電力にしてボコるんじゃない? 200mm2程度のダイのMCMで全部作れるから、開発スピードも相当早くなって、毎年新製品を大量に出せるようになる Intelが展開してる高利益な市場は根こそぎ奪う予定だろうな 再来年には7nm投入だから、Intelも10nm対応を早くしないとヤバそう NaplesはPCIe3.0が128とDDR4の8チャンネルのSoCだから関係ないだろう 足回りの弱いXeon積んでも動作しないもんまで余裕で動作したっつうのに
GeekbenchやSandraのスコア(超絶低性能)を片っ端から削除して回る程度のクオリティ
>>396 XeonD対抗が何で1ダイ45W x4で180Wの話になるの? 2ダイ 16Cで45W程度に収めてくるだけだろ ちなみにRyzenとXeonDの一番近いスペックはこんなもん D-1548 8C/16T 2GHz 45W 1700 8C/16T 3GHz 65W どうにでも対抗できそう Ryzen Mobileになるとノートパソコン4コア8スレッドがメインストリーム IntelのCannonlakeですら2コアなのに
>>396 ざっくり8コアTDP 65Wのクロックを1/3にするとXeon DぐらいのコアあたりTDPになるんじゃないかなあ まあ低クロック領域の特性をよく知らないまま雑感で書いてるけど >>402 AMD謹製の謎実装ってこと? それどう考えても信用できない評価でしょ…… >>404 1700の65Wって、CINEBENCH(普通のソフトのCPU 100%はこのくらい の消費電力だろうね)で実際どのくらい食うの? TDP 95W表示の1800Xだと、アイドルとの差がAC側で測って120Wくらいは あって、TDP 140Wのi7-5960Xと大差ないみたいだね。 Xeon D-1541 2.1GHz@45Wなら、CINEBENCHで全コアTB最大で動作(2.5か 2.6GHzか)で40W食うかどうかだろうね。 マルチスレッドでに比較させたらこんなもん Naplesは16-32コアでTDP120-180W Snowy Owlは8-16コアでTDP35-100W
>>409 > Xeon D-1541 2.1GHz@45Wなら、CINEBENCHで全コアTB最大で動作(2.5か > 2.6GHzか)で40W食うかどうかだろうね。 どうかだろうねとかいう希望的観測なんかどうでもいいよ >>407 32コアOpteronデュアル機を組むのを楽しみにしてます 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ AMDの広報担当者の(?)発想力だけはむしろ見習いたいが基本的に試験方法はちょっと残念 やる気がないのか宣伝と割り切ってるのかあれは何なんだ
>>414 もっと重いPrime95とかでD-1541とD-1567(12C@65W)の消費電力を UPSの消費電力表示で比較してるのがあったよ。Intelの場合、TDP表示を 大きく超えることはないだろうね。 ダウンロード&関連動画>> VIDEO >>417 kaby Lakeの性能が思ってたより低い事がバレたからだろうねw TDP65W同士の消費電力の比較 Core i5-7500無印とRyzen 5 1400 Core i5-7500(3.8GHz)とRyzen 5 1400(3.4GHz)とRyzen 5 1400(3.8GHz)の比較 Cinebench R15 wprime(単位が秒なので短い方がいい) CPU-Z 3DMark Firestrike CPU ゲームやらんけどベンチ TDP超えたぶんの差分は外付けのVRが食ったって言い訳も成り立つかもね
>>421 Ryzenの場合、TDPとパッケージパワーのリミットは別腹らしいよ。 1800Xはパッケージパワーリミット128Wらしい。だからAM4のピン数は多い のかも。 >>419 30分の英語の動画貼られてもな 結果はどうなんだよ >>422 1800Xの、XはXFRの機能がより良く効く事であって XFRは自動オーバークロック機能 冷却機能に余裕がある場合に自動でオーバークロックしてくれるのだよ >>423 Prime95でもUPSの表示のアイドルとの差はTDPを僅か超える程度。 VRの損失やらPrime95なのでメモリ負荷(DIMMの消費)なんかも考慮すれば 超えてないだろうね。 ※65WのD-1567でも、おもちゃみたいなCPUクーラーだし。 AMDは電力128WでもTDP95Wに抑えられる Intelは電力95WでTDP95Wになってしまう 電力じゃなくTDPがシステムの指標だから、電力値にはあまり影響力はない 消費電力が重要なら、消費電力としてスペック表に書かれるけどそんなの殆ど見ないな
>>424 OCって言うほど上がらんでしょ。 ※Skylake-X 10Cで殻割りで5GHzでnon-AVXのPrime95が回るらしいよ。 Xeonのダイなのにな。 ダウンロード&関連動画>> VIDEO AMDがZenで高密度サーバやるって宣言してから やっぱ辞めるしSeaMicroも畳むって手のひら返す その半年のちょうどまんなかくらいに Xeon Dが出たんだよ 下手な勝負はできないってことだな
>>430 ワッパ気にしないのかよw Intelは基本的にパッケージパワーのリミットはTDPと一緒だから。 ArkじゃなくてPDF化されてるデータシートの方見るともっと詳細な熱設計載ってるよ
分かったから暴れるなよw 同社で試作したRyzen Mobile搭載の2in1デバイスを公開した。 この2in1には4コア/8スレッドのZEN CPUと、Vega GPUというスペックのRyzen Mobileが搭載されており、360度回転ヒンジを装備する。 さらに、筐体は10mm以下の薄さを実現しており、実際にバッテリ駆動状態で動画を表示してみせた。 Cannonlakeですら2コア4スレッドなのにw >>433 Xeon DのThermal/Mechanical Specification and Design Guideには こんなことが書かれているね。TDPの定義では、最大消費電力でないって 文言が他のモデルのにも書いてあるけど。これは、下の注にあるように TBT2.0の仕様で短時間だけTDPx1.2とか1.25とかを許容する仕様がある からだね。 TDP: Thermal Design Power: thermal solution should be designed to dissipate this target SOC power level. TDP is not the maximum power that the SoC can dissipate. 3.Thermal Design Power (TDP) should be used as a target for SoC thermal solution design at maximum TCASE. SoC power may exceed TDP for short durations. Please see Intel® Turbo Boost Technology for details. >>432 気にするけど、ワッパのワットはTDP準拠なんだ 一々ベンチサイトの消費電力グラフ使って計算したりはしないな 重要なのはどっちかというとコスパの方 ノートPCなんてコア数増やせば売れるもんじゃないのわかるだろうに Intelすら4コアの普及が進まないって嘆いてたくらいだよTDP35Wの4コアより15Wで上限クロックの高い2コアを望んだからね 低価格ノートの雄・Celeron Nも2コア版と4コア版どっちもロットあたり価格同じなのにメーカーが多く選んでるのは前者
消費電力気にするのはバッテリー持続時間があるノートとかだけでいい 稼働時間の殆どがアイドルでしか無いから瞬間的や短時間な最大電力とか別に気にしなくていいな
土木や建築業界では平均負荷の10〜100倍はマージン取るのが普通だが電気電子界隈は数割っていう皮肉があってだな
>>438 コア増えたからと言って上限クロックが下がる訳では無いのだよ 夏を乗り切れないRyzenちゃん 962 Socket774 2017/06/09(金) 23:04:50.47 ID:z5jtCxlk 当初猛烈な勢いで進んでいたRyzen OCスレだが、ここ最近はまともなOC報告上がっとらん。 夏場におけるRyzen 8コアモデルは4GHzすら遠い夢。 154 Socket774 2017/05/07(日) 23:08:31.78 ■CPU : Ryzen 7 1700 8コア / SMT有効 ■動作クロック / Vcore : 3.700Ghz / 1.2400V 588 Socket774 2017/05/22(月) 13:20:46.83 ■CPU : RYzen7 1700 ■動作クロック / 3.600Ghz Vcore : 1.200V
>>443 Ryzen 7 1800Xは自動オーバークロックで4.1GHzなのだがw >>441 そう思いたいのは勝手だが 1コアのクロック上限は動作可能なコアの一番性能低いコアに縛られるからコアが増えるほどクロック上限的には不利になる Windowsでシングルタスクアプリ動かしてみればわかるでしょ 1コアにだけ負荷偏らないようにラウンドロビンでタスクスイッチしてる コアによって特性がばらつくけど全コアで一番性能悪いコアに合わせて上限を決めないといけない そうなるとコアが少ない方が有利なわけ >>442 実売数と全く関係ないバナークリックランキングがどうしたって? なんというかさ、モバイルだからって 4コアごときでコア数勝負だ、コアあたり性能が出ないからだ、 なんて言われるような時代じゃないでしょ。 Core i5だってリアル4コアになって久しいわけで。 どうやったって6コア以上はないだろうし 逆に4コア勝負だからこそIntelのコアあたり性能の高さを見せてほしい。 辛勝になりそうだが。
微妙な問題ではある Intelの(U系での)設計思想は少数コアでDVFSを大きく効かせる方向で、 その方が総合的なユーザ体験としても、消費電力としても良好だという判断だったっぽい そしてトランジスタの余裕はiGPUに使うというバランスの取り方だった 次がどうするかだけど、とはいえ15Wの適用領域はだいぶ広がってるから、 スループットが必要なワークロード用には4コア以上の方が効率が良いはずではある あとはTurboBoostの強化でコアを増やしたままうまくバランス取れるかか TBM3のように、ブースト時に特定コアへスケジューリングを固定するようなOSの支援は入れられるはずで、技術的にはできるんだろうけど ただ少数コアのブーストは、メニーコア取れば高クロックで回る良品が確率的に入ってるはずという製造上の前提を利用していると思うので、 その辺がうまく噛み合うのか怪しい気はする
一応TDP15WのCore i*-8xxxUに4コアはラインナップされてますよ 結局8000番台はKabylake-RefreshとCoffeeLakeとCannonLakeが併存する形になりそう。 ソフト屋の大半は既にクライアントPC市場を新規投資の対象とみなしてないから「ノートからマルチスレッド化が加速」なんてことが起こると思うほうが間違いで むしろ35WのTからUに移行して、ビジネスユーザー向けデスクトップPCの容積がどんどん小さくなっていくだけだと思いますね。
>>449 32コアOpteronデュアル機を組むのを楽しみにしてます 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ そんな「馬のツノ」のようなものを仮定するだけ無駄だよ 32コアのOpteronなんてこの世に存在しないんだから noboby knowsを「ノーバディさんが知っている」と訳すかい?
ウィップアタック・トゥ・ゴールデンボール、すなわち こうがんむち
NaplesがMCM構成であることは当時から広く知られていたにも関わらず モノリシックダイだと思いこんでいた情弱です、という自己紹介
論理的じゃないね 32コアは32コア ネイティブとかMCMとか十分条件の後付けとはプログラマーとして恥知らず どのみちAMDを応援する事はBroadwellを超えた時点で条件満たしてるけど
「本当にBroadwellの性能超えたら」 これが条件 「32コアOpteronデュアル機組んでAMDを応援してやるよ」 これが条件を満たしたときの団子の約束
>>454 MCMだって指摘したら数十レスに渡ってIntelスレを荒らした機械翻訳に言ってやれよ >>457 8コアのMCMは32コアではないしOpteronのブランドの製品は二度と出ないと思われるので仮定が成立しない 何の仮定? 「32コアOpteronデュアル機組んでAMDを応援してやるよ」 これがお前の約束
つーか、8コア×4の自称32コアの可能性一番先に指摘してたの俺だったけどな またNUMAの制約で2ソケットが上限になることもね
むしろあの不具合抱えたままEPYCが発売できるかどうかの方が心配だな
Opteronを冠する32コアの製品が市場に存在しないし存在する予定もない。
>>466 仮にそうだと それはすべて守れない約束をした団子の責任 当時の日本AMDの社長はMCMによるデュアルコアをマイクロプロセッサではなくロバ(donkey)だと言ったね
>>467 誰に対して約束した? 存在しない状態が2年続けば時効成立だよ >>469 そのくせ過去10年のAMDer(一部)の誤謬はネタにし続ける団子であった MCMだから32コアじゃないっ言い張る人にAre you native?をネタにする権利はないと思う しかもEpycであってOpteronじゃないというのも見苦しい Are you native?ってAMDがMCMを馬鹿にしたからこそ 同様にAMDのMCMもまた紛い物と言ってるだけなんだがな
>>472 一度傷物になったブランドを二度と使わないAMDという企業の性格ももちろん知ってるから 団子がdualEPYC環境IYHということでここは一つ
AMDは、7nmになってもGFの歩留まり悪くて8C/ダイのままだったりしないかね。 意地になって6ダイMCMの48C/12chとか。
AMD「想定外のバグの修正で会計年度末のビリオンが足りない」
発想が違う 200mm2程度のダイだと歩留まりと性能のバランスが非常にいい Infinityが高性能だからMCM接続でもネイティブビッグダイ並の性能が出せる この2つの要素があるから、ビッグダイなんて高コストで低歩留まりなものを作る必要が無くなった 7nmだと1CCXが6コアで、1ダイが12コア、4MCMで48コアになるんじゃないかな
>>483 7nm世代のAPUが4コアのままらしいからCCX3個12コアだと思う。 CCX3個とかバランス悪すぎるから、2CCXの8コアのままだろう ただ、7nmだと8コアダイは150mm2以下になりそうだから、それを6個 MCMで繋げて48コアにすると思う
3nmの製品が出るのは何年後? 10nm世代と比べてどのていど性能UPしてる?
>>486 ccNUMAプロトコルでCPU番号が3ビットで表現されてる以上同一ノードに置けるダイは8個までだ デュアルCPU構成不可能になるけどいいの? >>488 8ダイ乗せればおまえがこれから買うEPYC32コアデュアルとコア数一緒だから 問題ないだろ 俺は32コアのOpteronを買うと宣言したがEPYCはOpteronでは無いから購入対象では無いな
>>488 NUMA構成の実態を隠蔽してNUMAチューニングできない状態にして回避とかw 48C/96Tを1 NUMAノードにするとプロセッサグループの制限に掛かるから、2ダイを 1 NUMAノードに見せるとか。 ※各社必死なんだろうけど、次世代プロセスの立ち上がりがどうなるか見ものだね。 複数MCMしていてもCPUとしては1つと認識させるだろ
ちなみに、4C/CCXの3CCX/ダイの48CでないとSP3使えないし2ソケも問題ある。 次で48Cやるなら、7nmじゃなくてGFの14nm+かね。TDPは何Wになるんだろ。 >>492 ソケットは実態通り見せても問題ないだろうね。でもNUMAノードはそれは別。 一度傷物になったブランドをAMDが使わないという想定の下に あの宣言をしたのであれば卑怯で不誠実であると思わざるを得ない。 まあOpteronくらいならまた出てきそうな気はするけどね。
>>470 忘れた頃にElbrusの話題は出てくるが 何の命令セットだっけかと思ってしまう。 x86サーバ市場では9割以上が2S以下の製品 サーバ市場に再参入するAMDとしてはまずこの市場で地歩を固める必要がある しかもなるべくお金を使わない方法で 今のやり方は、1種類のダイを作り続けるだけで、デスクトップから2Sサーバまで 多数のSKUを出せる非常に現実的なアプローチだな
>>490 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ そもそも、2ソケXeonは、ダイまたぎどころかソケットまたぎの通信があるわけだから、 2ソケXeonを1ソケEPYCにすると、ソケットまたぎの通信がなくなるわけだが
AppleのA10XのCPUが高性能で一番注目されてよいはず もはやIntel Coreをも追い越す化け物
Purleyプラットフォームが1ダイあたり8〜16コアどまりでかつUPIの帯域がIFよりせまいならその仮定もまあわかるのだが現実世界の実装では最大28コア(特定顧客向けには最大32コア)までは内部ファブリックで高速につながったモノリシック構造なわけだから比較が成立しないね
やたら最強対決させたがってるけど 実際は値段が安いんだから 値段差考慮に入れなければならない それも現行のXeon-E5の最強構成とEPYCの比較ではEPYCの方が1.5倍高速なのな でも実際は値段を考えれば格下のXeonの方が比較相手でなければならないのだよ Xeonの14コア対EPYCの32コアが比較として妥当だと思う 性能差はXeon最強構成よりさらに開くわけでまぁ2倍位は性能差あるんじゃないか?
クリエイター気取りが 「誰もやらなかった事に挑戦する」とほざくが 大抵それは「先人が思いついたけどあえてやらなかった」ことだ
>>502 実性能が伴うかはともかくとしてより多くのピン引き出すことになる以上Xeonよりもマザボが高コスト化することは避けられないから「値段が安い」は成立しないだろう >>504 マザーボードメーカーが1社なら競走無くて高いかも知れないけど複数社あるから競走が働く それにSoCになってるからチップセットいらない分安く出来るんだよ 多くのサーバの利用方法では、EPYCのダイまたぎ通信はボトルネックとならない むしろEPYCでコストパフォーマンスがよくなる結果をもたらす 一部のダイまたぎ通信がボトルネックになるようなアプリをつかってる顧客のみXeon使えばいい
「2ソケットの16コアBroadwell-Xeonに対して1ソケットの32コアEPYCは十分な対抗になりうるだろう」みたいなこと書いてるけど同じソケット数ならEPYCのほうが高価ってことだよねっていう それ足回り強化されたSkylakeでも同じこと言えるの、としか
>>506 GoogleやAmazonやFacebookの大手を除いた1割以下の市場のそのまた中小規模のシステムの共有ホスティングプラン中心の小さなマーケットを母集団にするならあるいはそうだろうね 2ソケの製品が市場を席巻してる現状でMCMのNUMAは性能出ないとか言われてもハァ?としか
ダイまたぎ通信批判するのに、2ソケXeonは批判しない団子 サーバ市場の中心は2ソケXeonで、ダイまたぎどころかソケットまたぎ通信があるのに それにはだんまり
よくわかってんじゃん ダイまたぎがボトルネックになるからこそダイのコア数を増加していってるんだよ SEGVみたいな名前の継ぎ接ぎCPUは、ダイまたぎ通信が8コア単位で発生するから問題なの それどころか同じダイ内でも4コアのクラスタまたぐとオーバーヘッド発生してるみたいだけど
>>507 どこにそう書いてあるのか分からんけどEPYCのPCIeは128レーンでかつ8チャンネルDDR4対応で圧倒してる そこまでSkylakeで足回り強化したなら別にしたで良いけどたいして変わらないなら差は縮まらない 2ソケットで128レーン(ダイあたり16レーン)な x16のGPUを8枚刺したらGPU間通信するたびにNUMA通信が発生するってこと
一般のDPサーバは普通GPUなんて刺さないので関係ないけど
>>514 いや、2ソケットでも1ソケットでも128レーン何だなこれが 2ソケット実現するのはPCIeの128(片方64ずつ)レーンをインフィニティファブリックでつなぐ PCIeがコヒーレントファブリックとなってて無遅延でつながる事になるから64コアの1CPUとしての扱いだから直線的にほぼ2倍の性能を実現する ま、バス帯域飽和してら話にならんがな 最大クロックで動いても1ダイあたり合計51.2GB/sの転送レートじゃさすがにつらたん 「速いFSB」 FacebookやYouTubeまでいかなくともたとえばFateGOあたりで既にバックエンドはDPサーバのクラスタリングじゃ間に合わんぞ
>>518 だから最強対決を望んでる訳では無いっつうのw その分かなり安いんだからその値段で比較相手となるCPUと比較なのだよw 最強CPUより1.5倍高速なのをアピールして実際はそれより下位のクラスを相手にするつまり比較相手より2倍以上の性能差があるのだよってねw しかもEPYCのZenは前座であって本命は翌年登場するZen2なのだよw 10nmプロセスをスキップし7nmプロセスに直接移行し大幅な改良が施されるw 消費電力で言えば何も手を加えなくても65%下げられるし、何も手を加えなくても同じ消費電力なら性能(クロック)は40%引き上げられるし、何も手を加えなくてもダイサイズは半分以下でコスト大幅に削減させるw こっから最強対決のぞむ所だって一気に徹底攻勢に出るかもなw DPサーバが一番売れてるっての、とりあえずバックエンドでもフロントエンドでもそれなりに潰しがきくからってのが大きいんだけどな フロントエンド特化ならXeon E3やDのほうが導入コストもラニングコストも優れることが多く、バックエンドはサービスが巨大になるにつれDPサーバで賄えなくなるのが常でして 汎用サーバだけでどうにか回るならIntelだってAltera買ってないしXilinxとQualcommも提携してねーから
まあそれは、需要がどのくらいあるかだよね。 相手の下セグメントでは足らず、上位セグメントほどは必要ないもの。
AMDがARMサーバ内定して結局失注したFacebook案件だって結局1Pの高密度ブレードというフロントエンド特価型サーバですし Xilinxの試算通り近い将来データセンターのサーバの3割をFPGA搭載サーバ占めるようになる世界において、AMDはどこのポジションにいるのかね XilinxのサイトをAMDでサイト検索すると「もしかして: AND」の状況だと組んでもらえそうにないですけど Trenzaプランの破棄&FPGAベンダー無視のHSA財団立ち上げXilinxにもArteraにも煮え湯飲ませたのはAMDですし
昨今のシステムベンダーは「つぶしのきく万能のDPサーバ」をオンプレ運用ではなくAWS,Azure,GCPなどのクラウド大手に求めてて、結局そこはXeonが大半を支配してるから AMD担当者のいうとおり「シェア2桁%なら大成功」(=悲観的予想では1桁止まり)
今のEPYCは前座に過ぎないからね〜 まぁ0%からの参入だから苦労はするだろう でも世界最大手の基本ソフトを開発してるMicrosoftに採用させてもらってるからサーバーがOSレベルで最適化が面白い位に進む 本命のZen2までの地ならしにちょうど良い
CCX内であればXeonより速い筈 そのためのあの構造でも有る あと、現在のところ恐らくIDFはある意味制限付きだ 32B/clkで全コンポーネントが接続された状態 レイテンシと帯域の測定結果からCCX間のキャッシュは今の所相互に参照のみ 各ポイントが目一杯使える様に確保したと考える方が素直 メモリアクセスレイテンシがデカいのはIDFを通る故に仕方ないが、恐らくリモートパッケージダイも同じ帯域/レイテンシでアクセス出来る筈 問題はリモートダイキャッシュの参照だけど、コレも何かありそうだ
どこの並列世界の話か知らんが現実世界の実際のMicrosoftはQualcommと組んでARMをクライアント・サーバ共にx86に代わる選択肢として育てようとしてるわけでして AMD特化の最適化(笑)なんてそんな無駄な工数はMicrosoftの帳簿には、ないない(,,・´∀`・,,)シノ
>>525 Sandraなどのスコア見る限りL1/L2の帯域の時点で実バンド幅がRyzenの4倍あるんだけど何を根拠にしてるの Google先行配備の32コア版Xeon実機と AMDが証拠隠滅したEPYCのベンチリーク ま、MCDRAMオプション対応の時点で内部ファブリックのバンド幅がそれ以上あるのはわかるだろうに 480GB/sを単純に4で割っても120GB/sでRyzenのIFの全帯域の数倍ある
それが何に跳ね返るかもお前ならわかる筈だよ レンジが違う
内部ファブリックの帯域で勝てそうになくなったら話題すり替えかな? 広帯域通信はダイの外に外に出そうとしなければ案外電力ロスはないものだよ。実際EPYCのSP3よりSocketPのほうがピンは少ない
MCDRAMオプション? なんて話は一体どこから来たんだ まあなんか本題ではなさそうだけど
2chのメモリを4人5脚でドライブするなんちゃって8chメモリよりも、マザーボードの実装コスト抑えるために6chに抑えて、帯域が必要なアプリケーションのためにオンパッケージのMCDRAM追加バージョンをオプションで用意するほうが現実的なアプローチだと思うけどね。 Microsoftが肩入れいてるQualcommのネイティヴ24コア/48コアだって6chだ。 なんせ、19インチラック筐体用のでかいボードだ。積層数と面積がコストに跳ね返る。 どうも6chと8chの間にコストの壁がある気がするんだけどな RyzenはクロックジェネレーターとバッファけちるためかメモコンとIFのクロック同期させるようにしたものだからEPYCも数百GBの大容量DRAM積んだ時点でダイ内部/ダイ間通信も遅くなるんだろ ほら、いくらでも欠点が出てくる
まーだわからないか 各々得意分野に舵切っただけの話をここまで飛躍させられるのもまぁ才能か 営業向きだな
>>530 4で割る理由がわからない Knights landingは8チップ搭載だしメモコンも8個あったはずだが >>536 Data FabricのクロックとメモリのクロックはRyzenでは同期してるけどクロックドメイン自体は別っぽいよ EPYCで同期が解除されるのかどかは知らんが あとRyzenのCCX間は32byteの双方向だから1.6GHz動作だと理論的には102GB/s >>538 AMDは4ダイの合計値をカタログスペックに書いてるだけだから、4で割った値を当てはめてみればスペック差がわかるだろって話なんですけど >>537 まあ実際のところここ数ヶ月プログラムよりプレゼン資料書くほうが多くなってるよ 勉強会資料も含めてね >>529 また意味不明なサイトの画像貼ってるわw そのサイト全く参考にならんw そもそも発売前のベンチマークが載るわけがないだろ? 馬鹿なの? 8コアのRyzen1800Xでもシングル4000マルチ20000出るのでフェイクだと思う
団子はXeonのベンチマーク見てRyzenのものだの勘違いして暴れてたしなw 発売前のベンチマークは鵜呑みにしてはいけないよw この頭イカれたバカはたくさん書き込めばいいとか思ってそうw 発売された後のベンチマーク見てみろよ TDP65W同士の消費電力の比較 Core i5-7500無印とRyzen 5 1400 Core i5-7500(3.8GHz)とRyzen 5 1400(3.4GHz)とRyzen 5 1400(3.8GHz)の比較 Cinebench R15 wprime(単位が秒なので短い方がいい) CPU-Z 3DMark Firestrike CPU ゲームやらんけどベンチ (Ryzen 5 1400は本来なら価格的に比較相手はi5-7400なわけだがi5-7500に圧倒してる) >>535 型番にMが付いてるものがあるからMCDRAM付きかもしれないね、くらいの話だったかと ダイ写真からはMCDRAM用のコントローラーやパッドは無いように見えるけどね 写真が加工されてる可能性はあるけど 最上位なんて持ち出さなくとも18コアの4ソケットで十分だな i9とも同じマスクだしiMac Proにも載る普及価格帯のXeonになる EPYCは2ソケットが上限かつ基盤のフットプリントがでかすぎて低価格化が難しいのでバリューレンジのXeon4ソケットサーバに対抗することすらできない
>>546 普及価格帯で最上位の18コアPCIe40レーンで4チャンネルDDR4-2400動作のi9? 32コア128レーンに8チャンネルDDR4-3200動作のEPYCとは比較相手間違ってねえか? 4ソケットの時点で話しにならんな 4ソケットの市場は今回まったく関係ない 4ソケットのCPU以外のコストと、EPYCのCPU以外のコストとか比べるのも馬鹿らしいくらいEPYCの方が安いだろうな
Project Olympusで規格化されてた気がするので、MSは使うのかもしれない(実際に採用するとしてどれぐらいの規模がはまた別だけど) ARMサーバとかにも投資してるっぽいし多様化させようとする意図は分かる
大手が本格的に試験してたらsegvバグ?は見つかってただろという気もするので、矛盾しているようにも感じるが まあ実際に修正作業中なのかも分からん。情報があまりないからだいぶ不透明感ある
4ソケットがダメな理由なんてないけどな 4ソケットと2ソケットの価格差を破壊したのはAMDだ AMDが参戦できない市場はノーカンとかそれこそわけがわからない 8chといっても2chの4人5脚である以上4chの4ソケットで十分な当て馬になる
カーネルビルドで出るとか、サンプルをテストした初日で見つかりそうなエラーだよな
twitterでは冷却部即っぽいことも書かれてたが・・
>>553 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 分かってないな インフィニティファブリックは無遅延なのだよ メモリー速度によって性能が向上する 4人5脚じゃなくて8チャンネルは全てのパフォーマンスに影響を与える 64コアだろうが1コアだろうが8チャンネルの大域が使えるってことだ
一人褒め殺ししたいとしか思えない人がいる ともあれHPCほど依存性のある処理ばかりにはならないだろうし Infinity fabricでちゃんと性能でるところを見たいね。
最高クロックで駆動してもInfinityFabricのコントローラの、1ダイあたりのバンド幅が51.2GB/sしかないのに全chのメモリトラフィックがあつめられると豪語する謎
>>559 かといってテンソるにはSIMD性能足りないしWebのフロントエンドくらいしかな… 開発者にも原因不明のSEGVで突然落ちても困るんで基幹業務とは関係ない用途で模索するしか
確たる証拠もないのにSkylake-SPに480GB/sものMCDRAMが搭載されると信じ込む謎
ARM版Windows 10のx86エミュレーションがIntelの特許を侵害してるというが Pentium3のSSEまでの特許は切れてるはず SSE2は微妙か SSE2まで使えれば、たいていのアプリは動作しそうだけど、どうなのかな?
ARM版Windows 10でx64のエミュレーションも将来的に可能になるようだけど AMD64に関してはAMDのものだし、どうなるんだろうか?
REXプリフィックスを一つ追加しただけの同人命令セットがオリジナルに採用されただけで全権掌握とは笑止 ファーストガンダムは福井作品っていうくらいの横暴
オリジナルのブログ記事を見る限りx86関連のパテント数が(買い上げたものも含め)ここ数年で激増してるので、何かしら触れるものがある可能性は否定できないね
>>567 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 革新的パッケージング技術だけで性能を40〜80%も向上させられる!!?
>>564 Windows10でSSE2まで必須化されてるっぽい。 >>572 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ いわゆるPentium特許が切れると言われた2015年にはIntelの資料によると過去最大級の関連特許が出願されてます Aの特許が切れるならAの実現方法と不可分なBを取得する、あるいはモダンな実現方法に置き換えるといったやり方で実質的に特許の延命はできる どちらにせよあれだけ脱Windowsみたいな活動しておいて Windowsが脱Intel始めたらこういう事言い始めるIntelは さすがパラノイアだなぁという気がする。 ARMのx86互換はライブラリとか移植してるんだろうけど 中核部分はエミュ(コードモーフィング)だろうし。
>>576 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>577 Intelはx86のAndroidでARMのエミュレーションしてたのにな ARMによるx86のエミュレーションが問題なら あれも、問題ありってなるのでは? もう、x86のAndroidでARMのエミュレーションはできなくなるかも そうなると、x86Androidは完全に死ぬわけだ あれJavaとか使ってるんじゃないの? 古くはFX32!とかあったし中国ではx86CMS搭載MIPSとかあるそうだし Intel戦うならもっと別の敵がいるんじゃないかね。
>>580 http://pc.watch.impress.co.jp/docs/column/ubiq/616841.html x86版Androidに標準で搭載されているHoudini Binary Translator その秘密は、x86版のAndroidに標準で搭載され、 Intelの内部コードネームで「Houdini Binary Translator」 と呼ばれるバイナリ変換ソフトウェアが、 NDKで作られたARMバイナリをx86に変換しながら実行していく。 このため、仮にARM版のバイナリしか持っていないアプリケーションが実行されたとしても、 x86版のAndroidで実行できるのだ。 Intelによれば、このバイナリ変換を利用することで、 ARM版NDKで書かれたソフトウェアの90%をx86版Androidで実行できるという。 Intelは、ARMアーキテクチャライセンスを持っている
守備の時セカンドボール拾われすぎなんだよなぁ ボランチのポジショニングが問題なんだろうけど
IoT向けSoCがARMに対抗し排除するどころかBluetoothモジュールにCortex-mを普通に載せてる
間違っちゃならんのは今回も競争相手はARMだが ケンカの相手はMSだということだ MSは自社の戦略曲げないだろうし、 どうにかしてライセンス回避してエミュやるか、 主要サードパーティに働きかけてARMバイナリ作るだろう。
>>588 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ Apple A*とかいう単コア性能が飛び抜けたオーパーツがあるが、あれが4GHzで駆動するわけじゃないし実際そうできない何かの壁が存在すると思ってる、あるいはIntelと不可侵条約でも結んでるかもしれないね。 そうであるにしろないにしろAppleが現状AシリーズベースのMacを作る気がなくてかつ他社に外販する気もない事実はある。 Intelが想定する最悪のシナリオはQualcommがApple Aシリーズ並みのIPCの高性能チップ提げてクライアントPC市場に殴り込み、更に同コアを横展開したサーバ製品でx86市場を侵食していくことだろう x86依存から脱却したいMSはそれを望んでいるということ
>>591 ARMとx86ライセンス両方持ってるAMDに頼むのが一番楽だな 該当のエミュレーションの特許がクロスライセンス適用外ならAMDが提訴されるだけだと思いますけど
>>595 ARMバイナリ作る話に関して言ってるならAMDが出て来る幕はない。 リコンパイルする許可をもらって ストアを使ってx86版ソフトを持ってる人に配信すればいい。 エミュする事に関して言ってるならAMDを吸収する必要あるだろ。 Intelと法廷闘争する材料でしかないのでプロセッサビジネスからは撤退か。 まあ追加材料などなしに法廷闘争でMSが鮮やかに勝つ、というシナリオもありうる。 知的所有権的に有利なのはIntelだけど慣例的にエミュとか許容されて来たので。
クロスライセンスの有利な条件引き出して終わりな気がしますけど 互いにやることを制限するよりは交渉のカードに使って互いに利益になる提案したほうが建設的ですよ
そもそもTransmetaとの訴訟合戦はIntelの方が和解金支払って調停してるので、エミュレーションに対する訴訟で文字通りIntelが勝った判例は無いです」 LongRunに対する賠償金の減額には成功したことになるかもしれないがね。
団子はマジでクズだな 散々ARM批判してたくせに何言ってんだか Intelと心中しろよ
わりと早くwindowsとx86の価値が下がってるよね
Windowsが自壊していってるからな Intelも組織的にあれな感じで今後の商品力があやしい
ios11でdocの追加やファイル操作が可能になるのは ノート意識してんのかな
>>605 MACは素直にAMDと共同でZenのカスタムAPU作ってもらえばいいのにw しかし、団子もApple A*のCPU(Cycloneとか)が高性能って認めてんだな >>600 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ まあIcestormから、Apple AのCPU性能は偏りがありそうだなと思うがね
>>592 去年はなんだったっけ? 神威がHPLトップとったのは覚えてる そもそも環境庁更新してるのかね 11月はなんかありそうだけど
これから俺はDELL男を最大限にサポートすることに決めた
>>612 技術的なというのはよく分からんが 多分実アプリでの性能報告は行われるんじゃね 中国がとくにチューニングもせずに適当に走らせてベンチで世界トップとった ↓ 日本が京でカリカリにチューニングしてベンチで世界トップ取り返した ってなったのがあるから、多分中国はチューニングしてベンチで世界トップを奪還するのでは? 中国がチューニングして再びベンチで世界一奪還(予想)
DELL男スレのDELL男というのが見込みがあるので私の弟子にしようと思う
>>618 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 11月のtop500にはvolta更新組が入るかな
>>617 神威なら最適化はありうるけど、天河なら多分ない 富士通は自分等でやらなきゃならなかったのが更新になったのだし VoltaってIBMのCPUとの組み合わせでNVLINKって奴になるとか言うモノ 現状サーバーのシェアはIntelが99%らしいからソレは難しいのでは?
voltaってV100か お値段どれくらいするんだろうか
入るわけ無いだろ 細々と少しずつしか出荷出来ないんだぞ
今のところHPCGからみるに、Phiは良さげ 5000ノード以上稼働可能なのはでかい
景気良く8192ノードとか16384ノードとか逝きましょうや 最近intelは半端な数字好きだね
MCDRAMはどこに繋がるんですかねぇ 積層メモリに関しては逆伸過ぎるでしょ
>>631 余りに逆神過ぎて吹いた あいつの言った真逆やっとけば失敗は無いって事だな あいつがAtomコアは必要と力説してるから Intelのフロムスクラッチの新コアはCoreとAtomを統合するものになるな。
>>633 当たり前の流れだな 態々儲からない苦手なモノ作ってる暇があったら儲かる得意分野に集中するだろJK Intel メッシュインターコネクト AMD 多段クロスバー? どっちもどんなメリットがあるのか分からんけど方向性違う2社を見るのは楽しみだ
>>635 AMDのは、汎用統一バスだよ 何でもかんでもInfinity Fabricを使う CCXの内部も、CCX間も、CPU-GPU間も、ダイ間も、ソケット間も、全部IFを使う >>635 AMDのは全接続(FC)で4c/CCXにしたのをバスに繋いで、それを1個のダイでノードとしてまた4個FC接続する方式 2ソケットになるとまだどうなるかわからん この場合一応バス/FC複合トポロジかと 余談だけどAMDが買収したSeaMicroって会社はFreedomFabricっつー「メッシュ」でスパコンやら組んでた会社 偶然だろうか? >>635 HPCのネットワークトポロジと同じ。 多段クロスバーはFBB-FTに近くてメッシュはそのままメッシュ。 規模拡張はメッシュの方が断然やりやすい。 なんか話聞いてると思想は両者近いものがありそうだな 力点の置き方で実装が違うものになっているけど。
単段クロスバーで配線だらけのチップでいいよ トランジスタより配線のほうが多い感じの
Infinity Fabricは、実際にはDataFabricとControlFabricに分かれている 団子はもっともふうなことを言って適当な嘘をついてるだけだからな ただのペテン師
てか東工大のTUSUBAME更新されるのね Pascal載せちゃうらしい
Omni-Path経由でNV-Linkパケットをノードまたいで送受信できる 俺が思いついた通りの構成だな
>>648 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>650 Ryzenが高すぎて買えないって事は、 団子も無職大貧民なんだな。 こんかいtsubame3.0がgreen500の1位かな
pezyは2つあったけど radeonつかfireproはひとつしかなかったが
CASCADE LAKEを待つスレに変わってしまったか? どうせならThreadripper行くか? 最上位でも半端なく安いし効率が良いらしい 今回やられたのは水面下で開発が進行してたCPUの天才ジムケラーと言う人物1人にやられたのだよ
爆熱の原因はAVX2/512とL2 1MBだろうから、Cannonlake以降も多分爆熱具合は変わらないと思うよ
メッシュによる発熱と、コア高密度過ぎで熱密度問題もありそ
>>664 せめて現物持ってきてから出たって言ってくれ 多分モデルナンバー変わるんじゃ無い? green500でPEZY-SC2が7位に食い込んでるが ベスト10の9システムがP100で埋まってるのは予想外 P100 がそんなに強いとは思ってなかった
そらHPLじゃそうなるんじゃね? 俺は逆にHPCGでのベクトル計算機の驚異的なワッパの方にびびったけど
>>658 電力バカ喰いで爆熱だけのSkylake-X終わったな。 14++のCoffeelake 6コアに期待するか。 >>671 逆に14もしくは16nmでFXを作ったらどうなるかは気になるな。 性能はあまり変わらないだろうが、どの程度TDPは下がるのだろうか? >>672 ダイ全部で8CがzenのCCXx2くらいに収まって、TDPは半分くらい 性能はあまり変わらない あんまり面白く無いプロセッサだな >>661 団子がキチガイジになるワードてんこ盛りだなw 後発のP100に採用件数で追い抜かれるはSkyLake-SPにワッパで負けるはKNLはいい所がないな。
ソフトによってXeon 2ソケットよりも圧倒的に高いパフォーマンス示してるから まあそういう人相手の商品なんじゃね
話題が十年前のIntelとAMDがひっくり返っとるな
programmerに優しいのはIntelしかあり得んからなあ これがただひとつの他のアーキテクチャを駆逐していった理由
>>681 プログラマに優しいという評価があるとしたらいつからだろう。 プログラマに優しいのはIntelじゃなくてMSだろ
その割にプログラマ離れが酷くてMacやLinuxに逃げた層を取り戻そうとAtom派生のエディタ作ってますけど
>>685 90年代半ばからでは PowerPCがゼロレジスタ、3オペランドとかやらせようとしてた時 地球にやさしいプロセサはないのか? 1ゼタフロップスの性能を1ワットで演算できるとか。
脳にエラッタがあっても誰も保証してくれないのに比べればIntelもAMDも神サポート()
かつてLinpack番長っていわれたGPUが、いまやLinpack番長じゃなくなってきてるからね コスト当たりの性能ならGPU勢はすごく強い
GPU勢がLinpack番長じゃなくなりあらゆる演算が高速化したのは、NVLinkのおかげだろうな かつてノード間通信が遅い欠点があったGPU勢が、NVLinkの登場で高速低遅延なノード間通信を手に入れて、 Linpack以外の性能が大幅に向上した
コア性能・メモリ帯域・ノード間通信どれも既存の大型スーパーコンピュータの圧勝 ↓ コア性能で汎用PC用CPUが上回る ↓ コア性能・メモリ帯域でGPGPUが既存の大型スーパーコンピュータを上回る ↓ ノード間通信でGPGPUが既存の大型スーパーコンピュータに追いつきつつある GPGPUがNVlinkっていう高速ノード間通信を手に入れたことで、 既存の大型スーパーコンピュータの存在意義が非常に薄くなった 既存の大型スパコンは無駄とかいってる人がいるが、 それが無駄になったのはNVlinkが登場して使われるようになった今年くらいからで、 去年までは無駄ではなかった
最近流行りのGPUのみのノードをInfinibandやOmni-Pathで繋げる方式だと ホストCPUへの依存度が減ってるしね。
日本のIT・コンピュータ系メディアで、NVLinkの凄さをまともにわかってる人、それを記事にしてる人は少ない もっとNVLink特集記事とかバンバンかけばいいのに
>>697 NVLINKのおかげじゃなくて 16FF+のおかげだろ? そらNVIDIAさんも何回もOptimization for HPCGをやってきてるからな それでもまだ京は遠いし、SX-ACEに比べたら全然よ
>>695 Piz DaintはXeonのDPサーバにTesla1枚の構成、GPU非搭載のノードもあり。 単純にHaswell/Broadwell Xeon搭載機としても世界最大なのでGPUがどれだけ寄与してるかは怪しいがな まさか製造プロセス出されるとは思わなかったもんでね HPCGベンチにP100のシステムは去年11月から存在してるので 何らかの最適化が進んだと見るべきなんじゃないの 普通
そりゃあ初期の頃はドライバーが貧弱で最適化が進めば性能が上がるのは普通だ
top500ので公開されてる総コア数からアクセラレータ分引くと CPU core数は 天河2 :384000 Piz Daint:63840 トータル 天河2 :3120000 Piz Daint: 361760 アクセラレータ 天河2 :2736000 Piz Daint: 297920
NVlinkを少し調べてみた GPU間の高速通信(PCIe3.0の2.5倍、20GB/s+20GB/s) Power9だけとのCPUコヒーレントリンク GPUの制御にはPCIe必須 ソフトの最適化はハードの性能を極限まで引き出すことだがハードの制約は超えられない 制約を打ち破るにはハードの改良しかないってことさ
>>710 Xeon 3192基 P100 5392基 これはXeonの寄与がかなりでかいと思われ AMDのVegaやNaviはHBCCって機能でSSDやHDDを巨大なキャッシュとして扱うことが出来るらしい その結果8k動画編集や、大規模なレイトレやレンダリングや光源処理が高速に行えるとのこと GPUがメインメモリやストレージ系を含めた広大なメモリ空間を直接扱えることに将来性があるように思える まあP100を、KNLとHPCで使うアプリとの比較を見せないことから 概ね察せるけれど
>>718 お、これか Xeon搭載クラスタとしても世界トップクラスじゃねえか EPYC1ソケット VS Xeon 2ソケット SPECint_rate_base2006でXeon2ソケットを100%としたらどうなったかw 製造プロセスで勝ててるのに何負けてんだかw 来年は製造プロセスで逆転されるんだぞw >>718 top500 82位のPiz Daint Multicoreと合計してる? HPCGの登録はCray XC50 Piz Daint:Cray XC50 Piz Daint Multicore:Cray XC40 EPYCのスペックと筆者予想価格 PCIe3.0の128レーンとDDR4の8チャンネルと1000ドルで24コア48スレッドってw この前のi9-7900Xと比較するとPCIe3.0の40レーンとDDR4の4チャンネルと1000ドルで10コア20スレッドだろw 14nm+使っても前座に負けてんのかw >>718 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>722 いやそれでもXeon 5320基もあるじゃん 天河2はその5倍くらいありますけど phiをいれればさらに
そうなのか じゃあなぜ、いまだにGPUてあんなに実行性能出ないんだろ AOの計算をさせたら、高速通信を謳ってるTSUBAMEでも10%程度であれ?てなった ちなCPUだとその倍近いノードでも60%までいく
>>727 実行性能高かったら爆熱で溶けるんじゃね 実は本当にベンチのために最適化しまくってたのは NVIDIAの方だったというオチな予感
天河2号のインターコネクトはAriesよりずっと低速だし、ましてノード数が多いとなればホップ数が増大するぶん実行性能比はさらに不利になる 足回りの性能が悪いのまでCPUが尻を拭くことはできんよ
F1カーは悪天候下では最高60km/h程度まで落として走る 特定の用途にスペシャルチューンした機体がそもそも万能であるはずがない、ってだけ 向いた用途で速いならそれでいいだろ。 費用対効果次第ではあるが
クソコテがまたトンチンカンな喩え出してんな 知りもしないF1の話を喩えで出すなよ 実は専門知識もない事がバレてんだけどさ Intelスレに引きこもってろ
HPCGはコア数或いはノード数が増えれば増えるほど、スコアの伸びが悪くなる…基本的には だからコア数(ノード数)がこんだけあるのに云々てのは、的外れというかなんというか
団子はintelスレで7900Xの爆熱メッシュバスの擁護でもしてろよw あ、それとEPYC32コア発表されたんで貯金しとけよ たぶん200万くらいで足りると思うぞよかったな
専門家ならryzenのコンパイルエラーの原因究明してこいよ 好きなだけ貶せるぞ
>>727 メモリコピーの遅さとメモリ量が少ないからな CPUから一々必要なデータをアドレス変換して貰ってるから、その分の時間がネックになってしまう それを解消するのがNVlinkだけどPower8/9専用でXeonでは使えない メモリ量もCPUでもXeon級だと数百GB使える上に仮想アドレスでほぼ無限大の空間を扱える けどGPUだと最大でも32GB程度のビデオメモリしか使えない(P100は16GB) まあPCIeが必須な限りは、どんな高速インターコネクトでも厳しいと思うけどね IBMがHSW-2S K80x4 vs POWER8-2S P100x4というかなり小規模な構成でいくつかのソフトを比較してたが おそらくないよりかはあった方がマシなんだろうな、という程度だった
OpenCAPIがあるじゃんIntelハブられてるけどAMDいるぞ
あの比較、CPU部は下手すると何も寄与してないのではと思ってた XeonもPOWERも関係なくねっていう
小規模だと無意味だろうな ビッグデータ解析とかデータセンターやゲームクラウドみたいな大規模で大量のデータ処理で威力発揮するもんだろ
>>742 そもそもCAPIはOpenPOWER固有のCPU間通信プロトコルなのになんでIntelが絡む必要あるのよ Powerサーバに刺すようなアクセラレータならIntelは作ってないぞ PS4版マリオなみに意味不明 それとGPUで気にくわんのはコードが膨大だわ、継続性がないわと て、このことは中島さんはじめ指摘してたことなので 今更感もある人も、このスレでは多いだろうけど
まあ、あれはあれでPhiより大きな市場を確立してるからその顧客のためにやるでしょ 逆にソフトの整備もろくにできないとこがGPGPUやる意味あるのって思うけど(どことは言わない)
なんだかんだPhiは筋がよいと思うけどな Xeonよりかは煩雑だが、GPUより遥かにマシだから
GPGPUの問題点 http://ascii.jp/elem/000/001/039/1039493/ ・基本的な演算しか早くない GPUは加算や乗算などの基本的な演算がメインで、三角関数や指数/対数などは数少ないSFUやライブラリ経由で処理している ・ホスト(CPU)との連携が遅い 遅いPCI Express経由でコヒーレンシも取れない、メモリーコピー必須 ・増大する演算力に対応できるメモリが歩留まり悪いHBMしかない 1つ目は皆んな諦めてる、基本演算に特化することでの高性能だから、汎用性を高めて低性能化は避けたい 2つ目はNVlink、QPI/Omnipathで解決しようとしている、AMDは近接はInfinityFabricと外部は別のバスを用意してそう 3つ目はAMDの頑張り次第 >>748 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 現実はこんなもん このメンツがSEGV知らないとか無視するとかありえないだろ 機械翻訳はネイティヴ32コアを出すと宣言したんだからその落とし前つけろや
Opteronの名前はAMDのサーバ向けCPUの代名詞として広く認識されていた EPYCだからOpteronじゃないという言い訳は一般認識と著しき乖離しており妥当性は認められない
intelだってニコイチ出してたろ いいから早くEPYC注文してこい ついでに7900Xも買い支えてやれ intel大好きなおまえにぴったりのゴミだ
>>758 その代名詞を汚点であるが如く棄てた会社どこだっけ? ブランドを大事にしない会社だな Pentiumを安物の代名詞にした会社もありますね
intelはPentiumの名前にひどいことしたよね
許すか許されないか以前にお前に許しを乞う義理もないわ 1ファンボーイ風情が思い上がるな
>>761 ブランド力があるからこそアジアやアフリカの発展途上国市場を中心に消費者が書いやすい値段で展開してるんだが どの面下げて、こんなに偉そうな事が言えるんだろうね 自己管理能力の無い人間が、偉そうにモノを語る程 滑稽で、可笑しな事も無いけどね(笑)
OpenPowerってバカかこいつw PCIeの代わりの使い方だぞw
団子は一体何と戦ってるんだろうか 最早自分でも分けわからなくなって収集つかなくなっているんだろうな
Skylake Xeonってそんなにflops出るんだっけ? 2Sで追いつくかどうかぐらいなのかなと思ってたけど
>>750 ん? 今はCPUでも超越関数の計算は四則演算の組み合わせでやるのが普通だぞ あ、すまんすまん 「高階関数」だったな団子さんwww
>>764 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>765 自己管理能力(笑)のお手本を拝見しようか >>767 なにが代わりなの? CAPIをサポートするホストCPUがPOWERしか存在しないんだが他にサポートするCPUがあるとでも 事実IBM以外のメンバーがアクセラレータとメモリのベンダーくらいしか存在しないんだが >>776 は? PCIe 4.0以降で使えるようになる予定なのに Zen2が対応するに決まってんじゃん >>736 なあにハンダにしたらちょちょいのちょいよ >>418 何それ? これであってる? EPYC 7601と最強のXeon E5 2699A V4で比較すると 「Xeon E5-2699A V4」に比べて整数演算(SPECint_rate_base2006)性能で最大47%も上回り 浮動小数点演算演算 (SPECfp_rate_base2006)性能では75%も上回るとのこと。 SPECint_rateは、たぶん得意な部類じゃないかな gcc -O2ってのは気にならないでもない、というか正直怪しいけど…… SPECpowerやSPECjvmはどんなもんだろうか
32コア、8chメモリ、PCIe 128レーン、チップセット不要 シングル性能以外が豪華すぎ Intelがコレに追いつく頃には7nm 48コアになってるという
面白いとすると、1Sで大量IOみたいな使い方かなあ。いわゆるマイクロサーバの亜種か
GFの7nmは低クロックなモバイル向けじゃなく高クロックなハイパフォーマンス向けとのこと モバイル向けで4GhzなZenがZen2でどこまでクロック上げてくるか見もの
EPYCはXEONにボリュームゾーンで対抗できる経済的合理性がある AMDが水面から顔出してくれて本当に良かった
>>781 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 8ソケットぶんのリソースぶち込んで2ソケットサーバでっち上げたんだから逆にこのくらいのスコア出さないとね そして、同じコア数じゃ対抗できない
>>787 まだチップセット不要とか池沼発言してんのか サウスブリッジの一部機能をCPU側にも持ってきただけで依然サウスブリッジ必要だろ 特にUSBとかCPU側にバグあったしな 相手にされないと寂しいからこっちに来てんのかな? アンチAMDスレを作ってそっちでやってくれ
団子早く消えないかな… 最近こいつの自己弁護でスレ埋まってばっかり
>>796 USBのバグはB2ステッピングで修正されるのでは? 思ったよりベンダーの支持が集まっていてぐぬぬ状態なのだろう
皆んなintelのボッタクリと横暴さに辟易してたんだろうね やっとAMDが追いついてくれたからこぞって群がってきてそう
>>803 はよ 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>804 品質が追いついてないみたいだけど大丈夫? なお当局はこの事実をいまだ認知しない模様 https://srad.jp/submission/71785/ > call命令を起点にインストラクションポインタから64バイト > 手前にある命令を実行してしまう現象を確認したそうだ。 > この現象の結果、ズレた位置にある命令が不正なアドレス > にアクセスしセグメンテーション違反や一般保護違反が起 > こっていたらしい。64バイトはキャッシュラインサイズ > と一致しており、命令デコーダかL1命令キャッシュ、ある > いはRyzenで新設されたμOPキャッシュ辺りに問題があ > る可能性が高く、Twitterではマイクロコードの更新で直 > るのか疑問視する意見もあった。 団子は当然32コアEPYC買うんだよな? opteronって名称じゃないから買わないとかアホな言い訳はしないよな?
>>656 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ IntelやIBM,Qualcommのサーバに求められるのはただ一つだけ 「命令ポインタの計算ミスするような間抜けなバグを出さないこと」 それだけでサーバで成功する。
>>807 そんな罰ゲーム知らねーよ 仮に99%OFFで売っててもうな重食うわ >>806 リコールするなら早くしないと性能以前に会社としての信頼に関わるだろ。 AMDに退場されたら困るぞ。 >>812 敢えて言うなら自分にだな。 お前には自尊心の概念が無さそうだが これ、日本人なら普通に恥ずかしいから。 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 偶発であれなんであれ誤ったジャンプ先が64バイト前のアドレスってわかってるなら、そこにコード仕込んでおけばexploitとして使えるよな JavaScript処理系をターゲットにした命令ポインタずらし攻撃が割と現実的になるかもな
飛び先が何個あると思ってんだか それとも毎回同じ場所なのか?
サイボウズラボ竹迫氏の論文で提唱された攻撃手段は、JITがバグでジャンプ先アドレスの計算を間違える必要があるんだけど、CPUがそれを提供してるなら応用できる可能性があるんよ x86 JITコンパイラ上で任意コードを実行する方法 竹迫良範 著
>>817 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>817 ジャンプ先のアドレスを間違うんじゃなくて、ジャンプ先のアドレスのデータを間違うんでしょ >>821 バーカwwwww 日本語くらい正しく読めよ > call命令を起点にインストラクションポインタから64バイト > 手前にある命令を実行してしまう現象を確認したそうだ。 日本語を正しく読むと団子はEPYC32コアで組まなけりゃならなくなるなw
>>824 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 団子が深刻だということは大した問題じゃないということだな
>>826 逆神としてはとんでもなく優秀だからな あり得る >>826 だってGoogleもAWSもAMDは採用しないしAzureもXeon選べるからな Dropboxはデータ吹っ飛ぶかもしれないから退避の準備しておけばいいしな >>822 アドレス計算を間違うなんてどこにも書いてない 普通に考えれば、 命令ポインタの64バイト手前のデータが64バイト後ろのデータとして実行される という可能性の方がはるかに高い 少なくともそういう可能性はある つまり、団子の劣化コピー L1キャッシュが命令とデータで分かれてることすら知らないんだろこのボケ
>>830 起きる現象はケースに追加しよう で、発生条件は? >>833 それ解明して対応するのAMDの仕事なんですけどなんで一般のユーザーにさせてるんですかね そこそこ実力あるエンジニアが症状再現できてる時点で個体差の問題超えてる気がしますけど >>834 いやだからコレ発生させて何が起きてるかわかってんならその時の状態を再現すりゃ発生条件特定出来る筈だろが まさかコレでも偶発的っつーんじゃ無いだろうな そこが知りたいわけでメーカ云々は別の問題だろう 全額返金してくれるわけでもないのにそんな無駄な工数かけるかよ 献身したいマゾにやらせとけ、本来AMDがやらないといけない仕事だけどな すくなくとも解決が成されるまではEPYCを使ったシステムインテグレーションを客に提案しないのがITプロとしての対応だろう
団子が騒げば騒ぐほど事態は好転するからもっと騒げばいい
>>836 俺はアーリーアダプタの特権だと考えるがな 発生条件がマチマチだし今んとこ合理的な説明がつかないのも含めてこいつは面白い且つ手強いオモチャだし エンジニアであれば誰しもそこを知りたいと思う筈、職業病でもあるがこの状況下でソレを同定出来るのは、ある種の栄誉でもある 営業側の側面はまた別の話だ どうなるのかどうするのかは乱暴な言い方をすればどうでも良い 俺らには今の所関係のない話だからな、条件不明でついでにまだTRやEPYCのモノが無いからこっちでの検証もできない 待ちだ 8コアマシンが欲しかっただけのエンジニア、さすがに泣いているとは思う まあリスクを取ったということではある。さすがにこんな挙動は想定外だろうけど
団子が騒いでるだけで、まあ1年もしたらあいつが暴れてたのなんだったろて話になる まあIntel肝いりのSkylake-Xが爆熱で無事死亡したから、躍起になってるのかもしらんが
>>840 仕事で使うようなのがコイツ買うか? 8Cとは言え一般向けだぞ まぁそも発生件数があまり多いとは思えんのだが 断片的な話を読む限りだと、 再現率もそんなに低くないし、だいぶ致命的な挙動をしてるし、もし事実ならば深刻なエラッタだと思うけどなあ データ破壊とか起きないのだろうか
>>830 そんなことはどこにも書いてない 64バイト前の命令が実行されていたとしたら辻褄が合うと書いてあるだけだ 「番地の違うキャッシュをなぜか使っちゃってる」とも書いてある >>836 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>843 いや再現率が高い方が特定しやすいから良かったんじゃねえの? 団子は知ったかぶり多すぎだろ 誰もジャンプしてるなんて書いてないのに
>>838 MIPSは見る影もなく、PowerVRもiPhoneで使われなくなると衰退しそう 今後は Apple vs. Qualcomm か >>844 だからキャッシュはデータパス側にしかないと思ってるんかよ L エコシステムに入ってるRedhatやSuseがどういった対応を取るかだなあ 対応カーネルとか作ってる以上今回のエラッタも承知しているはずだし、何らかの反応があるはず
>>851 現象は「64バイト前の命令を実行してたとしたら辻褄が合う」だ ジャンプ先を間違えたとは書いてない あくまで「64バイト前の命令を実行した」だ この可能性が高いと キャッシュに関しても可能性を書いているだけ キャッシュと書いてるからデータのことだという思い込みってひどすぎるだろ L1キャッシュには命令キャッシュとデータキャッシュがあるぞ、ってカタログスペックにも書いてあるだろ ハーバードアーキテクチャなんて基本情報のテキストにも載ってるぞ つまりうちの文系卒新人にも及ばない素人
>>854 お前が間違いで俺が正しい可能性の方がはるかに高い なんで突然データキャッシュの話が? そんなことを言ってるのは団子だけ 当然キャッシュがおかしいとしたら命令キャッシュ、またはL2L3
まず事実として、 「命令のジャンプ先が0x40(64)バイト前のアドレスになってる」 こんなことはどこにも書いてない また、発見者はそう思ってない その証拠が「番地の違うキャッシュをなぜか使っちゃってる」の書き込み
こんな場末の2chの自作板のAMDスレですらないスレでも議論が白熱してるんだよな
CPUの動作をまるで理解してないから、発見者の書き込み内容を理解できない 理解できてないのに知ったかぶってテキトーに劣化コピーして伝える 非常にたちが悪い
指摘させると、全くトンチンカンな>>851 みたいな書き込みをしたあと、>>856 みたいな捨て台詞を吐く これが団子 >>855 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ データを間違えるって主張してるの >>820 こいつだし 誰の再現事例でも命令のジャンプ先アドレスがページ違反だから落ちてるのに 「ジャンプ先のアドレスのデータ」 どうみてもインストラクションデータにしか見えないが
>>829 >>>822 >アドレス計算を間違うなんてどこにも書いてない > >普通に考えれば、 >命令ポインタの64バイト手前のデータが64バイト後ろのデータとして実行される >という可能性の方がはるかに高い >少なくともそういう可能性はある > >つまり、団子の劣化コピー 「データ」に実行属性なんてそもそもデフォルトでついてねーから素人がでしゃばんな >>865 勝手に単語作るなよ 命令とデータは別物 命令のシーケンスはコードと言います。命令列を「データ」なんてよんでるのは基本情報技術者も受からないレベルのお前だけ それでトンチンカンな発言を繰り返してたわけか アドレスを間違えたんじゃなくてデータを間違えた アドレスに対してデータ データの中身が、団子の言う狭義のデータかコードかなんて書いてないし、ジャンプ先のアドレスなんだから当然コードに決まってる
団子がトンチンカンな理由はわかったが、 ジャンプ先を間違ったという根拠はまだかね?
もうちょっとちゃんと書くと、飛び先のアドレス計算を間違ったという根拠
命令=データとかまずそこから知恵遅れ すくなくとも命令キャッシュとデータキャッシュの切り分けが必要な文脈で実行属性の与えられた命令列をデータなんて言わないよ
で、 はじめに戻るが、 ジャンプ先のアドレス計算を間違うの根拠は
馬鹿断固はintelスレで大人しくしてろ:∀`・,,)
命令をデータ扱いする根拠の方が知りたいな 実行属性の与えられてないデータ列をプログラムとして読もうとしてもDEPで殺されるし、逆に命令コードの空間はReadOnlyなのでそのままでは書き込みはできない
もう知恵遅れの2IDをあぼーんしとけば十分だね 命令をデータと呼んでる時点で何も理解できてない素人丸出しだし
今回は大きな思い込みが2個 それによるアホ発言多数
あぼーん連発してるし こいつまじ頭悪いくせにプライド高いな
さすがに、そこらじゅうに書いてる「飛び先を間違う」発言はもうしなくなると思うけど
命令がデータだとするならL1キャッシュが命令キャッシュとデータキャッシュに分かれてる言葉の概念すら否定されますよ
アドレス計算までは正しいけどそれを使う瞬間に不正な値になってるのか?
狭義の「データ」、広義の「データ」が存在することもわからない 明らかに文脈から読み取れるのに
>>892 断定はまだ出来ないが、その可能性が高いと なんか伸びてると思ったら団子と変なのがレスバトルしてた とりまRYZENがバグってるゴミって事は把握した
プログラム上でも命令とデータはコードセクション、データセクションに分かれててプログラムローダが読み出した時にそれぞれの属性つけてメモリ上に展開するんですけどね。 実行中のプログラム上の命令ががデータであるはずがないってのはそういうこと。 そっから理解してたらそんな言葉の間違いは起きないよ すくなくとも理工系のリテラシーがない人間だけ
>>892 発見者は少なくともその可能性が高いと思っている 団子はまだ本題と無関係なトンチンカンな事を書き続けてるが無視する 無関係な主張とその根拠もまたトンチンカン ダブルトンチンカン
>>892 RIPが指してるのは仮想アドレスで、実際はそっから物理アドレスに変換して処理するときに失敗してると見るのが妥当かな すくなくともjmpやcallはデータを読む命令ではない >>893 その文脈で広義の〜なんてトンチンカンな言い訳するのお前くらいしかいないよ 無能哀れwwwww ジャンプ先のアドレス計算を間違う から段々と主張が変わってきたなwww
それにしても団子の勘違いの言い訳が見苦しすぎてwww
自演? 明らかに同一人物的な書き込みだが 別人を装ってるように見えるか? 単に接続先がかわっただけだ 団子が自演するからって他の人も自演すると思うのか トリプル勘違いwww
64バイトずれた命令を実行してそうっていうことまではわかっても、 それ以上はハードウェア的に調査できるAMD以外には無理だろ おれらにできるのは、あれかなこれかなっていっていう推測のみ
どうみても命令コードの飛び先の保護違反で例外が起きてるのにどっかの頭の悪いのが 「データが〜データが〜」って連呼してるから 命令とデータの区別も付いてないバカなの?と思ったが案の定そうだった スラドでも元記事のブログでも命令列のことをデータなんて呼んでいない
>>838 INTELが買わないかな NVIDIAやAMDはタイルレンダリング系の技術を取り込んでるみたいだし手っ取り早く時流に乗るにはいいかと >>906 うん、AMDが調べる気あるのか?ってのが問題だね。 「問題が起きたのなら交換しますよ」とか言ってもみ消そうとしてるけど、sat氏がそれで納得せず焚き付けたがってるわけで… ストレージ用途のサーバならIO待ち時間の方が多いから再現しない可能性もあるからね ただし高負荷が条件かどうかすら断定したことは言えない >>906 完全に無理なわけでもないけど 少なくとも、飛び先とその64バイト前にIPを保存するコードをつければ大きな2つの切り分けは出来る もちろん、発生条件をもっともっと絞った上で 発生条件を絞れば、さらに別の切り分けも出来るかもしれない いろんな人がやってるし、HTやマルチコアは関係ないと言う情報もあるし、もうちょっと絞れるんじゃないかな? >>909 林檎屋が買い叩いて解体のパターンもありだな 64バイト計算を間違う演算器ってどうやったら作れるの
PhaseLockLoopが甘くて同期ズレでIPが飛ぶってのは ランダム発生の説明にはなるな
竹迫論文を英訳して海外の変態どもにシステムを乗っ取るコード書かせるコンテスト開催してみたらいいんじゃね? 文字通りのRyzen Hackathon
つかApple以外の最近の採用例を知りたい ルネサスの車載SoCぐらいしか知らんぞ
クソ団子、古巣のintelスレでも叩きまくられてワロタw∀`・,,) もう居場所ねえなw 自業自得最高です
HelioX30も一応PVRな Appleの世界にAndroidは存在しないので潰しにくるよ
年寄りってのは頭が固くて何も生み出そうとしないくせに 論争の場で話を有利に進めたがることしか考えないのは、人として終わっているとは考えないのかね?
ARMについでImaginationまでもか。 イギリスも大変だな。
>>918 540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21] Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21] 最上位で3万円切るって宣言した俺の発言ログとっとけよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7] リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ そもそもCPUコアの命令とデータの扱い方の違いさえわかってれば論争なんて起きようが無いし それがわからないのは議論に参加する以前の問題なのです
>>923 名前:,,・´∀`・,,)っ-○○○ Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 名前:,,・´∀`・,,)っ-○○○ 最上位で3万円切るって宣言した俺の発言ログとっとけよ 名前:,,・´∀`・,,)っ-○○○ まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 名前:,,・´∀`・,,)っ-○○○ リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 分岐予測とかの絡みで投機的なPCの書き換えが発生するときにdecoded Icacheがズレた番地の命令を吐いちゃうとかそんな感じのエラッタなんだろうか
条件分岐はあんまり関係なくて、保護違反が起きた時の共通の条件としてジャンプ命令(call命令も?)トレースログが止まってて64バイト手前のアドレスを呼んでるらしいとのこと 謎のワークアラウンドのカーネルパッチも結局セグメントの先頭にマージンを64バイト足すことで保護違反を抑制するものだったが、単に緩衝帯を広めに取っただけでしかなく、原理上、暴走そのものを止めるわけではないのよ なぜならセグメントの先頭だけがジャンプ先じゃないからね。 多くの場合はコードセグメントの先頭はnop埋めされてるがコードシーケンスのど真ん中についてはそういうクッションを設けることは難しい。 つまりあれはなんの根本的解決にもならないしむしろSEGV以外の不具合を起こすだけの可能性もあるね さて、話を戻すがx86命令は1〜2バイトずれた命令列を実行するとたまたま別の意味の命令としてしかもたまたま動いちゃうこともある それが竹迫氏の論文で語られてる「JIT処理系の脆弱性の可能性」である 不具合で前提条件の「命令ポインタがずれて実行される」を満たしうる挙動が本件ライゼンバーグ問題で起こりうるとすればこれはセキュリティホールだよ 鉄壁のChromeのJITすら乗っ取れるかもしれないレベル。
>>926 >>923 名前:,,・´∀`・,,)っ-○○○ Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 名前:,,・´∀`・,,)っ-○○○ 最上位で3万円切るって宣言した俺の発言ログとっとけよ 名前:,,・´∀`・,,)っ-○○○ まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 名前:,,・´∀`・,,)っ-○○○ リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ ただripの64バイト手前を実際にコードシーケンスとして実行してるのか、あるいはフェッチするだけに止まってるのかなんてのはもう少し見ないとわからん 問題あるのL1Iじゃねーの?という気がしないでもない
>>926 飛び先のアドレス計算を間違うんじゃなかったの? まあ、SEGVで止まらなかった場合の挙動のエビデンスは必要だな sat氏の言う「リブートした」瞬間に命令ポインタが何を指してたか トレース読む限りはL1DではなくL1I側の問題だから すくなくともデータをロード(笑)ではありえない
64バイト前の命令を実行した根拠が書かれてるんだけど
もうお腹痛いよこれ sat on Twitter: "ちなみにAMDサポートコミュニティSEGVスレッドのメインキャラの一人は某フォーラムで「環境を全部網羅してないと話にならない」とかネチネチ難癖つけられて脱出してきた人です。 難癖つけた人は私の書き込み記録を消した人でもあります。まあなんつうか、アレな人が一部いると大変ですねと" "何十人もの人々が各自ばらばらのハードウェアを使っているのに殆ど/まったく同じ問題を引いていることを考えると、石以外のハードウェアが問題というのは苦しいような気がする"
>>933 俺が個人的に興味持ってるのは64バイト前が本来の命令の頭ではなく別の命令として解釈された場合の挙動だ JITに仕込んで権限昇格レベルの攻撃に使えるなら大炎上確定、ランサムウェア業者はこぞってRyzenをターゲットにしだすぞ 団子アホすぎだろ なんで正常動作前提の機構をかたつてんだ? こいつ絶対まともなプログラム組んだことないだろ
正常動作前提のXeonに大勝利とかも意味ねーからバイバイ
ヒントを教えよう SEGVは即プロセスクラッシュにはならない SEGVに関わらず例外はOSがトラップしてプログラム規定の例外処理に飛ぶ。テーブルに存在しない場合に落ちる。 そういえば数年前に保守任されたクソコードで面白い障害事例を見たな、ファイルオープンに失敗してて例外処理ルーチンで書き込み用のログファイル開くのに失敗しててまたそこから例外起きての無限ループ、最後にはスタック使い果たして死ぬ…腹抱えて笑った思い出あるよ
DropboxがQualcommのサーバCPUあたりにリプレース発表したらおもしろいんだけどAMDファンボーイが逆神すぎて草
EPYC大規模導入予定の会社は、いまごろ裏でAMDに例のバグがEPYCに影響あるのかどうか聞いてるでしょ? AMDもこっそり教えてるかもね ある/ない/あるけど修正予定 とか
>>941 名前:,,・´∀`・,,)っ-○○○ Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 名前:,,・´∀`・,,)っ-○○○ 最上位で3万円切るって宣言した俺の発言ログとっとけよ 名前:,,・´∀`・,,)っ-○○○ まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 名前:,,・´∀`・,,)っ-○○○ リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>946 野郎オブクラッシャー 普通に考えりゃ発生現象からビルドは通っても負荷テストで落ちるわな でもそんなエラー出してたら負荷テスト通らないんじゃないの?
>>946 名前:,,・´∀`・,,)っ-○○○ Zenが高くないと買えない自分を正当化できないもんな 大丈夫だよ、8コア最上位でも3万円切るから お前みたいな無職大貧民には大金だけどな 名前:,,・´∀`・,,)っ-○○○ 最上位で3万円切るって宣言した俺の発言ログとっとけよ 名前:,,・´∀`・,,)っ-○○○ まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 名前:,,・´∀`・,,)っ-○○○ リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ >>949 RyzenでLinuxビルドするとカーネルパニックで起動しないってさ スラドでは分岐予測基の誤作動の可能性もあるって書かれてた
141 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:08:59.13 ID:0Q4rwlJ0 [3/9] ID:uCPi3smPとかID:8BdzvreDでの書き込みが二度と出ないこととZenがクソ性能であることに私は年末ボーナスを賭けてもいいよ 148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9] まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ 149 名前:Socket774[sage] 投稿日:2016/11/14(月) 20:23:19.85 ID:M6UIpUaq [4/4] 大きくでたな 150 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:24:30.79 ID:0Q4rwlJ0 [6/9] 絶対にありえないことは何言ってもありだ 水星が地球に落下してくるレベルのことを言ってるんだぞ 154 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:30:51.54 ID:0Q4rwlJ0 [8/9] > (鼻ホジ これが最高の煽りなんだけどな Atomですら実現してることをやれてなかったんだぞ
>>955 イマイチだな だとすれば同じ処理を回せば同じ所で出る筈だ 負荷テストは通ってgccでSEGVを出しやすいのかは団子先生がEPYC買って解説してくれるはず。
,.::., -― -- :,:、 ,. '’ ゚´ミ'’ }::: ::: ::: :::’ 、 ,≠ / :'’ / , ::: ::: ::: ::: ::: ヽ / / / / / .{::: ::: ::: ::: :::、ヽ\ / , , ' :}!::: ::: :::、::: ::: ::: 。 ,’ , ,’ / /ハ i|リ:::ヽ::: ::: ::: ::: :::: V } / i:, .i , :/ i:I!::i ::: ::: ::: ::: :: :: ::: , i ' ;:, ./,:.i|.//i , ! i::|i: /::,::: :: ::{ ::: , | ;:;: !:///!レ' ノ'//iノハ}/ /ハ人从::: ::: : ,; ! :/, ,: -=一'¨ゝ ,:¨二ニヽミハハ ::: ::: .i| , // ,:イ ,;ィ'-r::ェ=ミヾ〉;':ィ'¨-r;;テミヾ,:' |iヘ :: :: | i !ハ  ̄ ̄¨⌒ ..|:::.:⌒¨¨¨:;:¨::i |:::乂ハ:! ,’ /:i.|! | ,:|::、 ::: ::: ::: :: i::!:|::| | , :l:||:|} r':r:}!、! ::: ::: ::: ::: :ハi:|!:|:: | RyzenごときでIntel製CPUに勝つことはできん! , |:: }| ::!ト;::、::: ::: ::: ハト、! | RyzenとCore I9には致命的な違いがある。それはグリスだ! i i .!:: ト':! ヽ-'⌒^¨ヾ>::: ::: ,’「ハ :, | グリスクこそが殻割りにつながる。NRyzenにはそれがない。 / i. i| ,!::ト! `¨¨¨¨´: ::: :: ::: ,’!{:i :, , _/ ':’ !i .:: ::|: \ "゛゛゛:; ::: ::: /: |’,、, ,ハ v''7⌒’:/ 彡'⌒ ¨ヽ\\ヽ i: ,! | I!丶 ::::;; ::: ::: :イ::: |::: :、 ゜V / 〈,.ィ'’^r
Dropboxが大規模障害だして阿鼻叫喚とかもあるのかもな 正直リスクとれないんで、全部ローカルにバックアップとってGoogleに移行したよ EPYC採用を撤回するまで怖くて仕事でも使えないよ
そんな大事なデータをローカルバックアップしてなかったの!?
発表がない以上は新ステップで直ってる保証はどこにもないからな EPYCでは直ってるがRyzenのリコールが嫌でだんまりを決めこんでる可能性もあるが。 真の悲劇はWindowsの将来の大作ゲームで問題が起きた時かな 一般保護違反落ちとかWindows 3.1のゲームみたい
即値ジャンプでエラー出てるのに分岐予測のわけ無いだろ いい加減にしろ
どうもHW要員くさいな 団子買って試してみてよ 一番安いので良いから
>Zenがクソ性能であることに私は年末ボーナスを賭けてもいいよ >まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ >絶対にありえないことは何言ってもありだ >水星が地球に落下してくるレベルのことを言ってるんだぞ >まあZenはマザー込み3万円で買える予定だから冬の間だけ暖房器具用途にしようかな _>飽きたら中古に流すよ、まあダブついて半分 これどうなった?感想は? AM4とHBM関連で、もう一つ約束事があるみたいだけど その言い訳は通じないのでよろしく
905 名前:Socket774[sage] 投稿日:2017/06/23(金) 20:42:23.31 ID:KE9/Q9Ag 団子はちょっとやり過ぎたね 541 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:50:25.32 ID:ijYX/87D [6/21] まあZenはマザー込み3万円で買える予定だから冬の間だけ暖房器具用途にしようかな 飽きたら中古に流すよ、まあダブついて半分 937 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/19(水) 01:01:14.78 ID:cj5KV656 [4/16] 別にソルダリングのEもあるんですけど消費者が選んでるのがグリスのほうなんですよ 安いが正義なんですよ あとExcavatorを1.4倍しても所詮はApolloLake Pentium並 948 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/19(水) 06:57:31.51 ID:cj5KV656 [6/16] そしてSamsung 14LPPを使った代表的スマホがあの「Galaxy Note 7」という現実 Zenも発火しちゃう? 481 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/24(月) 20:13:25.88 ID:k71cr2Hg [3/17] いくら消費電力改善してもIPCはAtomとどっこいレベルの初代Bulldozerから横ばい そこから1.4倍してもApolloLake並 239 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/11/02(水) 16:35:21.05 ID:Wj3xbZoK [1/9] ゴミカスAMDにはSamsung/GFのFabの良し悪しで選ぶわけではなくそもそも選択権がないんだよ 297 名前:,,・´∀`・,,)っ-○○○@KD106161207190.au-net.ne.jp[sage] 投稿日:2016/11/03(木) 11:41:32.44 ID:0cqaLaHL [5/5] 本当に「See Naples and die.」になりそうだな屑ファンボーイ君たち 909 名前:Socket774[sage] 投稿日:2017/06/23(金) 21:38:49.20 ID:jhb2ky/l [1/2] See Naples and die.フイタ 団子にブーメランぶっ刺さってるw 団子はさっさとSee Naples and buy.
笑笑w EPYC 7601と最強のXeon E5 2699A V4で比較すると 「Xeon E5-2699A V4」に比べて整数演算(SPECint_rate_base2006)性能で最大47%も上回り 浮動小数点演算演算 (SPECfp_rate_base2006)性能では75%も上回るとのこと。 最強Xeonに圧勝してんのにw >>972 エラッタの話題逸らしが見境いなくなってきてる 調査を進めたらかなり深刻な奴だろうしこれ Windowsはエラーを何でもソフト側のバグと利用者が考える土壌だからこれまで問題が浮き彫りになってなかっただけと考えると、今後は地獄絵図かもな >>972 さすがにそれはないな カンガルーのAAが貼りたくなる気はする 何言ってんだこいつ ソースなしでAMD憎しの偏った妄想だけで文句言ってるだけじゃん 散々ソースありで反論されても一向に無視した挙げ句実物が出てもまだ文句言ってるわけで それを同類とか頭おかしいだろ?
>>974 残念ながら実行命令がアレだけ吹っ飛んで無事なOSやアプリケーションは存在しない 窓だろうがなんだろうが派手にエラー起こす、アプリがクラッシュしたりな それより報告者のPCが定格外である可能性が指摘されてたぞ コピペ粘着の度がすぎる感は否めないが 発言の内容は事実だしな そこまでコピペを保存してるなら外部のwikiとかにまとめて置いて欲しい
EPYCデュアルで組んでごめんなさいするまでは、 団子に一切の発言権は認められないから。 intel妄想スレでintelについて妄想する分にはまあ大目に見るとしても、 それ以外のスレでAMDをdisりだしたら、いくらでもコピペ張ってOKよ。
1Pでもメモリ8ch、PCIex16x8本出せるのは強力だな Lenovo、DELL、HPが提案したら古いXEON根こそぎ刈れそう
リリース前に修正不能な重大なバグが発覚したら延期するだろ 今回みたいに広く知れ渡った状態だと致命的なことになりかねん その上での予定通りのリリースなら対策は取られてると思って間違いない
詳細がわからないから延期の判断が出来ない って可能性も
偉い人が知らないって可能性も おま環だと思って報告してないとか
サーバーメーカーも事前検証して把握くらいは当然してるだろう とっくにAMD内だけの問題じゃなくなってる それともサーバーメーカーやRedhatが知らないとでも言うのかな
パフォーマンスでフルボッコにされた団子が 定格以外のもので起こりやすい問題を見つけて、鬼の首とったように騒いでるだけにも見えるが というか彼、ああみえてほんとに何も知らないというのが、よく分かった
知らないのに知ったかぶるから 初心者が信じちゃったりする 本当迷惑
>>977 そういう指摘はあるみたいだけど 報告者はその説を否定してた 水星が地球に落ちてきたら水資源問題解決スルー? マジレス頼む
水星が落ちてきたら人類が滅亡するので今現在人類が直面しているあらゆる問題が無くなる
>>981 Lenovoのサーバの最大顧客はIBM Bluemixだよ 他はAzureが採用してるくらい? 確かに4Pとか8Pのx86サーバも作ってるがそれは2ソケットで既にNUMAノード数8に到達してるEPYCでは物理的に不可能だろう 1-2Pサーバなんて簡単にスケールアップ・スケールダウンできるのが売りだからオンプレ運用と基本相性が悪く 実際クラウド事業者大手だけでXeonの売り上げ大半を占めてる 要するにAWSに採用されないようなレベルでは物理的に無理 >>992 太陽に近すぎてすべての水が蒸発してたはず まあ、逆にBluemixの納入先業者トップはSupermicroなんですけどね Xeonのサーバ向けマザーがOpteronの何十倍もあるのは特注マザーの顧客の数に比例してると考えて差し支えない
>>998 6400万年前に中米に直径10kmの隕石落ちたら、恐竜絶滅したんやで。 それは定説じゃねーよ 破壊神ビルス様の逆鱗に触れたんだぞ
lud20200523043210ca
このスレへの固定リンク: http://5chb.net/r/jisaku/1495257064/ ヒント: 5chスレのurlに
http ://xxxx.5ch
b .net/xxxx のように
b を入れるだけでここでスレ保存、閲覧できます。
TOPへ TOPへ
全掲示板一覧 この掲示板へ 人気スレ |
>50
>100
>200
>300
>500
>1000枚
新着画像 ↓「CPUアーキテクチャについて語れ 36©2ch.net YouTube動画>2本 ->画像>40枚 」 を見た人も見ています:・CPUアーキテクチャについて語れ 35 ・CPUアーキテクチャについて語れ 30 ・CPUアーキテクチャについて語れ 32 ・CPUアーキテクチャについて語れ 39 ・CPUアーキテクチャについて語れ 17 ・CPUアーキテクチャについて語れ 57 ・CPUアーキテクチャについて語れ 48 ・CPUアーキテクチャについて語れ 49 ・CPUアーキテクチャについて語れ 50 ・CPUアーキテクチャについて語れ 40 ・CPUアーキテクチャについて語れ 56 ・CPUアーキテクチャについて語れ 46 ・CPUアーキテクチャについて語れ 44 ・[RISC]CPUアーキテクチャについて語れ![VLIW]2 ・【CPU】AMD、新「Zen 2」アーキテクチャで12コアの「Ryzen 9 3900X」 ・投資オープンチャットについて語れ ・國又について語れ ・貧乏飯について語れ ・貧乏飯について語れ ・netkeibaについて語れ ・西友の弁当について語れ ・残価設定ローンについて語れ ・東邦産業研究所について語れ ・★栃木の山について語れ Part17 ・クリスティアーノ・ロナウドについて語れ ・コテハン「このレス転載禁止」について語るスレ ・AMDの次世代APU/CPU/SoCについて語ろう 312世代 ・AMDの次世代APU/CPU/SoCについて語ろう 306世代 ・AMDの次世代APU/CPU/SoCについて語ろう 307世代 ・AMDの次世代APU/CPU/SoCについて語ろう 304世代 ・AMDの次世代APU/CPU/SoCについて語ろう 301世代 ・AMDの次世代APU/CPU/SoCについて語ろう 311世代 ・AMDの次世代APU/CPU/SoCについて語ろう 313世代 (551) ・Intelの次世代CPU/SoCについて語ろう 81 ・Intelの次世代CPU/SoCについて語ろう 82 ・Intelの次世代CPU/SoCについて語ろう 80 ・AMDの次世代APU/CPU/SoCについて語ろう 246世代 ・AMDの次世代APU/CPU/SoCについて語ろう 285世代 ・AMDの次世代APU/CPU/SoCについて語ろう 253世代 ・AMDの次世代APU/CPU/SoCについて語ろう 274世代 ・AMDの次世代APU/CPU/SoCについて語ろう 299世代 ・AMDの次世代APU/CPU/SoCについて語ろう 295世代 ・AMDの次世代APU/CPU/SoCについて語ろう 272世代 ・AMDの次世代APU/CPU/SoCについて語ろう 250世代 ・AMDの次世代APU/CPU/SoCについて語ろう 279世代 ・AMDの次世代APU/CPU/SoCについて語ろう 234世代 ・AMDの次世代APU/CPU/SoCについて語ろう 288世代 ・AMDの次世代APU/CPU/SoCについて語ろう 284世代 ・AMDの次世代APU/CPU/SoCについて語ろう 277世代 ・AMDの次世代APU/CPU/SoCについて語ろう 282世代 ・AMDの次世代APU/CPU/SoCについて語ろう 273世代 ・AMDの次世代APU/CPU/SoCについて語ろう 244世代 ・AMDの次世代APU/CPU/SoCについて語ろう 276世代 ・AMDの次世代APU/CPU/SoCについて語ろう 283世代 ・AMDの次世代APU/CPU/SoCについて語ろう 264世代 ・AMDの次世代APU/CPU/SoCについて翻訳しよう8スレ目 ・AMDの次世代GPUについて語ろう ・AMDの次世代GPUについて語ろう 2世代 ・AMDの次世代GPUについて語ろう 6世代 ・PureVideoについて語るスレ Ver.7 ・NVIDIAの次世代技術について語ろう ・パソコンについて相談があります ・Intelの次世代技術について語ろう 90 ・Intelの次世代技術について語ろう 99 ・Intelの次世代技術について語ろう 92
08:00:59 up 39 days, 9:04, 0 users, load average: 7.75, 7.93, 7.49
in 0.031529903411865 sec
@0.031529903411865@0b7 on 022122