1F推kimula01: 主要還是看應用 支援AVX可讓特殊需求者更多選擇 04/08 10:27
2F→kqalea: 人家zen3 avx2 就跑得比core11 avx-512快了.... 04/08 10:30
3F推kuninaka: 就看ZEN4的AVX512表現如何阿 04/08 11:23
4F推xiemark: AI的Inference會比較快。 04/08 11:32
6F推oopFoo: 會寫avx512的話,效能就可以差好幾倍。本來想解釋 04/08 12:30
7F→oopFoo: 想想算了,大概也沒人看的懂。 04/08 12:32
8F→friedpig: avx512又不是牙膏閒閒沒事硬做的 客戶有需求去生 04/08 12:34
9F→friedpig: 出來的 當然消費級的就被硬塞用不太到的東西就是了 04/08 12:34
10F→delaluna: 特殊擴充指令集本來就是有用到就很有效率啊 04/08 12:37
11F→delaluna: 今天你去創造一個特殊指令再量身打造一個跑分指標 04/08 12:38
12F→delaluna: 一定也天下無敵 04/08 12:38
13F→delaluna: 問題多少客戶有用到 多頻繁使用的而已 04/08 12:39
14F推littlefish1: 一般用戶真的會用到avx512嗎?TR或EPYC等級再給就 04/08 12:40
15F→littlefish1: 行了吧 像dx12從底層撰寫能提高優化 但沒幾個團隊 04/08 12:40
16F→littlefish1: 真的會用 04/08 12:41
17F推arrenwu: 你覺得用Adobe的客戶算很少嗎? 04/08 12:45
18F→powerair: "本來想解釋 想想算了,大概也沒人看的懂"真萬用XD 04/08 12:46
19F→arrenwu: 實際上我覺得影音編輯算是一般人常用到的吃效能的 04/08 12:47
20F→arrenwu: 產品 04/08 12:47
21F→arrenwu: 再少一點就數值分析 04/08 12:47
22F推bobbyac01: 實際上AVX512的問題是有程式混用其他指令集 然後效 04/08 12:49
23F→bobbyac01: 率就沒有純AVX512來的好看 04/08 12:49
24F→friedpig: 還有一個問題是大家都很想一步到位 沒有前幾版硬體 04/08 12:57
25F→friedpig: 的砲灰慢慢優化下去 怎麼可能會好用 現在軟硬體都太 04/08 12:57
26F→friedpig: 複雜了 都要很多時間慢慢調整 04/08 12:58
28F→oopFoo: 如果想知道為什麼avx512重要,看這篇。Intel人講的 04/08 13:02
29F推arrenwu: 欸 其實我覺得那個倒還...就參考 04/08 13:03
30F→arrenwu: 有意義的還是benchmark 04/08 13:03
31F→arrenwu: 這次Intel比較掉漆的是多線程AVX512應用會狀功耗牆 04/08 13:04
32F推aegis43210: x86的強勢就在這些特殊擴充指令集呀,並不是只有i皇 04/08 13:04
33F→aegis43210: 要面對ARM的浪潮,而是整個x86 04/08 13:04
34F→arrenwu: 不然一般應用大家用起來CPU都差不多快了 04/08 13:05
35F→oopFoo: 功耗牆很難撞上的,真正使用起來記憶體的頻寬跟本不 04/08 13:08
36F→oopFoo: 夠。benchmark只是測指令,才會功耗那麼高。大部份 04/08 13:09
37F→oopFoo: 情況是卡在記憶體存取,cpu在等待。 04/08 13:10
39F→friedpig: 我記得Bios Default不是碰到AVX就會降了嗎 AVX頻率 04/08 13:13
40F→friedpig: 脫鉤的設定 導致頻率飄比較大 04/08 13:13
41F→oopFoo: 噴火湖幾乎不降速,但噴功耗。 04/08 13:15
42F→friedpig: 噴功耗也很嚴重阿 大家散熱很摳的 04/08 13:16
43F→kuma660224: AVX512畢竟性能不會是256兩倍 04/08 13:20
44F→kuma660224: 用AVX256高時脈+多幾核 反而更有效率 04/08 13:20
45F→kuma660224: AMD即使支援AVX512, 也很可能 04/08 13:22
46F→kuma660224: 不想透過硬體實作1Cycle 512bit 04/08 13:22
47F→kuma660224: 改用2Cycle 256bit更省電晶體 04/08 13:22
48F推oopFoo: 就幾乎不可能噴功耗啊。這些測試都是fma*100次然後 04/08 13:22
49F→kuma660224: 把那個資源拿去實作更強更多核 04/08 13:22
50F→oopFoo: 都不存取記憶體。實際沒有程式這樣跑的,一定是讀取 04/08 13:23
51F→kuma660224: 那個為什麼512很重要論 在12代就糗了 04/08 13:24
52F→oopFoo: 幾個指令處理再存回去。不可能用fmadd*100次。 04/08 13:24
53F→kuma660224: AlderLake搞大小核 為求指令一致性 04/08 13:24
54F→kuma660224: 放棄掉AVX512 04/08 13:25
55F→kuma660224: 於是AVX明年突然又不重要了 04/08 13:25
56F推oopFoo: 真的12代沒有就尷尬了,等被Zen4痛宰 04/08 13:27
57F→kuma660224: 如果大小核省電性贏不了GG黑科技製程 04/08 13:31
58F→kuma660224: 又沒AVX512可以吹,不知道怎麼戰 04/08 13:32
59F推b325019: 比省電應該會贏拉,只是大小核調度沒做好也沒用 04/08 13:35
60F→kuma660224: 確定小核一定更省嗎 04/08 13:40
61F→kuma660224: 明年Zen4 5nm vs 10nm 12代 04/08 13:41
62F→twflanker: 到時候跟bulldozer一樣被OS衝康就好笑了 04/08 13:42
63F→kuma660224: 那跨核切換搬移也是額外耗電 04/08 13:43
64F→kuma660224: 要長時間待在小核才有省電意義 04/08 13:44
65F→kuma660224: 但又不是用在手機.... 04/08 13:44
66F推twosheep0603: 大小核設計的主要目標是筆電吧 桌機就有點意義不明 04/08 13:45
67F→kuma660224: 省電有兩條路線 1.用小核心 04/08 13:46
68F→kuma660224: 2.用先進製程把大核面積做小 降壓 04/08 13:46
69F推b325019: 是阿要壓功耗把大核關掉應該很漂亮,只是實際使用就 04/08 13:47
70F→b325019: 不是這樣了 04/08 13:47
71F→kuma660224: 小核但製程輸人 是有可能沒更省電 04/08 13:47
72F→kuma660224: 只能說跟同製程的大核比是省電 04/08 13:48
73F→b325019: 只是zen4還有個iod在那邊應該不至於小核功耗還輸,A 04/08 13:48
74F→b325019: PU就不敢說了 04/08 13:48
75F→kuma660224: 問題是萬一對手不講武德 下單GG5nm 04/08 13:48
76F→kuma660224: 連IOD都可能搬到GG7nm 04/08 13:49
77F→kuma660224: 就像蘋果A14的小核其實也不小 04/08 13:50
78F→kuma660224: 小核ipc暴力到有A76的96% 04/08 13:51
79F→kuma660224: 但蘋果製程砸錢包產能 領先對手一代 04/08 13:52
80F→kuma660224: 亂序多發射中核靠製程縮小 當小核用 04/08 13:57
81F→leung3740250: n5功耗降20%有很多嗎? 04/08 14:01
82F→leung3740250: 不知道第幾次看到製程大師在吹n5功耗有多低 04/08 14:10
83F推aegis43210: 12代本來就會被zen4痛宰,要和Zen4打的是13代 04/08 14:23
84F推kuninaka: 如果沒有用,AMD不會在ZEN4支援拉 04/08 14:44
85F→kuninaka: 講這麼多 04/08 14:44
86F→a27417332: 我以為現在x86的優勢只剩下固有生態(X 04/08 15:14
87F推kngs555: AVX-512這應該是要用上AI.伺服器.特殊運算等,AMD才 04/08 15:24
88F→kngs555: 會塞進去 04/08 15:24
89F→kuma660224: n5低不低是看跟誰比 不是跟 GG自己比 04/08 15:33
90F→kuma660224: 因為連GG7省電實測都贏三星5 04/08 15:34
91F推b325019: 按照現在一個ccd通吃的手法如果真的實作512bit電路 04/08 15:43
92F→b325019: 上去消費級不想要也得吞,要嘛用現有256bit電路做相 04/08 15:43
93F→b325019: 容要嘛消費級ccd另外做不然AVX應該會是全面性支援 04/08 15:43
94F→b325019: AVX512* 04/08 15:43
95F→leung3740250: 4ghz以上n7p打不過10sf,10esf功耗再降15%,請問n 04/08 16:29
96F→leung3740250: 5p功耗是能夠低多少? 04/08 16:29
97F→leung3740250: 5lpe那種拉到1.0v就已經比不過無印版n7就別拿來搞 04/08 16:57
98F→leung3740250: 笑了,高中生打架找個國中生加入混戰是來當小丑的 04/08 16:57
99F→leung3740250: 嗎? 04/08 16:57
100F推CORYCHAN: IOD用7nm應該會很爽 04/08 19:27
101F推Dissipate: 請問高頻的10sf那裡買的到呢? 04/08 20:03
102F→leung3740250: tgl-u不是10sf是什麼,還是說tgl-u沒跑上4g? 04/08 20:07
103F推Dissipate: 哇,高頻好厲害,拍拍手,那怎麼不上桌機?噗疵 04/08 21:11
104F→Dissipate: H版都做不出來就不要拿出來說嘴了啦 04/08 21:12
105F→leung3740250: 說製程性能就跳針到能不能生出來的問題?h45還有兩 04/08 21:21
106F→leung3740250: 個月就出來了,原來這叫生不出來。 04/08 21:21
107F→leung3740250: tgl-u的高頻實際上還比h45差一點,h35只能單核tur 04/08 21:25
108F→leung3740250: bo 5g,h45可以雙核,順帶一提,h45 4.5g pl2 120 04/08 21:25
109F→leung3740250: w。 04/08 21:25
110F→leung3740250: 至於不上dt的原因,q3 adl-s就要上了,現在出tgl- 04/08 21:29
111F→leung3740250: s是打算賣多久?rkl-s可是delay了將近半年 04/08 21:29
112F→kqalea: 10nm superfin的良率能超過50%再說吧 04/08 21:29
113F→kqalea: zen3+瞄準6nm不是沒有原因的 04/08 21:29
114F→leung3740250: 去年武漢肺炎的影響下有多少東西真的能準時出來還 04/08 21:29
115F→leung3740250: 夠產能? 04/08 21:29
116F→leung3740250: 請問誰告訴你10sf良率不過50%的? 04/08 21:30
117F→kqalea: 不用別人告訴我,core11沒能搭上10nm 就是鐵證 04/08 21:32
118F→leung3740250: 原來這就叫鐵證,10sf良率不夠50%還敢砍掉rkl-u, 04/08 21:38
119F→leung3740250: 甚至把die size從上一代的120mm^2加大到接近150mm 04/08 21:38
120F→leung3740250: ^2 04/08 21:38
121F→leung3740250: icl-u的良率都不止50%,原來1.35v可以跑上5g的製程 04/08 21:39
122F→leung3740250: 良率可以低於50% 04/08 21:39
123F推oopFoo: 噴火湖本來應該去年9月出的,當時評估10nm產能要給 04/09 09:56
124F→oopFoo: tglu跟icelake-sp。除了tgl準時,其它都大延遲。這 04/09 09:58
125F→oopFoo: 些都在一,兩年前就計畫好了,用來評估現在10nm的良 04/09 09:58
126F→oopFoo: 率不是很客觀。 04/09 09:59
127F→friedpig: 噴火湖 Delay真是可憐娜 04/09 11:08