<div dir="ltr">I've told AMD brass that we need AVX512 many many times.<div><br></div><div>I've also told them that we need more memory bandwidth and that adding dimms is not the answer.  We don't need more capacity - just more bandwidth.</div><div><br></div><div>We have a stack load of KNL systems and have invested heavily in AVX512 (writing with intrinsics) and shifting those codes away from it would be considerable work.</div><div><br></div><div>Bring on Sapphire Rapids :)</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Jun 17, 2021 at 1:16 AM Prentice Bisbal via Beowulf <<a href="mailto:beowulf@beowulf.org">beowulf@beowulf.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Did anyone else attend this webinar panel discussion with AMD hosted by <br>
HPCWire yesterday? It was titled "AMD HPC Solutions: Enabling Your <br>
Success in HPC"<br>
<br>
<a href="https://www.hpcwire.com/amd-hpc-solutions-enabling-your-success-in-hpc/" rel="noreferrer" target="_blank">https://www.hpcwire.com/amd-hpc-solutions-enabling-your-success-in-hpc/</a><br>
<br>
I attended it, and noticed there was no mention of AMD supporting <br>
AVX512, so during the question and answer portion of the program, I <br>
asked when AMD processors will support AVX512. The answer given, and I'm <br>
not making this up, is that AMD listens to their users and gives the <br>
users what they want, and right now they're not hearing any demand for <br>
AVX512.<br>
<br>
Personally, I call BS on that one. I can't imagine anyone in the HPC <br>
community saying "we'd like processors that offer only 1/2 the floating <br>
point performance of Intel processors". Sure, AMD can offer more cores, <br>
but with only AVX2, you'd need twice as many cores as Intel processors, <br>
all other things being equal.<br>
<br>
Last fall I evaluated potential new cluster nodes for a large cluster <br>
purchase using the HPL benchmark. I compared a server with dual AMD EPYC <br>
7H12 processors (128) cores to a server with quad Intel Xeon 8268 <br>
processors (96 cores). I measured 5,389 GFLOPS for the Xeon 8268, and <br>
only 3,446.00 GFLOPS for the AMD 7H12. That's LINPACK score that only <br>
64% of the Xeon 8268 system, despite having 33% more cores.<br>
<br>
 From what I've heard, the AMD processors run much hotter than the Intel <br>
processors, too, so I imagine a FLOPS/Watt comparison would be even less <br>
favorable to AMD.<br>
<br>
An argument can be made that for calculations that lend themselves to <br>
vectorization should be done on GPUs, instead of the main processors but <br>
the last time I checked, GPU jobs are still memory is limited, and <br>
moving data in and out of GPU memory can still take time, so I can see <br>
situations where for large amounts of data using CPUs would be preferred <br>
over GPUs.<br>
<br>
Your thoughts?<br>
<br>
-- <br>
Prentice<br>
<br>
_______________________________________________<br>
Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org" target="_blank">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>
To change your subscription (digest mode or unsubscribe) visit <a href="https://beowulf.org/cgi-bin/mailman/listinfo/beowulf" rel="noreferrer" target="_blank">https://beowulf.org/cgi-bin/mailman/listinfo/beowulf</a><br>
</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr">Dr Stuart Midgley<br><a href="mailto:sdm900@gmail.com" target="_blank">sdm900@gmail.com</a></div></div>