<div dir="ltr"><br><div>Hi Doug,</div><div><br></div><div>  I've seen pretty decent performance on the AMD processors, and was even told by AMD people to use the Intel compiler -- but when doing that, we specify the processor type (eg, AVX capabilities), and it works pretty well.  However, I don't have any experience using the MKL on them.</div><div><br></div><div>  That said, looking at the numbers, it's pretty interesting that there's roughly a factor of 2 from the AVX2 (OpenBLAS) -> AVX512 (MKL) results on Intel, and with the two systems being relatively comparable with OpenBLAS (AVX2).  Then it's <i>roughly</i> a factor of 8 going from the MKL on Intel to the MKL on AMD, and since AVX512 is 8 x 64 floats, it seems it could just be it's not using any vectorization whatsoever on AMD... presumably because Intel claims they can't recognize the chip?  That said, I'd love to see the author try after setting:</div><div><br></div>MKL_ENABLE_INSTRUCTIONS=AVX2<br><br><div>  That might be an easy fix, if it works[1].</div><div><br></div><div>  Anyone got a Zen2 system with NumPy & the MKL to try it with?</div><div><br></div><div>  - Brian</div><div><br></div><div>[1] <a href="https://software.intel.com/en-us/mkl-linux-developer-guide-instruction-set-specific-dispatching-on-intel-architectures">https://software.intel.com/en-us/mkl-linux-developer-guide-instruction-set-specific-dispatching-on-intel-architectures</a></div><div>  </div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Dec 12, 2019 at 7:35 AM Douglas Eadline <<a href="mailto:deadline@eadline.org">deadline@eadline.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br>
Anyone see anything like this with Epyc, i.e. poor AMD performance<br>
when using Intel compilers or MKL?<br>
<br>
<a href="https://www.pugetsystems.com/labs/hpc/AMD-Ryzen-3900X-vs-Intel-Xeon-2175W-Python-numpy---MKL-vs-OpenBLAS-1560/" rel="noreferrer" target="_blank">https://www.pugetsystems.com/labs/hpc/AMD-Ryzen-3900X-vs-Intel-Xeon-2175W-Python-numpy---MKL-vs-OpenBLAS-1560/</a><br>
<br>
<br>
<br>
-- <br>
Doug<br>
<br>
_______________________________________________<br>
Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org" target="_blank">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>
To change your subscription (digest mode or unsubscribe) visit <a href="https://beowulf.org/cgi-bin/mailman/listinfo/beowulf" rel="noreferrer" target="_blank">https://beowulf.org/cgi-bin/mailman/listinfo/beowulf</a><br>
</blockquote></div>