<div dir="ltr"><br><div>All,</div><div><br></div><div>What have people achieved on this SKU on a single-node using the stock </div><div>HPL 2.3 source... ??  </div><div><br></div><div>I have seen a variety of performance claims even as high as 90% of its nominal </div><div>per node peak of 4.608 TFLOPs.  I can now get above 80% of peak, but not higher.  </div><div>I have heard that to get higher values special BIOS settings are required, including</div><div>the turning off SMT which allows the chip to turbo higher.  Remember this is not the </div><div>7542 processor with 32 cores per chip and the same bandwidth per socket as the</div><div>7742 which can turbo to over 100% of nominal peak for HPL.</div><div><br></div><div>If people have gotten higher single node numbers ... what is your recipe ... ??</div><div><br></div><div>I am particularly interested in BIOS settings, and maybe surprise settings</div><div>in the HPL.dat file.  Do higher performing runs require using close to the </div><div>maximum memory on the node ... ??  As this is single-node, I would not</div><div>expect choice of MPI to make a difference</div><div><br></div><div>To get to 80% with SMT on in the BIOS, I am building with an older Intel</div><div>compiler and MKL that still recognizes the MKL_DEBUG_CPU_TYPE=5.</div><div>Running so that the number of MPI ranks run on the node matches the</div><div>number of CCXs seems ot give the best numbers.</div><div><br></div><div>Following the tuning instructions from AMD for using BLIS and GCC for</div><div>the build does not get me there.</div><div><br></div><div>Thanks,</div><div><br></div><div>Richard Walsh</div><div><br></div></div>