当前位置:主页 > 艺术格调 > 看西方 > 正文

对比Intel主流处理器:龙芯3A3000性能及优化测试

2018-05-30 20:48 作者:admin

IT之家编辑注:作为国产芯片“代言人”,龙芯在中国半导体行业的地位不可小觑。去年4月,龙芯推出了新一代代表国产最高水平的芯片,其中之一便是龙芯 3A3000,相信关注它的用户都比较好奇,龙芯 3A3000 的实力究竟多大?现在,有IT之家的热心网友针对龙芯3A3000进行了测试,并且将测试的结果和其分析的心得和大家进行了分享,内容有些专业,感兴趣的小伙伴不妨看一下。

使用phoronix-test-suite对龙芯3A3000以及X270笔记本电脑的i5-7200U处理器性能进行了测试。

一、测试的前提:

1、 X270笔记本,i5-7200U处理器(14nm),双核4线程,关掉省电,调成性能模式。关掉自动睿频(turbo),CPU主频固定在2.5GHz。

2、龙芯3A3000主板,主频1.4GHz,4核处理器(28nm)。

3、操作系统一致,均为debian testing。注意,龙芯3A3000主板装的操作系统没有针对龙芯进行优化。内核为龙梦提供的4.14版本。

二、测试的内容和结果

测试内容为pts中压缩性能测试部分,包括7z、pbzip2、gzip和LZMA四种压缩软件。

测试结果:点此查看

主要的结果如下图所示:

▲点击可查看大图

对以上测试的结果,我做了一个简单的分析:

▲点击可查看大图

如果测试到此结束,从以上的测试,可以简单得出结论,龙芯最新的处理器处理器单核的性能仅仅相当与Intel笔记本处理器的1/5~1/2。但考虑到龙芯主频较低,龙芯处理器单核/GHz的性能相当于Intel i5-7200U处理器的40%~90%。

问题在于,使用PTS是否真的能够发挥CPU的性能?运行在龙芯上的程序,其性能还能否进一步优化?针对以上的四个测试,我分别进行了分析。

三、深入分析

1.、7z性能优化

7z benchmark跑分的结果,与线程数是相关的。在i5-7200U处理器上,分别使用1~10

个线程测试发行版所提供的7z程序性能,结果如下:

当线程数目达到7时,7z达到其峰值性能,约为8871MIPS。当线程数目为4时,峰值性能为8629,达到最高峰值性能的97%。

而对龙芯3A300来说,同样使用4个线程,是远远无法发挥其最高性能的!

类似的,使用不同的线程数目,对7z的性能进行了测试,结果如下:

在没有使用编译器优化的前提下,仅增加7z运行的线程数目,7z成绩从3478提高到了4137,性能提升达到了19%。

接着,参考龙芯官方提供的优化指南,更改了一些编译选项。Phornix-test-suite中7z编译时,默认采用的参数为:

OPTFLAGS=-O -s

更改后的编译选项为:

-march=loongson3a-mtune=loongson3a-O3-s-mabi=n32-ffast-math

-funroll-all-loops -floop-optimize

经过优化编译选项,编译的7z程序在使用不同的线程数目时性能如下所示:

经过以上的优化,龙芯3A3000运行7z的跑分可以从3478提高到4929,提升的幅度高达42%。按照4949MIPS的跑分,龙芯3A3000性能相当于i5-7200U(8871 MIPS)的56%,单核/GHZ性能的性能相当于i5-7200U的50%。

2. Pbzip2

Pbzip2程序可以分为两个部分,一部分是bzip库,一部分是使之并行话的pbzip2。

在Pbzip2运行时,同样需要指定运行的线程数目。首先,使用不同的线程,对压缩的效果

进行了测试。测试内容是对大小为612MB的linux-4.3.tar的Linux内核源码包进行压缩。

压缩所使用的命令为:

#!/bin/sh

cd pbzip2-1.1.12/

./pbzip2 -c -p$NUM_CPU_CORES -r -5 ../linux-4.3.tar > /dev/null 2>&1

最近关注

热点内容

更多