UPGRADE YOUR BROWSER

We have detected your current browser version is not the latest one. Xilinx.com uses the latest web technologies to bring you the best online experience possible. Please upgrade to a Xilinx.com supported browser:Chrome, Firefox, Internet Explorer 11, Safari. Thank you!

取消
显示结果 
搜索替代 
您的意思是: 
Highlighted
Observer etdjj
Observer
207 次查看
注册日期: ‎02-14-2019

zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

 

我司正在移植Edge AI Targeted Reference Designs (TRD)相关内容到自己的硬件上去。我们的硬件使用的zu11,软件使用的是petalinux 2018.2。

我们分别在zu102(主芯片zu9)和我司的硬件上在运行adas_detection这个例程,对比了图片前后处理程序(跑在cpu上)的运行时间,发现在zu102上的运行比我司硬件上快很多。拿图像的前处理举例子,zu102用了50ms,而我司的板子用了144ms(完全一样的程序)。

两块板子上运行"cat /proc/cpuinfo | grep BogoMIPS"的结果确实不一样,zu102上是199.99,我司的硬件上是66.66。查看我司硬件上的启动log,能看到cpu确实已经被配置到了最高频率1199999 KHz:

[    0.000000] percpu: Embedded 21 pages/cpu @ffffffc87ff56000 s46488 r8192 d31336 u86016
[    0.000000] pcpu-alloc: s46488 r8192 d31336 u86016 alloc=21*4096
[    0.000000] pcpu-alloc: [0] 0 [0] 1 [0] 2 [0] 3 
[    0.000000]  RCU restricting CPUs from NR_CPUS=8 to nr_cpu_ids=4.
[    0.000000] RCU: Adjusting geometry for rcu_fanout_leaf=16, nr_cpu_ids=4
[    0.193219] cpuidle: using governor menu
[   14.092743] cpufreq: cpufreq_online: CPU0: Running at unlisted freq: 1199880 KHz
[   14.092799] cpufreq: cpufreq_online: CPU0: Unlisted initial frequency changed to: 1199999 KHz
[   14.194110] ledtrig-cpu: registered to indicate activity on CPUs

zu102的启动log如下:

[    0.000000] percpu: Embedded 23 pages/cpu @(____ptrval____) s53656 r8192 d32360 u94208
[    0.000000] pcpu-alloc: s53656 r8192 d32360 u94208 alloc=23*4096
[    0.000000] pcpu-alloc: [0] 0 [0] 1 [0] 2 [0] 3 
[    0.000000] rcu:     RCU restricting CPUs from NR_CPUS=8 to nr_cpu_ids=4.
[    0.000000] rcu: Adjusting geometry for rcu_fanout_leaf=16, nr_cpu_ids=4
[    0.324234] cpuidle: using governor menu
[    5.547376] ledtrig-cpu: registered to indicate activity on CPUs
[    7.894908] cpufreq: cpufreq_online: CPU0: Running at unlisted freq: 1199880 KHz
[    7.902346] cpufreq: cpufreq_online: CPU0: Unlisted initial frequency changed to: 1199999 KHz

这么看两块板子的cpu主频配置是一样的,那为什么从结果上来看,差了那么多呢?

谢谢。

 

0 项奖励
1 个已接受解答

已接受的解答
Observer etdjj
Observer
86 次查看
注册日期: ‎02-14-2019

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

最后发现问题在于编译软件是debug还是release的,和硬件无关。

在zu102上,直接使用了make编译出了release的版本。跑在我司硬件上的,是在sdk下编译出的debug的版本。

谢谢。

0 项奖励
3 条回复3
Xilinx Employee
Xilinx Employee
173 次查看
注册日期: ‎06-19-2019

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

zu9和zu11内部是相同的ARM核。

建议你在程序里增加更多的时间测试内容,然后比较一下是哪个地方耗时大大超过了。比如图像数据的读写等(DDR的读写效率可能就不同)。

然后再具体分析原因。

------------------------------------------------------------------
Don't forget to reply, kudo, and accept as solution.
如果提供的信息能解决您的问题,请标记为“接受为解决方案”。
如果您认为帖子有帮助,请点击“奖励”。谢谢!
-------------------------------------------------------------------
Xilinx Employee
Xilinx Employee
114 次查看
注册日期: ‎09-14-2018

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

Hi @etdjj 

比较有意思的问题,

看起来bogomips数值和程序有运行时间都是接近1:3

硬件/配置上 有什么其它差异吗?

在u-boot下clk dump的acpu频率分别是多少?

 

-chaoz

0 项奖励
Observer etdjj
Observer
87 次查看
注册日期: ‎02-14-2019

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

最后发现问题在于编译软件是debug还是release的,和硬件无关。

在zu102上,直接使用了make编译出了release的版本。跑在我司硬件上的,是在sdk下编译出的debug的版本。

谢谢。

0 项奖励