取消
显示结果 
搜索替代 
您的意思是: 
Highlighted
Participant
Participant
833 次查看
注册日期: ‎02-14-2019

zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

 

我司正在移植Edge AI Targeted Reference Designs (TRD)相关内容到自己的硬件上去。我们的硬件使用的zu11,软件使用的是petalinux 2018.2。

我们分别在zu102(主芯片zu9)和我司的硬件上在运行adas_detection这个例程,对比了图片前后处理程序(跑在cpu上)的运行时间,发现在zu102上的运行比我司硬件上快很多。拿图像的前处理举例子,zu102用了50ms,而我司的板子用了144ms(完全一样的程序)。

两块板子上运行"cat /proc/cpuinfo | grep BogoMIPS"的结果确实不一样,zu102上是199.99,我司的硬件上是66.66。查看我司硬件上的启动log,能看到cpu确实已经被配置到了最高频率1199999 KHz:

[    0.000000] percpu: Embedded 21 pages/cpu @ffffffc87ff56000 s46488 r8192 d31336 u86016
[    0.000000] pcpu-alloc: s46488 r8192 d31336 u86016 alloc=21*4096
[    0.000000] pcpu-alloc: [0] 0 [0] 1 [0] 2 [0] 3 
[    0.000000]  RCU restricting CPUs from NR_CPUS=8 to nr_cpu_ids=4.
[    0.000000] RCU: Adjusting geometry for rcu_fanout_leaf=16, nr_cpu_ids=4
[    0.193219] cpuidle: using governor menu
[   14.092743] cpufreq: cpufreq_online: CPU0: Running at unlisted freq: 1199880 KHz
[   14.092799] cpufreq: cpufreq_online: CPU0: Unlisted initial frequency changed to: 1199999 KHz
[   14.194110] ledtrig-cpu: registered to indicate activity on CPUs

zu102的启动log如下:

[    0.000000] percpu: Embedded 23 pages/cpu @(____ptrval____) s53656 r8192 d32360 u94208
[    0.000000] pcpu-alloc: s53656 r8192 d32360 u94208 alloc=23*4096
[    0.000000] pcpu-alloc: [0] 0 [0] 1 [0] 2 [0] 3 
[    0.000000] rcu:     RCU restricting CPUs from NR_CPUS=8 to nr_cpu_ids=4.
[    0.000000] rcu: Adjusting geometry for rcu_fanout_leaf=16, nr_cpu_ids=4
[    0.324234] cpuidle: using governor menu
[    5.547376] ledtrig-cpu: registered to indicate activity on CPUs
[    7.894908] cpufreq: cpufreq_online: CPU0: Running at unlisted freq: 1199880 KHz
[    7.902346] cpufreq: cpufreq_online: CPU0: Unlisted initial frequency changed to: 1199999 KHz

这么看两块板子的cpu主频配置是一样的,那为什么从结果上来看,差了那么多呢?

谢谢。

 

0 项奖励
1 个已接受解答

已接受的解答
Highlighted
Participant
Participant
712 次查看
注册日期: ‎02-14-2019

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

最后发现问题在于编译软件是debug还是release的,和硬件无关。

在zu102上,直接使用了make编译出了release的版本。跑在我司硬件上的,是在sdk下编译出的debug的版本。

谢谢。

在原帖中查看解决方案

0 项奖励
3 条回复3
Highlighted
Xilinx Employee
Xilinx Employee
799 次查看
注册日期: ‎06-19-2019

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

zu9和zu11内部是相同的ARM核。

建议你在程序里增加更多的时间测试内容,然后比较一下是哪个地方耗时大大超过了。比如图像数据的读写等(DDR的读写效率可能就不同)。

然后再具体分析原因。

------------------------------------------------------------------
Don't forget to reply, kudo, and accept as solution.
如果提供的信息能解决您的问题,请标记为“接受为解决方案”。
如果您认为帖子有帮助,请点击“奖励”。谢谢!
-------------------------------------------------------------------
Highlighted
Xilinx Employee
Xilinx Employee
740 次查看
注册日期: ‎09-14-2018

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

Hi @etdjj 

比较有意思的问题,

看起来bogomips数值和程序有运行时间都是接近1:3

硬件/配置上 有什么其它差异吗?

在u-boot下clk dump的acpu频率分别是多少?

 

-chaoz

0 项奖励
Highlighted
Participant
Participant
713 次查看
注册日期: ‎02-14-2019

回复: zu11的cpu性能不如zu9吗?(如何正确配置cpu主频)

转到解答

最后发现问题在于编译软件是debug还是release的,和硬件无关。

在zu102上,直接使用了make编译出了release的版本。跑在我司硬件上的,是在sdk下编译出的debug的版本。

谢谢。

在原帖中查看解决方案

0 项奖励