OpenEdv-开源电子网

 找回密码
 立即注册
正点原子全套STM32/Linux/FPGA开发资料,上千讲STM32视频教程免费下载...
查看: 4512|回复: 8

关于uV4的优化的优化

[复制链接]

36

主题

256

帖子

0

精华

高级会员

Rank: 4

积分
921
金钱
921
注册时间
2016-4-20
在线时间
169 小时
发表于 2016-10-14 11:43:22 | 显示全部楼层 |阅读模式
10金钱
     最近做音频算法的处理需要用到大量的运算,所以要对程序做优化。我之前做DSP的,ti提供了很多代码优化的知道说明。但是我发现keil和arm关于优化的资料比较少,比如内存对齐,循环展开这些指令我都没有找到。希望论坛有经验的坛友能提供一些关于uV4的优化的优化的建议或者文章转载的链接不胜感激!

最佳答案

查看完整内容[请看2#楼]

对的,我现在基本上所有变量都加上volatile,增强程序健壮性
正点原子逻辑分析仪DL16劲爆上市
回复

使用道具 举报

6

主题

201

帖子

0

精华

金牌会员

Rank: 6Rank: 6

积分
1149
金钱
1149
注册时间
2015-11-13
在线时间
267 小时
发表于 2016-10-14 11:43:23 | 显示全部楼层
czdspeed 发表于 2016-10-14 14:14
恩,谢谢了。这个优化确实要很花功夫,我用O3就碰过莫名其妙的问题,需要把变量加vu来防止优化。

对的,我现在基本上所有变量都加上volatile,增强程序健壮性
回复

使用道具 举报

6

主题

201

帖子

0

精华

金牌会员

Rank: 6Rank: 6

积分
1149
金钱
1149
注册时间
2015-11-13
在线时间
267 小时
发表于 2016-10-14 11:52:09 | 显示全部楼层
uV4自带优化功能

在Options里面选择C/C++,然后把Optimization的级别根据你的需求提高就行了。

当然,如果你的代码写的不够严谨的话,提高优化级别会出现意想不到的结果
回复

使用道具 举报

36

主题

256

帖子

0

精华

高级会员

Rank: 4

积分
921
金钱
921
注册时间
2016-4-20
在线时间
169 小时
 楼主| 发表于 2016-10-14 12:00:41 | 显示全部楼层
特朗姆斯 发表于 2016-10-14 11:52
uV4自带优化功能

在Options里面选择C/C++,然后把Optimization的级别根据你的需求提高就行了。

谢谢,我其实不是问这个系统自带O2,O3优化。这个是最基本的 ccs编译器也是这样,我知道O2  O3一般会开的比较慎重。我发帖子的意思是说有没有一些伪指令操作利于优化的。举个例子我写一段DSP代码:
“//进行转秩运算必须按照双子节对齐  且转秩的阶次必须是2的偶次方个
#pragma DATA_ALIGN(Ux1, 128)

void DSP_vec(const  short * restrict x,  int * restrict y,const int  m,
                int  nr)
{
        int i = 0;

    _nassert(((int)x & 7) ==0);
    _nassert(((int)y & 7) ==0);
    _nassert(nr % 8 == 0);

    #pragma MUST_ITERATE(2,4096,2);
    #pragma UNROLL(16);

        for(i=0;i<nr;i++)
        {
                *(y+i) += m *  *(x+i);
        }

}
”_nassert()
    #pragma MUST_ITERATE(2,4096,2);
    #pragma UNROLL(16);
这些都是dsp提供的伪指令告诉编译器  循环的范围和需要手动展开的次数和内存对齐之类。keil有没有类似的伪指令。
回复

使用道具 举报

6

主题

201

帖子

0

精华

金牌会员

Rank: 6Rank: 6

积分
1149
金钱
1149
注册时间
2015-11-13
在线时间
267 小时
发表于 2016-10-14 13:43:30 | 显示全部楼层
czdspeed 发表于 2016-10-14 12:00
谢谢,我其实不是问这个系统自带O2,O3优化。这个是最基本的 ccs编译器也是这样,我知道O2  O3一般会开的 ...

类似的用过编译器提供的#pragma pack(n)来设定变量以n字节对齐方式。

你后面列举的循环展开优化的功能在ARM上没有看到过,帮你呼叫一下原子哥@正点原子
回复

使用道具 举报

36

主题

256

帖子

0

精华

高级会员

Rank: 4

积分
921
金钱
921
注册时间
2016-4-20
在线时间
169 小时
 楼主| 发表于 2016-10-14 14:14:14 | 显示全部楼层
特朗姆斯 发表于 2016-10-14 13:43
类似的用过编译器提供的#pragma pack(n)来设定变量以n字节对齐方式。

你后面列举的循环展开优化的功能 ...

恩,谢谢了。这个优化确实要很花功夫,我用O3就碰过莫名其妙的问题,需要把变量加vu来防止优化。
回复

使用道具 举报

36

主题

256

帖子

0

精华

高级会员

Rank: 4

积分
921
金钱
921
注册时间
2016-4-20
在线时间
169 小时
 楼主| 发表于 2016-10-15 09:25:35 | 显示全部楼层
特朗姆斯 发表于 2016-10-14 17:27
对的,我现在基本上所有变量都加上volatile,增强程序健壮性

我不是每一个都加了,有一些循环操作的变量加了volatile。这个每次都要重新读我觉得会加大运行时间。所以也不计较纠结,感觉再加算法就跑不过来了。
回复

使用道具 举报

6

主题

201

帖子

0

精华

金牌会员

Rank: 6Rank: 6

积分
1149
金钱
1149
注册时间
2015-11-13
在线时间
267 小时
发表于 2016-10-17 09:16:21 | 显示全部楼层
czdspeed 发表于 2016-10-15 09:25
我不是每一个都加了,有一些循环操作的变量加了volatile。这个每次都要重新读我觉得会加大运行时间。所以 ...

ARM更多还是用作核心主控,要跑算法还是要靠DSP。

你有评估一下f4的DPS功能吗?用ARM自带的DSP来做音频算法的处理可能比对程序优化更有效
回复

使用道具 举报

36

主题

256

帖子

0

精华

高级会员

Rank: 4

积分
921
金钱
921
注册时间
2016-4-20
在线时间
169 小时
 楼主| 发表于 2016-10-17 09:49:22 | 显示全部楼层
特朗姆斯 发表于 2016-10-17 09:16
ARM更多还是用作核心主控,要跑算法还是要靠DSP。

你有评估一下f4的DPS功能吗?用ARM自带的DSP来做音 ...

比dsp跑起来坑太多。不过ARM已经控制一个外空芯片了。再加一个dsp很麻烦。以后上了高端的再想办法吧。谢谢了!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则



关闭

原子哥极力推荐上一条 /2 下一条

正点原子公众号

QQ|手机版|OpenEdv-开源电子网 ( 粤ICP备12000418号-1 )

GMT+8, 2025-6-13 17:45

Powered by OpenEdv-开源电子网

© 2001-2030 OpenEdv-开源电子网

快速回复 返回顶部 返回列表