赞 | 86 |
VIP | 0 |
好人卡 | 1 |
积分 | 136 |
经验 | 14048 |
最后登录 | 2021-1-24 |
在线时间 | 2753 小时 |
Lv4.逐梦者
- 梦石
- 0
- 星屑
- 13562
- 在线时间
- 2753 小时
- 注册时间
- 2014-10-4
- 帖子
- 756
|
加入我们,或者,欢迎回来。
您需要 登录 才可以下载或查看,没有帐号?注册会员
x
本帖最后由 SixRC 于 2020-9-15 18:47 编辑
RM画面渲染过程中核心部分之一是blt (这里的blt和位图的blt本质一样 具体上不同)
把所有要呈现的位图依次blt到背景上
他好像会根据目标CPU的特性不同在运行时生成blt机器码 效率很高
不过那个时候普及的大概就MMX?
然后我就写了需要SSE2或AVX2的版本 会根据支持的情况替换原来的过程(现在基本都有SSE2所以只判断是否有AVX2)
效率测试我这里大概是 SSE2版是原版2倍 AVX2版2.2倍
就这样
实际意义大概不大 毕竟效率瓶颈很可能不在这 也不缺这点
写了就发 早知结果大概就不写了..
因为实际计算量并不大 多线程的效果不好(实际计算量小则更慢 计算量稍高则高CPU占用低收益) 所以没有加
(什么 你问我之前的多线程版不规则blt? 只能说年少不懂事 误把测试当事实 不过反正没人说 我懒得去改了)
仅支持103J
代码
bltacc.zip
(39.97 KB, 下载次数: 132)
放到目录就行 |
|