Project1

标题: 汇编小模块 [打印本页]

作者: SixRC    时间: 2019-11-24 01:57
标题: 汇编小模块
本帖最后由 SixRC 于 2020-2-5 21:54 编辑

最近发现当任务量很小时 相对调用开销有点大
这时建议直接注册ruby方法

这东西对偶尔写汇编的来讲挺好用的
用途大概是提高某些部分效率 方便随时汇编上

模块名 ExtraFunc 下面功能

ExtraFunc.parse(code)
把汇编转换为对应机器码
输入字符串 返回字符串
可用标签来跳转
这个东西 99.9999% 基于 asmjit和asmtk 躺的好舒服

ExtraFunc.run(code, *args)
code是上一步返回的机器码 或者别的方式产生的 总之类型是字符串
args是参数 类型是整数 数量不限
传入的第一个参数是 [esp + 4] 依次类推
需要自己平堆栈 传几个参 最后反正 ret n*4
只有这个是自己写的 感觉好偷懒

ExtraFunc.tbb_for(ss,ee,st,func,*args)
tbb parallel_for
ss是for的开始值 ee是结束值 st是step
func和args同run
但是不同的是 传入给func的多了一个值 就是for给的
参数顺序是 i, arg1, arg2, ...
i就是 ss, ss + st, ss + 2st, ... 到 ee(不含)
这个就是多线程方法中的一个 别的我没写 我一般就用这个

ExtraFunc.tbb_allocate(size)
ExtraFunc.tbb_deallocate(pointer)
分别是申请内存和释放内存 用于多线程提高效率 或平常用
虽然写了这个方法 其实多线程用不到的
用的时候肯定是用dll的导出方法
因为机器码里不好调用ruby方法啊..
所以这个方法就平时申请内存用好了

别的功能我没写 反正基本是基于tbb的 要什么自己加什么
工程和源码
MTASM.zip (1.35 MB, 下载次数: 43054)

工程里有一个小范例
这里也附一下 使用基本上都在里面了 吧
范例是图片反色的三种方法 :原版 汇编 及多线程+汇编 的比较
虽然原版限制太多 比方 color 的储存是浮点数 没p用 浪费效率
感觉比的很不公平 所以效率差是千倍的
别的范例我也不知道写啥 算了 反正百倍效率差基本是有的
这个例子多线程的作用感觉并不明显 (4核心约一倍提升)
因为核心循环代码量很少 速度很快
假如每个线程任务量大一点 多线程速度就体现出来了


下面这个是AVX版本的 范例里没带 刚写的
我的电脑上 AVX+多线程速度等于AVX单线程
原因似乎达到是内存读写/缓存 上限了
然后和原版差达到万倍





欢迎光临 Project1 (https://rpg.blue/) Powered by Discuz! X3.1