openssl-aes-ctr使用openmp加速

article/2025/7/20 1:02:01

openssl-aes-ctr使用openmp加速

  • openssl-aes-ctr
  • openmp omp for

openssl-aes-ctr

本文采用openssl-1.1.1w进行开发验证开发;因为aes-ctr加解密模式中,不依赖与上一个模块的加/解密的内容,所以对于aes-ctr加解密模式是比较适合进行并行加速的算法。
其代码如下

void CRYPTO_ctr128_encrypt(const unsigned char *in, unsigned char *out,size_t len, const void *key,unsigned char ivec[16],unsigned char ecount_buf[16], unsigned int *num,block128_f block) {...while (len >= 16) {(*block) (ivec, ecount_buf, key);	   // encryptctr128_inc_aligned(ivec);				// ivec = ivec + 1for (n = 0; n < 16; n += sizeof(size_t))  // out = in ^ ecount_buf*(size_t_aX *)(out + n) =*(size_t_aX *)(in + n)^ *(size_t_aX *)(ecount_buf + n);len -= 16;out += 16;in += 16;n = 0;}...}

在这里插入图片描述

从代码不难看出,每层循环,以16字节为一组进行加密;组与组之间不存在关联,下一组变更的只有ivec,所以对其进行加速处理,可以考虑并行处理的方式进行并行处理。

可以提前计算好ivec,ivec+1,ivec+2,…,ivec+255;此处因为单次加解密的长度是4096,所以函数内最长为256组会在一次函数调用中进行加解密。

openmp omp for

参考OpenMP并行编程
使用#pragma omp parallel for 对加密过程进行并行加速处理,处理过程中,在进入for循环前,首先将ivec的值都计算好

int loop = len / 16;
unsigned char * new_ivec[4096]; // 此处有待优化,实际调用长度可能会超过4096
memcpy(new_ivec, ivec, 16);
for (int i = 1; i < loop; i++) {memcpy(new_ivec + 16*i, new_ivec + 16*i - 16, 16);ctr128_inc_aligned(new_ivec + 16*i);
}

然后就是对分组进行并行加密处理

#pragma omp parallel for num_threads (16) private(n)
for (int i = 0; i < loop; i++) {unsigned char current_ecount_buf[16] = {0};(*block) (new_ivec + 16*i, current_ecount_buf, key);unsigned char * current_in = in + 16*i;unsigned char * current_out = out + 16*i;for (n = 0; n < 16; n += sizeof(size_t))*(size_t_aX *)(current_out + n) =*(size_t_aX *)(current_in + n)^ *(size_t_aX *)(current_ecount_buf + n);}

修改过后的函数如下:

void CRYPTO_ctr128m_encrypt(const unsigned char *in, unsigned char *out,size_t len, const void *key,unsigned char ivec[16],unsigned char ecount_buf[16], unsigned int *num,block128_f block)
{unsigned int n;size_t l = 0;n = *num;#if !defined(OPENSSL_SMALL_FOOTPRINT)if (16 % sizeof(size_t) == 0) { /* always true actually */do {while (n && len) {*(out++) = *(in++) ^ ecount_buf[n];--len;n = (n + 1) % 16;}# if defined(STRICT_ALIGNMENT)if (((size_t)in | (size_t)out | (size_t)ecount_buf)% sizeof(size_t) != 0)break;
# endifint loop = len / 16;unsigned char * new_ivec[4096];memcpy(new_ivec, ivec, 16);for (int i = 1; i < loop; i++) {memcpy(new_ivec + 16*i, new_ivec + 16*i - 16, 16);ctr128_inc_aligned(new_ivec + 16*i);}#pragma omp parallel for num_threads (16) private(n)for (int i = 0; i < loop; i++) {unsigned char current_ecount_buf[16] = {0};(*block) (new_ivec + 16*i, current_ecount_buf, key);unsigned char * current_in = in + 16*i;unsigned char * current_out = out + 16*i;for (n = 0; n < 16; n += sizeof(size_t))*(size_t_aX *)(current_out + n) =*(size_t_aX *)(current_in + n)^ *(size_t_aX *)(current_ecount_buf + n);}len -= loop * 16;out += loop * 16;in += loop * 16;n = 0;if (len) {(*block) (ivec, ecount_buf, key);ctr128_inc_aligned(ivec);while (len--) {out[n] = in[n] ^ ecount_buf[n];++n;}}*num = n;return;} while (0);}/* the rest would be commonly eliminated by x86* compiler */
#endifwhile (l < len) {if (n == 0) {(*block) (ivec, ecount_buf, key);ctr128_inc(ivec);}out[l] = in[l] ^ ecount_buf[n];++l;n = (n + 1) % 16;}*num = n;
}

经过以上处理后,需要进行测试,本文采用给openssl,增加enc子命令的方式进行处理,通过增加aria-128-ctrm的方式,而后进行测试验证。
从测试结果看,确实能提高一定的性能,但效果不是很显著,大概可能和加解密时长,占openssl enc整个命令调用时长的占比不是很高,所以没有显著的性能提升。
尽管效果不是很明显,也算是针对openmp和openssl-aes-ctr的一次结合应用。


http://www.hkcw.cn/article/HQylCoLAjU.shtml

相关文章

git查看commit属于那个tag

1. 快速确认commit原始分支及合入tag # git describe 213b4b3bbef2771f7a1b8166f6e6989442ca67c8 查看commit合入tag # git describe 213b4b3bbef2771f7a1b8166f6e6989442ca67c8 --all 查看commit原始分支 2.查看分支与master关系 # git show --all 0.5.67_0006 --stat 以缩…

怎么在window上打开ubuntu虚拟机?

怎么在window上打开ubuntu虚拟机&#xff1f; 1.先下载ubuntu镜像包并解压&#xff08;VM-ubuntu18-202304.7z&#xff09;,下载地址在本文档中有链接&#xff0c;自行查找。&#xff08;解压路径不要有中文&#xff09; 2.打开VMware软件&#xff0c;&#xff08;软件下载地址…

中国移动咪咕助力第五届全国人工智能大赛“AI+数智创新”专项赛道开展

第五届全国人工智能大赛由鹏城实验室主办&#xff0c;新一代人工智能产业技术创新战略联盟承办&#xff0c;华为、中国移动、鹏城实验室科教基金会等单位协办&#xff0c;广东省人工智能与机器人学会支持。 大赛发布“AI图像编码”、“AI增强视频质量评价”、“AI数智创新”三大…

第十三章 MQTT消息

系列文章目录 系列文章目录 第一章 总体概述 第二章 在实体机上安装ubuntu 第三章 Windows远程连接ubuntu 第四章 使用Docker安装和运行EMQX 第五章 Docker卸载EMQX 第六章 EMQX客户端MQTTX Desktop的安装与使用 第七章 EMQX客户端MQTTX CLI的安装与使用 第八章 Wireshark工具…

国芯思辰| 16通道12位模数转换器SC1425高性价比SGM5200替代方案,专为数字电源优化

与传统的模拟电源相比&#xff0c;数字电源的主要区别是控制与通信部分。在复杂的多系统业务中&#xff0c;数字电源是通过软件编程来实现多方面的应用&#xff0c;数字电源广泛应用于在可控因素较多、实时反应速度更快、需要多个模拟系统电源管理的、复杂的高性能系统应用中。…

Java 大数据处理:使用 Hadoop 和 Spark 进行大规模数据处理

Java 大数据处理&#xff1a;使用 Hadoop 和 Spark 进行大规模数据处理 在当今数字化时代&#xff0c;数据呈现出爆炸式增长&#xff0c;如何高效地处理大规模数据成为企业面临的重要挑战。Java 作为一门广泛使用的编程语言&#xff0c;在大数据处理领域同样发挥着关键作用。本…

深度学习复习笔记

深度前馈神经网络 卷积神经网络 Advanced卷积神经网络 Lightweight CNN dwconv squeezenet 这边右侧的e3是3x3卷积吧 SENet 在通道维度压一下&#xff0c;强迫各维度混合学习&#xff0c;再还原 ShuffleNet Group Convolution在 AlexNet 中引入&#xff0c;用于将模型分布到…

Linux系统编程收尾(35)

文章目录 前言一、读写锁二、自旋锁总结 前言 大家好&#xff0c;这是我们Linux系统编程的最后一节课了&#xff01;   大家请再撑住一会儿~ 一、读写锁 提到读写锁&#xff0c;我们就不得不提到 读者写者模型 &#xff0c;跟 生产者消费者模型 不同的是&#xff0c;本模型的…

C文件操作1

一、为什么使用文件 如果没有文件&#xff0c;我们写的程序的数据是存储在电脑的内存中&#xff0c;如果程序退出&#xff0c;内存回收&#xff0c;数据就丢失 了&#xff0c;等再次运行程序&#xff0c;是看不到上次程序的数据的&#xff0c;如果要将数据进行持久化的保存&am…

基于 AUTOSAR 的域控产品软件开发:从 CP 到 AP 的跨越

基于 AUTOSAR 的域控产品软件开发&#xff1a;从 CP 到 AP 的跨越 一、AUTOSAR AP 架构解析&#xff1a;面向智能汽车的自适应框架 &#xff08;一&#xff09;引言 随着汽车智能化向 L3 演进&#xff0c;传统 AUTOSAR CP&#xff08;经典平台&#xff09;在实时性、动态性和…

解密震颤背后的神经隐情

在人体精密运行的神经世界里&#xff0c;有一种疾病悄然打破生命的节奏&#xff0c;它就是帕金森。这一病症并非突然降临&#xff0c;而是随着时间&#xff0c;如潮水般慢慢侵蚀着身体的正常机能。​ 患病后&#xff0c;最直观的变化体现在肢体运动上。双手会不受控制地颤抖&a…

数据即资产:GEO如何重塑企业的信息价值链

在数字经济时代&#xff0c;数据早已被公认为企业的核心资产。然而&#xff0c;随着生成式AI的崛起&#xff0c;数据资产的定义、价值和管理方式正在发生根本性变革。深耕数字营销二十余年&#xff0c;我们亲历了从"数据即记录"到"数据即洞察"&#xff0c;…

2025年文学与文化发展国际会议(ICLCD 2025)

2025年文学与文化发展国际会议&#xff08;ICLCD 2025&#xff09; 2025 International Conference on Literature and Cultural Development 一、大会信息 会议简称&#xff1a;ICLCD 2025 大会地点&#xff1a;中国天津 审稿通知&#xff1a;投稿后2-3日内通知 投稿邮箱&am…

SPL 轻量级多源混算实践 4 - 查询 MongoDB

除了以上常见数据源&#xff0c;还有 NoSQL、MQ 等数据源&#xff0c;其中以 MongoDB 最为常用。我们用 SPL 连接 MongoDB 做计算。 导入 MongoDB 数据。 外部库 SPL 支持的多种数据源大概分两类&#xff0c;一类是像 RDB 有 JDBC 直接使用&#xff0c;或者文件等直接读取&a…

特别篇-产品经理(三)

一、市场与竞品分析—竞品分析 1. 课后总结 案例框架&#xff1a;通过"小新吃蛋糕"案例展示行业分析方法&#xff0c;包含四个关键步骤&#xff1a; 明确目标行业调研确定竞品分析竞争策略输出结论 1&#xff09;行业背景分析方法 PEST分析法&#xff1a;从四个…

Photoshop使用钢笔绘制图形

1、绘制脸部路径 选择钢笔工具&#xff0c;再选择“路径”。 基于两个点绘制一个弯曲的曲线 使用Alt键移动单个点&#xff0c;该点决定了后续的曲线方向 继续绘制第3个点 最后一个点首尾是同一个点&#xff0c;使用钢笔保证是闭合回路。 以同样的方式绘制2个眼睛外框。 使用椭…

EMQX社区版5.8.5集群搭建踩坑记

一、首先要在三台物理机上分别搭建EMQX的实例 正常的安装是很简单的&#xff0c;并且有多种方式&#xff0c;我选取的是tar.gz安装包。 只需要把安装包解压tar -zxvf emqx-5.8.5xxx.tar.gz&#xff0c;然后进入到bin目录下&#xff0c;执行./emqx start即可。 1. 需要考虑操作…

长短期记忆(LSTM)网络模型

一、概述 长短期记忆&#xff08;Long Short-Term Memory&#xff0c;LSTM&#xff09;网络是一种特殊的循环神经网络&#xff08;RNN&#xff09;&#xff0c;专门设计用于解决传统 RNN 在处理长序列数据时面临的梯度消失 / 爆炸问题&#xff0c;能够有效捕捉长距离依赖关系。…

t014-项目申报管理系统 【springBoot 含源码】

项目演示视频 摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理&#xff0c;然而&#xff0c;随着近些年信息技术的迅猛发展&#xff0c;让许多比较老套的信息管理模式进行了更新迭代&#xff0c;项目信息因为其管理内容繁杂&#xff0c;管理数量繁多导致手工进行…

软件评测机构如何保障质量?检测资质、技术实力缺一不可

软件评测机构在保障软件质量上起着关键作用&#xff0c;对软件行业的健康发展极为关键。它们采用专业的技术手段和严格的评估流程&#xff0c;对软件的运行效果、功能等多方面进行细致的审查&#xff0c;为开发者和使用者提供了客观、公正的参考依据。 检测资质正规软件评测机…