- 博客(15)
- 资源 (23)
- 论坛 (1)
- 收藏
- 关注
转载 【基于Android的ARM汇编语言系列】之五:ARM指令集与Thumb指令集
作者:郭嘉邮箱:allenwells@163.com博客:http://blog.csdn.net/allenwellsgithub:https://github.com/AllenWell【基于Android的ARM汇编语言系列】章节列表【基于Android的ARM汇编语言系列】之一:ARM汇编语言开篇【基于Android的ARM汇编语言系列】之二:C/C++程序生成ARM汇编...
2018-12-28 17:38:21
320
转载 【基于Android的ARM汇编语言系列】之四:ARM处理器的寻址方式
作者:郭嘉邮箱:allenwells@163.com博客:http://blog.csdn.net/allenwellsgithub:https://github.com/AllenWell【基于Android的ARM汇编语言系列】章节列表【基于Android的ARM汇编语言系列】之一:ARM汇编语言开篇【基于Android的ARM汇编语言系列】之二:C/C++程序生成ARM汇编...
2018-12-28 17:29:05
162
转载 ARM Neon 简介
---------------------作者:hemmingway来源:CSDN原文:https://blog.csdn.net/hemmingway/article/details/44831459定义“ARM Advanced SIMD”,nick-named“NEON”, it provides:(1)、A set of interesting ...
2018-12-27 19:16:47
1957
转载 一文带你了解ARM的发展历程
转自:一文带你了解ARM的发展历程ARM公司既不生产芯片也不销售芯片,它只出售芯片技术授权。却做到了在手持设备市场上占有90%以上的份额。软银在2016年耗资300多亿美元拿下ARM,使得本来就大红大紫的ARM公司,再一次窜到了业界人士的面前。ARM这家不生产芯片却也能数钱数到手抽筋的公司到底有着怎样的发展史。1978年,CPU公司悄悄在英国剑桥诞生。 这个CPU指的不是电脑里面的CP...
2018-12-27 18:48:57
307
1
转载 什么?!NEON还要优化?
作者:十曰立链接:https://www.jianshu.com/p/16d60ac56249來源:简书官网介绍:NEON宏观介绍 NEON Programmer’s Guide Version: 1.0直观认识NEON整体描述Arm NEON technology is an advanced SIMD (single instruction multiple data...
2018-12-27 11:58:02
1260
转载 NEON 的常见汇编指令与代码对照【基础备忘】
作者:歌神flaming 来源:CSDN 原文:https://blog.csdn.net/u010684585/article/details/78455993 .arm.text .global cost_initcost_init:push {r4-r7}vdup.8 q0,r0 @uvdup.8 q1,r1 @u0vdup.8 q2,r2 @u1vdup.16...
2018-12-24 23:21:18
2206
2
原创 NEON 指令集并行技术优化矩阵旋转【Android】
参考链接:利用neon技术对矩阵旋转进行加速目标:将输入矩阵顺时针旋转90度,如下图所示: 输入矩阵 输出矩阵 以 8x8x8bit 的矩阵(更大的矩阵可以分块为 8x8x8bit)为例,基本的思路就是,逐渐扩大粒度(8bit 到 32bit...
2018-12-24 00:37:45
1513
1
原创 NEON 指令集并行技术优化矩阵转置【Android】
核心代码如下:转置一个 4*4的矩阵,更大的矩阵(不能被4整除的需要特殊处理边界)都可以通过分块来进行转置void transpose32x4x4(float32x4_t *q0, float32x4_t *q1, float32x4_t *q2, float32x4_t *q3) { // -------------------------------------------...
2018-12-23 16:01:55
1339
原创 NEON 指令集并行技术优化彩色图像转灰度图【Android】
参考原文:android平台的neon优化策略Neon Intrinsics各函数介绍目前市面上主流的旗舰android手机搭载的Soc都是64位的CPU,常见的armv7指令集的公版架构如Cortex-A8,Cortex-A9,Cortex-A15,常见的armv8指令集的公版架构如Cortex-A53,Cortex-A57,Cortex-A72,Cortex-A73。arm...
2018-12-22 01:23:13
1293
转载 NEON 指令集【基础备忘】
转自http://blog.sina.com.cn/s/blog_602f87700102wj5w.html作者:Sam (甄峰) sam_code@hotmail.com其他优秀链接:https://blog.csdn.net/hemmingway/article/details/44832013之前在一些ARM CPU下,曾在编译时指定过Neon。0. Neo...
2018-12-21 10:58:49
1225
1
转载 do{...}while(0)的意义和用法
转载自 http://www.spongeliu.com/ linux内核和其他一些开源的代码中,经常会遇到这样的代码:do{ ...}while(0)这样的代码一看就不是一个循环,do..while表面上在这里一点意义都没有,那么为什么要这么用呢?实际上,do{...}while(0)的作用远大于美化你的代码。查了些资料,总结起来这样写主要有以下几点好处:1、辅助定义复...
2018-12-20 14:05:02
115
原创 AVX 指令集并行技术优化中值滤波
利用 AVX 向量化技术优化的中值滤波代码和注释如下:void medianFilterAVX(int height, int width, unsigned char *__restrict src, unsigned char *__restrict dst){ // 注意是从 1 开始 for(int i = 1; i < height - 1; i++) ...
2018-12-15 19:24:14
283
原创 AVX 指令集并行技术优化积分计算圆周率 π
通过 AVX 指令集并行技术优化积分计算圆周率 π完整代码和解释如下// AVX_PI.cpp : 定义控制台应用程序的入口点。//#include "stdafx.h"#include <iostream>#include <immintrin.h>#include <time.h>#include "timer.h"double...
2018-12-15 18:31:58
432
转载 Why GEMM is at the heart of deep learning
转自 https://petewarden.com/2015/04/20/why-gemm-is-at-the-heart-of-deep-learning/
2018-12-11 19:10:03
139
原创 cublasSgemm函数的使用笔记
实际的运算为C^T=alpha*B^T*A^T+beta*C^T由于C^T的存储也是按列的,所以计算结果取出来刚好等于 C,可以省去转置的步骤。注:maxtrix_size.uiWB 表示,B^T 的行数、C^T的行数maxtrix_size.uiHA表示,A^T 的列数maxtrix_size.uiWA表示,B^T 的列数、A^T的行数相关函数和参数说明:...
2018-12-11 18:35:28
762
纹理合成 C++ 代码
2020-12-10
编译过的Cartoonifier_Android工程
2013-08-21
精通Android增强现实源码
2013-01-21
Pro Android Augmanted Reality
2013-01-21
YAFFplayer 0.3.0.0【Linux64】
2020-08-07
YAFFplayer 0.3.0 【Win64】
2020-08-07
matplotlib-cpp 源码.zip
2020-02-06
2D 折线顶点平滑算法
2020-01-14
OpenCV310 Cmake
2016-10-17
panda1234lee的留言板
发表于 2020-01-02 最后回复 2020-04-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝