只写了最简单的方式,其中b需要是列向量,用分号隔开元素;
Ax = b
其中矩阵A(nxn) 和列向量 b(n) 已知;方程组的解存储在 x中,在matlab中写作:
> x=A\b
octave:7> A=[1,2; 1.0001, 2;]
A =
1.0000 2.0000
1.0001 2.0000
octave:8> b=[3; 3.0001;]
b =
3.0000
3.0001
octave:9> x=A\b
x =
1.0000
1.0000
octave:10> b-A*x
ans =
0
0
octave:11>
迭代法的原理,是创建一个n维的无穷项的收敛数列,收敛的极限点 x 满足方程 Ax = b ;
使用矩阵A来制造收敛数列,有一些技巧,这里的示例由于 A 是严格主元占优的,所以比较容易制造收敛,直接挖掉了对角元;
详细原理可以参考数值计算教材,用到了矩阵的诱导范数、谱半径等相关的定理,并不复杂;
这里为了表述原理,我采用了矩阵语言的算法实现,大概原理如下,原理写的不太规范,凑活着跳过即可:
/********************************
*
* ******Ax = b*********
* x = Bx + f
* x = -D'(L+U)x + D'b
*
* Dx = b - (L+U)x
* ***********************下面是迭代过程
* X1=(L+U) * X0
* X1=b-X1
* Dx = X1 ***(这里D是对角阵,所以直接做标量除法即可得到x)
* x = D^-1 * X1
* X0 = x
*
* ******************************/
矩阵语言的实现有两个好处,一个是便于传统的理论分析,比如收敛性分析等,另一个好处是有利于 gpu并行实现;
这里给出最简单的 Jacobi 迭代法求 Ax=b 的解;
gcc 直接编译即可运行;
jacobi.cpp
源码:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define NA 3
void test_sgemv(int op, int N, float a, float *AA, int lda, float b, float *yy);
void sgemv(int op, int N, float a, float *A, int lda, float b, float *y); // y = a*op(A)*X + b*y
void print_matrix(float *A, int N, int lda);
void print_vector(float *V, int N);
void set_LpU(float *LpU, float *A, int N);
void set_D(float *D, float *A, int N);
void Saxpy(int n, float alpha, float *x, float beta, float *y); //y = a*x + b*y
void x_div_y(int N, float* x, float* y);//x[i] = x[i]/y[i];
void Scopy(int n, float* x, float* y);// x -> y
void Saxpy(int n, float alpha, float *x, float beta, float *y) //y = a*x + b*y
{
for(int i=0; i<n; i++){
y[i] = alpha*x[i] + beta*y[i];
}
}
void x_div_y(int N, float* x, float* y){//x[i] = x[i]/y[i];
for(int i=0; i<N; i++)
x[i] = x[i]/y[i];
}
void Scopy(int n, float* x, float* y)// x -> y
{
for(int i=0; i<n; i++)
y[i] = x[i];
}
void Jacobi_Ax_b(float *A, float *b, float *X0, float *Xk, int N, float eps, int iter){
float *LpU = nullptr;
//float *X0 = nullptr;
//float *X1 = nullptr;
float *D = nullptr;
LpU = (float*)malloc( N*N*sizeof(float));
//X0 = (float*)malloc( N*sizeof(float));
//X1 = (float*)malloc( N*sizeof(float));
D = (float*)malloc( N*sizeof(float));
//1.0 set LpU, set D, X0 = 0;
set_LpU(LpU, A, N); printf("LpU =\n"); print_matrix(LpU, N, N);
set_D(D, A, N); printf("D =\n"); print_vector(D, N);
memset(X0, 0, N*sizeof(float)); printf("X0 =\n"); print_vector(Xk, N);
//2.0 loop
/* S1 X1=LU* x0
* S2 X1=b-X1
* S3 Dx = X1
* S4 X1 = X1/D
*/
for(int it=0; it<iter; it++){
//void sgemv(int op, int N, float a, float *A, int lda, float b, float *y);
// S1 X1=LU* X0
sgemv(0, N, 1.0f, LpU, N, 0.0f, Xk);
//void Saxpy(int n, float alpha, float *x, float beta, float *y); //y = a*x + b*y
// S2 X1=b-X1
Saxpy(N, 1.0f, b, -1.0f, Xk);
//void x_div_y(int N, float* x, float* y){//x[i] = x[i]/y[i];
// S3 DXk+1 = Xk
x_div_y(N, Xk, D);
}
//Scopy(N, X1, xk);
}
void set_LpU(float *LpU, float *A, int N){
for(int i=0; i<N; i++){
for(int j=0; j<N; j++){
LpU[i + j*N] = A[i + j*N];
if(i == j)
LpU[i+i*N] = 0.0f;
}
}
}
void set_D(float *D, float *A, int N){
for(int i=0; i<N; i++)
D[i] = A[i + i*N];
}
void sgemv(int op, int N, float a, float *A, int lda, float b, float *y){
// y = a*op(A)*X + b*y
float* y0 = nullptr;
y0 = (float*)malloc(N*sizeof(float));
memcpy(y0, y, N*sizeof(float));
for(int i=0; i<N; i++){
float sigma = 0.0f;
for(int j=0; j<N; j++){
sigma += A[i + j*lda]*y0[j];
}
y[i] = a*sigma + b*y[i];
}
free(y0);
}
void print_matrix(float *A, int N, int lda){
printf("\n");
for(int i=0; i<N; i++){
for(int j=0; j<N; j++){
printf("%8.3f ", A[i + j*lda]);
}
printf("\n");
}
printf("\n");
}
void print_vector(float *V, int N){
printf("\n");
for(int i=0; i<N; i++){
printf("%f ", V[i]);
}
printf("\n");
}
//void sgemv(int op, int N, float a, float *A, int lda, float b, float *y){
void test_sgemv(int op, int N, float a, float *AA, int lda, float b, float *yy){
float *y = nullptr;
float *A = nullptr;
y = (float*)malloc(N*sizeof(float));
A = (float*)malloc(N*N*sizeof(float));
memcpy(y, yy, N*sizeof(float));
memcpy(A, AA, N*N*sizeof(float));
printf("\nA =\n");
print_matrix(A, N, N);
printf("\ny =\n");
print_vector(y, N);
sgemv(1, N, a, A, lda, b, y);
printf("\n y=Ax+y=\n");
print_vector(y, N);
free(y);
free(A);
}
int main(){
float A[NA*NA] =
{
10, -1, -1, -1, 10, -1, -2, -2, 5
// 10, 2, 1, 3, -10, 3, 1, 3, 10// column major
/*
10, 3, 1,
2, -10, 3,
1, 3, 10*/
};
float b[NA]={
7.2, 8.3, 4.2
//14, -5, 14
};
// void test_sgemv(int op, int N, float a, float *AA, int lda, float b, float *yy){
//test_sgemv(1, NA, 1.0f, A, NA, 1.0f, b);
float* Ah = nullptr;
float* bh = nullptr;
int N = NA;
Ah = (float*)malloc(N*N*sizeof(float));
bh = (float*)malloc(N*sizeof(float));
memcpy(Ah, A, N*N*sizeof(float));
memcpy(bh, b, N*sizeof(float));
printf("Ah =\n");
print_matrix(Ah, N, N);
float *x0 = nullptr;
float *x1 = nullptr;
x0 = (float*)malloc(N*sizeof(float));
x1 = (float*)malloc(N*sizeof(float));
float eps = 1.0e-7;
int iter = 15;
Jacobi_Ax_b(Ah, bh, x0, x1, N, eps, iter);
print_vector(x1, N);
return 0;
}
编译:
Makefile
Jacobi: hello_Jacobi.cpp
g++ -g $< -o $@
.PHONY: clean
clean:
-rm -rf Jacobi
絮叨地提示一下,g++ 行的前面是一个 tab空格,Makefile的语法要求,-rm 前面也是;
运行:
文章浏览阅读3.4k次,点赞8次,收藏42次。一、什么是内部类?or 内部类的概念内部类是定义在另一个类中的类;下面类TestB是类TestA的内部类。即内部类对象引用了实例化该内部对象的外围类对象。public class TestA{ class TestB {}}二、 为什么需要内部类?or 内部类有什么作用?1、 内部类方法可以访问该类定义所在的作用域中的数据,包括私有数据。2、内部类可以对同一个包中的其他类隐藏起来。3、 当想要定义一个回调函数且不想编写大量代码时,使用匿名内部类比较便捷。三、 内部类的分类成员内部_成员内部类和局部内部类的区别
文章浏览阅读118次。分布式系统要求拆分分布式思想的实质搭配要求分布式系统要求按照某些特定的规则将项目进行拆分。如果将一个项目的所有模板功能都写到一起,当某个模块出现问题时将直接导致整个服务器出现问题。拆分按照业务拆分为不同的服务器,有效的降低系统架构的耦合性在业务拆分的基础上可按照代码层级进行拆分(view、controller、service、pojo)分布式思想的实质分布式思想的实质是为了系统的..._分布式系统运维工具
文章浏览阅读174次。1.数据源准备2.数据处理step1:数据表处理应用函数:①VLOOKUP函数; ② CONCATENATE函数终表:step2:数据透视表统计分析(1) 透视表汇总不同渠道用户数, 金额(2)透视表汇总不同日期购买用户数,金额(3)透视表汇总不同用户购买订单数,金额step3:讲第二步结果可视化, 比如, 柱形图(1)不同渠道用户数, 金额(2)不同日期..._exce l趋势分析数据量
文章浏览阅读3.3k次。堡垒机可以为企业实现服务器、网络设备、数据库、安全设备等的集中管控和安全可靠运行,帮助IT运维人员提高工作效率。通俗来说,就是用来控制哪些人可以登录哪些资产(事先防范和事中控制),以及录像记录登录资产后做了什么事情(事后溯源)。由于堡垒机内部保存着企业所有的设备资产和权限关系,是企业内部信息安全的重要一环。但目前出现的以下问题产生了很大安全隐患:密码设置过于简单,容易被暴力破解;为方便记忆,设置统一的密码,一旦单点被破,极易引发全面危机。在单一的静态密码验证机制下,登录密码是堡垒机安全的唯一_horizon宁盾双因素配置
文章浏览阅读7.7k次,点赞4次,收藏16次。Chrome作为一款挺不错的浏览器,其有着诸多的优良特性,并且支持跨平台。其支持(Windows、Linux、Mac OS X、BSD、Android),在绝大多数情况下,其的安装都很简单,但有时会由于网络原因,无法安装,所以在这里总结下Chrome的安装。Windows下的安装:在线安装:离线安装:Linux下的安装:在线安装:离线安装:..._chrome linux debian离线安装依赖
文章浏览阅读153次。中国发达城市榜单每天都在刷新,但无非是北上广轮流坐庄。北京拥有最顶尖的文化资源,上海是“摩登”的国际化大都市,广州是活力四射的千年商都。GDP和发展潜力是衡量城市的数字指...
文章浏览阅读3.3k次。前言spark在java使用比较少,多是scala的用法,我这里介绍一下我在项目中使用的代码配置详细算法的使用请点击我主页列表查看版本jar版本说明spark3.0.1scala2.12这个版本注意和spark版本对应,只是为了引jar包springboot版本2.3.2.RELEASEmaven<!-- spark --> <dependency> <gro_使用java调用spark注册进去的程序
文章浏览阅读4.8k次。汽车零部件开发工具巨头V公司全套bootloader中UDS协议栈源代码,自己完成底层外设驱动开发后,集成即可使用,代码精简高效,大厂出品有量产保证。:139800617636213023darcy169_uds协议栈 源代码
文章浏览阅读4.6k次,点赞20次,收藏148次。AUTOSAR基础篇之OS(下)前言首先,请问大家几个小小的问题,你清楚:你知道多核OS在什么场景下使用吗?多核系统OS又是如何协同启动或者关闭的呢?AUTOSAR OS存在哪些功能安全等方面的要求呢?多核OS之间的启动关闭与单核相比又存在哪些异同呢?。。。。。。今天,我们来一起探索并回答这些问题。为了便于大家理解,以下是本文的主题大纲:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JCXrdI0k-1636287756923)(https://gite_autosar 定义了 5 种多核支持类型
文章浏览阅读2.2k次,点赞6次,收藏14次。原因:自己写的头文件没有被加入到方案的包含目录中去,无法被检索到,也就无法打开。将自己写的头文件都放入header files。然后在VS界面上,右键方案名,点击属性。将自己头文件夹的目录添加进去。_vs2013打不开自己定义的头文件
文章浏览阅读3.3w次,点赞80次,收藏342次。此时,可以将系统中所有用户的 Session 数据全部保存到 Redis 中,用户在提交新的请求后,系统先从Redis 中查找相应的Session 数据,如果存在,则再进行相关操作,否则跳转到登录页面。此时,可以将系统中所有用户的 Session 数据全部保存到 Redis 中,用户在提交新的请求后,系统先从Redis 中查找相应的Session 数据,如果存在,则再进行相关操作,否则跳转到登录页面。当数据量很大时,count 的数量的指定可能会不起作用,Redis 会自动调整每次的遍历数目。_redis命令
文章浏览阅读449次,点赞3次,收藏3次。URP的设计目标是在保持高性能的同时,提供更多的渲染功能和自定义选项。与普通项目相比,会多出Presets文件夹,里面包含着一些设置,包括本色,声音,法线,贴图等设置。全局只有主光源和附加光源,主光源只支持平行光,附加光源数量有限制,主光源和附加光源在一次Pass中可以一起着色。URP:全局只有主光源和附加光源,主光源只支持平行光,附加光源数量有限制,一次Pass可以计算多个光源。可编程渲染管线:渲染策略是可以供程序员定制的,可以定制的有:光照计算和光源,深度测试,摄像机光照烘焙,后期处理策略等等。_urp渲染管线