百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

SQL查询中笛卡尔积的巧妙使用

yuyutoo 2025-02-06 16:56 4 浏览 0 评论

本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。

笛卡尔积,又叫cross join,是SQL中两表连接的一种方式。

假如A表中的数据为m行,B表中的数据有n行,那么A和B做笛卡尔积,结果为m*n行。

笛卡尔积的写法为:

select?*
from?A,B

或者

select?*?
from?A?
cross?join?B

通常我们都要在实际SQL中避免直接使用笛卡尔积,因为它会使“数据爆炸”,尤其是数据量很大的时候。但某些时候,巧妙的使用笛卡尔积,反而能快速帮助我们解决实际问题。下面看几个例子。

with as的用法

在此之前,我们先看一下with as 的用法。

with?tmp?as
(
????select?*?from?class
)

select?*?from?tmp

上面的写法先执行select * from class定义(生成)了一个中间表tmp,然后使用了tmp这个中间表。通常可以用来将固定的查询抽取出来,只查一次,多次使用,从而提高效率。也可以和union all结合起来构造数据供测试使用,在本文接下来的部分会看到后面场景的这种用法。关于with as的一些要点和注意事项可以参考下面的链接:

https://blog.csdn.net/baidu_30527569/article/details/48680745

例子1-产生顺序值:查询当日每小时的收入数据,未产生收入的置为0

假设有一张收入表,每过一个小时,就自动更新上一小时的收入数据。但我们希望对于未更新的时间收入值显示为0。这样能更好的体现完整性,也便于进行多天数据的对比。如下图所示:

对于收入非0的小时,我们可以从收入表中直接查询出当小时的收入数据。收入表结构如下(假设当前收入数据只更新到16点):

查询的SQL为:

select?dt,?hour,?income
from?t_h_income
where?day?=?'2020-04-19'

显然,得到的结果不会包含17点及以后的时间。我们可以采用笛卡尔积构造一个小时序列,如下面代码所示:

with?t_hour?as?(
select?'00'?as?dhour
union?all?
select?'01'?as?dhour
union?all?
select?'02'?as?dhour
union?all?
select?'03'?as?dhour
union?all?
select?'04'?as?dhour
union?all?
select?'05'?as?dhour
union?all?
select?'06'?as?dhour
union?all?
select?'07'?as?dhour
union?all?
select?'08'?as?dhour
union?all?
select?'09'?as?dhour
union?all?
select?'10'?as?dhour
union?all?
select?'11'?as?dhour
union?all?
select?'12'?as?dhour
union?all?
select?'13'?as?dhour
union?all?
select?'14'?as?dhour
union?all?
select?'15'?as?dhour
union?all?
select?'16'?as?dhour
union?all?
select?'17'?as?dhour
union?all?
select?'18'?as?dhour
union?all?
select?'19'?as?dhour
union?all?
select?'20'?as?dhour
union?all?
select?'21'?as?dhour
union?all?
select?'22'?as?dhour
union?all?
select?'23'?as?dhour
),t_day?as?
(
select?'2020-04-19'?as?dt
)
select?*?
from?t_day,?t_hour

得到的结果如下,生成了这一天每个小时的结构。

将上面的结果与原来的数据左关联,关联不上的置为0,即可得到想要的结果。代码如下:

with?t_hour?as?(
select?'00'?as?dhour
union?all?
select?'01'?as?dhour
union?all?
select?'02'?as?dhour
union?all?
select?'03'?as?dhour
union?all?
select?'04'?as?dhour
union?all?
select?'05'?as?dhour
union?all?
select?'06'?as?dhour
union?all?
select?'07'?as?dhour
union?all?
select?'08'?as?dhour
union?all?
select?'09'?as?dhour
union?all?
select?'10'?as?dhour
union?all?
select?'11'?as?dhour
union?all?
select?'12'?as?dhour
union?all?
select?'13'?as?dhour
union?all?
select?'14'?as?dhour
union?all?
select?'15'?as?dhour
union?all?
select?'16'?as?dhour
union?all?
select?'17'?as?dhour
union?all?
select?'18'?as?dhour
union?all?
select?'19'?as?dhour
union?all?
select?'20'?as?dhour
union?all?
select?'21'?as?dhour
union?all?
select?'22'?as?dhour
union?all?
select?'23'?as?dhour
),t_day?as?
(
select?'2020-04-19'?as?dt
)

select?*?
from?t_day,?t_hour

select?a.dt,?a.dhour,?case?when?b.income?is?null?then?0?else?b.income?end?as?income
from
(
select?dt,?dhour
from?t_day,?t_hour
)?a?
left?join?
t_h_income?b
on?a.dt?=?b.dt?and?a.dhour?=?b.hour

通过手动构造dt和dhour,用笛卡尔积产生了一个“序列”。而对于dhour的构造,也可以采用笛卡尔积的方式,但需要注意限制范围不大于23,代码如下:

with?t_hour?as?
(
select?'0'?as?id
union?all?
select?'1'?as?id
union?all?
select?'2'?as?id?
),
f_hour?as?(
select?'0'?as?id
union?all?
select?'1'?as?id
union?all?
select?'2'?as?id
union?all?
select?'3'?as?id
union?all?
select?'4'?as?id
union?all?
select?'5'?as?id
union?all?
select?'6'?as?id
union?all?
select?'7'?as?id
union?all?
select?'8'?as?id
union?all?
select?'9'?as?id
)

select?concat(a.id,?b.id)?hour
from?t_hour?a,?f_hour?b
where?concat(a.id,?b.id)?<=?'23'
order?by?hour

以上我们都主要使用了笛卡尔积产生顺序值的场景,类似的可以构造从00~99的数字,构造之后也可以根据实际需要加入新的限制条件。

例子2-模拟循环:遍历字符串,每行按顺序输出一个字符

注:例子来源于《SQL Cookbook》第6章,经过自己的修改。

问题:考虑用SQL实现:将表emp中name为KING的字符串显示为4行,每行包含其中一个字符。

这里需要笛卡尔积配合字符串截取函数来实现。要实现逐一访问字符串,需要有一个中间表,存储序列值,类似于前面提到的序列。我们看下下面的代码:

with?t5?as?
(
select?1?as?pos
union?all?
select?2?as?pos?
union?all
select?3?as?pos?
union?all
select?4?as?pos?
union?all
select?5?as?pos?
),
emp?as?
(
select?'KING'?as?name
)

select?*
from?emp,?t5

得到的结果如下图所示:

考虑到字符串截取函数能够按位置截取。正好可以用上生成的pos。代码如下:

with?t5?as?
(
select?1?as?pos
union?all?
select?2?as?pos?
union?all
select?3?as?pos?
union?all
select?4?as?pos?
union?all
select?5?as?pos?
),
emp?as?
(
select?'KING'?as?name
)

select?substr(name,?pos,?1)
from?emp,?t5
where?t5.pos?<=?length(emp.name)

可以看到使用了pos,就能够“循环”地截取字符串了。需要注意where里加上了循环跳出的条件,这也比较好理解:不能截取超过字符串长度的字符。

还可以按照需要调整遍历时输出的格式,如下面代码和结果所示:

select?
substr(name,?pos)?char_name1,
substr(name,?length(name)-pos+1)?char_name1
from?emp,?t5
where?t5.pos?<=?length(emp.name)

这个例子中我们利用笛卡尔积模拟循环,对字符串进行了遍历。

小结

本文首先学习了with as的用法,然后通过例子总结了两个巧妙使用笛卡尔积的场景:生成序列和模拟循环。虽然在实际中可能用的不是很多,但也体现出了SQL的灵活性。生成序列可以更广义的理解为:需要产生两个表中字段的任意组合,这两个字段可能是没有实际联系的。可以参考下面链接中关于每个班级血型的例子,核心思想也是这个。

https://blog.csdn.net/xiaolinyouni/article/details/6943337

实际中应该有很多类似的场景。

而模拟循环是笛卡尔积结合了字符串截取函数实现的,本质上还是“组合”。下次再遇到类似场景的时候,可以考虑下笛卡尔积能否实现。

除此以外《SQL Cookbook》中也提到了笛卡尔积可以用于结果转置~有机会我们以后再来学习。本文代码不是很复杂,后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。

相关推荐

.NET 奇葩问题调试经历之3——使用了grpc通讯类库后,内存一直增长......

...

全局和隐式 using 指令详解(全局命令)

1.什么是全局和隐式using?在.NET6及更高版本中,Microsoft引入了...

请停止微服务,做好单体的模块化才是王道:Spring Modulith介绍

1、介绍模块化单体是一种架构风格,代码是根据模块的概念构成的。对于许多组织而言,模块化单体可能是一个很好的选择。它有助于保持一定程度的独立性,这有助于我们在需要的时候轻松过渡到微服务架构。Spri...

ASP.NET程序集引用之痛:版本冲突、依赖地狱等解析与实战

我是一位多年后端经验的工程师,其中前几年用ASP.NET...

.NET AOT 详解(.net 6 aot)

简介AOT(Ahead-Of-TimeCompilation)是一种将代码直接编译为机器码的技术,与传统的...

一款基于Yii2开发的免费商城系统(一款基于yii2开发的免费商城系统是什么)

哈喽,我是老鱼,一名致力于在技术道路上的终身学习者、实践者、分享者!...

asar归档解包(游戏arc文件解包)

要学习Electron逆向,首先要有一个Electron开发的程序的发布的包,这里就以其官方的electron-quick-start作为例子来进行一下逆向的过程。...

在PyCharm 中免费集成Amazon CodeWhisperer

CodeWhisperer是Amazon发布的一款免费的AI编程辅助小工具,可在你的集成开发环境(IDE)中生成实时单行或全函数代码建议,帮助你快速构建软件。简单来说,AmazonCodeWhi...

2014年最优秀JavaScript编辑器大盘点

1.WebstormWebStorm是一种轻量级的、功能强大的IDE,为Node.js复杂的客户端开发和服务器端开发提供完美的解决方案。WebStorm的智能代码编辑器支持JavaScript,...

基于springboot、tio、oauth2.0前端vuede 超轻量级聊天软件分享

项目简介:基于JS的超轻量级聊天软件。前端:vue、iview、electron实现的PC桌面版聊天程序,主要适用于私有云项目内部聊天,企业内部管理通讯等功能,主要通讯协议websocket。支持...

JetBrains Toolbox推出全新产品订阅授权模式

捷克知名软件开发公司JetBrains最为人所熟知的产品是Java编程语言开发撰写时所用的集成开发环境IntelliJIDEA,相信很多开发者都有所了解。而近期自2015年11月2日起,JetBr...

idea最新激活jetbrains-agent.jar包,亲测有效

这里分享一个2019.3.3版本的jetbrains-agent.jar,亲测有效,在网上找了很多都不能使用,终于找到一个可以使用的了,这里分享一下具体激活步骤,此方法适用于Jebrains家所有产品...

CountDownTimer的理解(countdowntomars)

CountDownTimer是android开发常用的计时类,按照注释中的说明使用方法如下:kotlin:object:CountDownTimer(30000,1000){...

反射为什么性能会很慢?(反射时为什么会越来越长)

1.背景前段时间维护一个5、6年前的项目,项目总是在某些功能使用上不尽人意,性能上总是差一些,仔细过了一下代码发现使用了不少封装好的工具类,工具类里面用了好多的反射,反射会影响到执行效率吗?盲猜了一...

btrace 开源!基于 Systrace 高性能 Trace 工具

介绍btrace(又名RheaTrace)是抖音基础技术团队自研的一款高性能AndroidTrace工具,它基于Systrace实现,并针对Systrace不足之处加以改进,核心改进...

取消回复欢迎 发表评论: