跳到主要内容

优化不必要连接

使用方法

基本概念

在Jimmer SQL DSL 中,被创建的join对象,如果不被使用将会被忽略。例如

BookTable table = Tables.BOOK_TABLE;

System.out.println("Unused join: " + table.store());

List<Book> books = sqlClient
.createQuery(table)
.orderBy(table.name().asc(), table.edition().desc())
.select(table)
.execute();

虽然通过table.store创建了一个JOIN对象,但是,该对象并没有被当前查询的SQL DSL使用,这种情绪下,该JOIN对象会被忽略。

因此,最终生成的SQL不会包含任何JOIN操作

select 
tb_1_.ID,
tb_1_.NAME,
tb_1_.EDITION,
tb_1_.PRICE,
tb_1_.STORE_ID
from BOOK as tb_1_
where tb_1_.NAME = ?

另外一种解决方案

中,我们列举了两个场景。

上一篇文档中,我们讨论了利用Jimmer SQL DSL自动合并冲突连接的特性解决这两个场景的问题。

这里,我们换用另外一种方式来解决相同的问题。

  • 解决场景1的问题

    List<Book> findBooks(
    @Nullable String name,
    @Nullable String storeName,
    @Nullable String storeWebsite
    ) {
    BookTable table = Tables.BOOK_TABLE;

    // 先无条件建立JOIN对象,若未被后续代码使用,
    // 则被自动忽略。因此,此举不会导致无用JOIN
    BookStoreTable store = table.store();

    return sql()
    .createQuery(table)
    .whereIf(
    name != null,
    () -> book.name().like(name)
    )
    .whereIf(
    storeName != null,
    () -> store .name().like(storeName)
    )
    .whereIf(
    storeWebsite != null,
    () -> store.website().like(storeWebsite)
    )
    .select(book)
    .execute();
    }
    • 如果仅指定name,不指定storeNamestoreWebsite,那么store就是一个创建后却不被使用的join对象,因此被忽略。最终生成的SQL不包含任何join操作。

      select 
      tb_1_.ID,
      tb_1_.NAME,
      tb_1_.EDITION,
      tb_1_.PRICE,
      tb_1_.STORE_ID
      from BOOK as tb_1_
      where tb_1_.NAME = ?
    • 如果指定storeNamestoreWebsitestore就会被使用,从而导致最终生成SQL包含join操作。这很明显,此处不用示范。

  • 解决场景2的问题

    List<Long> findDistinctIds(
    @Nullable Long aId,
    @Nullable Long bId,
    @Nullable Long cId,
    @Nullable Long dId,
    @Nullable Long eId
    ) {
    ATable table = Tables.A_TABLE;

    // 先无条件建立JOIN对象,若未被后续代码使用,
    // 则被自动忽略。因此,此举不会导致无用JOIN
    BTableEx b = table.asTableEx().bs();
    CTableEx c = b.cs();
    DTableEx d = c.ds();
    DTableEx e = d.es();

    return sqlClient
    .createQuery(table)
    .whereIf(
    aId != null,
    () -> table.id().like(aId)
    )
    .whereIf(
    bId != null,
    () -> b.id().like(bId)
    )
    .whereIf(
    cId != null,
    () -> c.id().like(cId)
    )
    .whereIf(
    dId != null,
    () -> d.id().like(dId)
    )
    .whereIf(
    eId != null,
    () -> e.id().like(eId)
    )
    .select(book.id())
    .distinct()
    .execute();
    }
    信息
    • 有了前面的基础,这里不再需要罗列不同的参数组合下会生成何种SQL。明白无论如何最终SQL都不会包含无用连接操作即可。

    • 某个JOIN对象被SQL DSL使用时,会将它标记成“被使用”以防止它被忽略。这种标记具备传递性。

      例如:将d标记成“被使用”,自然也会标记cbtable

    • 这里的asTableEx (以及Java下的各种TableEx类型) 是后续文档分页安全性要介绍的概念。这里,请读者先忽略它。

幻连接

判断关联id的两种方法

对于基于外键的关联而言,有如下两种办法对关联id进行筛查:

  1. 直接使用外键属性

    BookTable book = Tables.BOOK_TABLE;

    List<Book> books = sqlClient
    .createQuery(book)
    .where(
    book
    .storeId()
    .eq(2L)
    )
    .select(book)
    .execute();
    提示

    对于一对一/多对一关联而言 *(这个例子的Book.store)而言, *即使用户不为Book实体声明@IdView属性, SQL DSL中也可以使用storeId属性。

  2. 先通过join操作连接到关联对象,再访问id属性

    BookTable book = Tables.BOOK_TABLE;

    List<Book> books = sqlClient
    .createQuery(book)
    .where(
    book
    .store()
    .id() // 只访问id
    .eq(2L)
    )
    .select(book)
    .execute();
  • 这两种方法,并不等价

    1. where(table.storeId().eq(2L)):简单地根据当前表的外键字段进行过滤。

    2. where(table.store().id().eq(2L)):真正先连接到关联表,再判断关联id的值。

    二者不等价,是因为存在以下的情况

    • 如果外键是假的,即数据中没有相应的外键约束。这会导致非null的伪外键无法通过连接获取非null的关联对象。

    • 如果关联对象受全局过滤器影响,即使数据库中存在关联对象,也应该视而不见。

  • 然而,当以下所有条件同时满足时,上述两种方法是完全等价的。

    此时,关联对象的id,其实就是当前表的外键,二者等价。

信息

开发人员应该明白这两种方法的差异,按照业务需求选择正确的方式。

然而,当两种方法等价时,自动将第二种方法优化成第一种方法是一件非常划算的事,这就叫做幻连接优化。

两种查询方法等价,是幻连接优化能生效的必要条件,下文不再重复。

不适用的场景

幻连接优化仅针对对关联对象的id属性的访问,不支持其他属性。

这里,以关联对象的name属性为例,来演示无法去掉join。

BookTable book = Tables.BOOK_TABLE;

List<Book> books = sqlClient
.createQuery(book)
.where(book.store().name().eq("MANNING"))
.select(book)
.execute();

生成的SQL如下:

select 
tb_1_.ID,
tb_1_.NAME,
tb_1_.EDITION,
tb_1_.PRICE,
tb_1_.STORE_ID
from BOOK as tb_1_
inner join BOOK_STORE as tb_2_
on tb_1_.STORE_ID = tb_2_.ID
where
tb_2_.NAME = ?

适用的场景

如果仅访问关联对象的id属性,则能启动幻连接优化。例如:

BookTable book = Tables.BOOK_TABLE;

List<Book> books = sqlClient
.createQuery(book)
.where(
book
.store()
.id() // 只访问id
.eq(2L)
)
.select(book)
.execute();

这次,生成的SQL如下:

select 
tb_1_.ID,
tb_1_.NAME,
tb_1_.EDITION,
tb_1_.PRICE,
tb_1_.STORE_ID
from BOOK as tb_1_
where tb_1_.STORE_ID = ?

我们没有在SQL中看到任何表连接,我们只看到条件一个基于外键的判断条件tb_1_.STORE_ID = ?

原因:对于基于外键映射的多对一关联而言,父表的id其实就是子表自己的外键。

半连接

半连接是一个和幻象连接类似的概念,但用于基于中间表的关联。

判断关联id的两种方法

对于基于中间表的关联而言,有如下两种办法对关联id进行筛查:

  1. 判断中间表中的外键字段

    BookTable book = Tables.BOOK_TABLE;

    List<Book> books = sqlClient
    .createQuery(book)
    .where(
    book
    .asTableEx()
    .authorIds()
    .eq(2L)
    )
    .select(book)
    .execute();
    备注

    例子中的asTableEx,并无实质性的功能,将会在下一篇文档分页安全性中做介绍。这里,请读者先忽略它。

    警告

    对于一对多/多对多关联而言 *(这个例子的Book.authors)而言, *用户必须Book实体声明@IdView属性, 否则无法在SQL DSL中访问使用authorIds属性。

  2. 先通过join操作连接到关联对象,再访问id属性

    BookTable book = Tables.BOOK_TABLE;

    List<Book> books = sqlClient
    .createQuery(book)
    .where(
    book
    .asTableEx()
    .authors()
    .id() // 只访问id
    .eq(2L)
    )
    .select(book)
    .execute();
    备注

    例子中的asTableEx,并无实质性的功能,将会在下一篇文档分页安全性中做介绍。这里,请读者先忽略它。

  • 这两种方法,并不等价

    1. where(table.authorIds().eq(2L)):一次JOIN操作

      从当前表BOOK,通过join操作拿到BOOK_AUTHOR_MAPPING表,直接判断BOOK_AUTHOR_MAPPING.AUTHOR_ID字段。

    2. where(table.authors().id().eq(2L)):两次JOIN操作

      • 基于当前表BOOK,通过join操作拿到BOOK_AUTHOR_MAPPING中间表

      • 基于中间表BOOK_AUTHOR_MAPPING,通过join操作拿到AUTHOR

      最后,判断AUTHOR.ID字段。

    二者不等价,是因为存在以下的情况

    • 如果外键BOOK_AUTHOR_MAPPING.AUTHOR_ID是假的,即数据中没有相应的外键约束。这会导致非null的伪外键无法通过连接获取非null的关联对象。

    • 如果关联对象受全局过滤器影响,即使数据库中存在关联对象,也应该视而不见。

  • 然而,当以下所有条件同时满足时,上述两种方法是完全等价的。

    此时,关联对象的id,其实就是当前表的外键,二者等价。

信息

开发人员应该明白这两种方法的差异,按照业务需求选择正确的方式。

然而,当两种方法等价时,自动将第二种方法优化成第一种方法是一件非常划算的事,这就叫做半连接优化。

两种查询方法等价,是半连接优化能生效的必要条件,下文不再重复。

不适用的场景

半连接优化仅针对对关联对象的id属性的访问,不支持其他属性。

这里,以关联对象的Author.firstName属性为例,来演示无法去掉第二个join。

BookTable book = Tables.BOOK_TABLE;

List<Long> bookIds = sqlClient
.createQuery(book)
.where(
book
.asTableEx()
.authors()
.firstName()
.eq("Alex")
)
.select(book.id())
.distinct()
.execute();
备注

这里的asTableEx (以及Java下的各种TableEx类型) 是后续文档分页安全性要介绍的概念。这里,请读者先忽略它。

生成的SQL如下:

select 
distinct tb_1_.ID
from BOOK as tb_1_
inner join BOOK_AUTHOR_MAPPING as tb_2_
on tb_1_.ID = tb_2_.BOOK_ID
inner join AUTHOR as tb_3_ on
tb_2_.AUTHOR_ID = tb_3_.ID
where tb_3_.FIRST_NAME = ?

我们看到基于中间表的连接会产生两个SQL JOIN子句

  • 第一步:连接到中间表 inner join BOOK_AUTHOR_MAPPING as tb_2_ on tb_1_.ID = tb_2_.BOOK_ID

  • 第二步:连接到目标表 inner join AUTHOR as tb_3_ on tb_2_.AUTHOR_ID = tb_3_.ID

适用的场景

如果仅访问关联对象的id属性,则能启动半连接优化。例如:

BookTable book = Tables.BOOK_TABLE;

List<Long> bookIds = sqlClient
.createQuery(book)
.where(
book
.asTableEx()
.authors()
.id() // 只访问id
.eq(2L)
)
.select(book.id())
.distinct()
.execute();
备注

例子中的asTableEx,并无实质性的功能,将会在下一篇文档分页安全性中做介绍。这里,请读者先忽略它。

这次,生成的SQL如下:

select 
distinct tb_1_.ID
from BOOK as tb_1_
inner join BOOK_AUTHOR_MAPPING as tb_2_
on tb_1_.ID = tb_2_.BOOK_ID
where tb_2_.AUTHOR_ID = ?

这一次,我们只看到一个SQL JOIN子句,而不是两个。

原因:目标表的主键,其实就是中间表到目标表的外键。