Skip to content

Commit

Permalink
[FLINK-29389][docs] Update documentation of JDBC and HBase lookup tab…
Browse files Browse the repository at this point in the history
…le for new caching options (apache#20884)
  • Loading branch information
PatrickRen authored Sep 23, 2022
1 parent 340b100 commit 3fa7d03
Show file tree
Hide file tree
Showing 4 changed files with 269 additions and 35 deletions.
69 changes: 63 additions & 6 deletions docs/content.zh/docs/connectors/table/hbase.md
Original file line number Diff line number Diff line change
Expand Up @@ -168,18 +168,42 @@ ON myTopic.key = hTable.rowkey;
<td>是否启用异步查找。如果为真,查找将是异步的。注意:异步方式只支持 hbase-2.2 连接器</td>
</tr>
<tr>
<td><h5>lookup.cache.max-rows</h5></td>
<td><h5>lookup.cache</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">-1</td>
<td style="word-wrap: break-word;">NONE</td>
<td><p>枚举类型</p>可选值: NONE, PARTIAL</td>
<td>维表的缓存策略。 目前支持 NONE(不缓存)和 PARTIAL(只在外部数据库中查找数据时缓存)。</td>
</tr>
<tr>
<td><h5>lookup.partial-cache.max-rows</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Long</td>
<td>查找缓存的最大行数,超过这个值,最旧的行将过期。注意:"lookup.cache.max-rows" 和 "lookup.cache.ttl" 必须同时被设置。默认情况下,查找缓存是禁用的。 </td>
<td>查找缓存的最大行数,超过这个值,最旧的行将过期。使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。</td>
</tr>
<tr>
<td><h5>lookup.cache.ttl</h5></td>
<td><h5>lookup.partial-cache.expire-after-write</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">0 s</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>查找缓存中每一行的最大生存时间,在这段时间内,最老的行将过期。注意:"lookup.cache.max-rows" 和 "lookup.cache.ttl" 必须同时被设置。默认情况下,查找缓存是禁用的。</td>
<td>在记录写入缓存后该记录的最大保留时间。
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。</td>
</tr>
<tr>
<td><h5>lookup.partial-cache.expire-after-access</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>在缓存中的记录被访问后该记录的最大保留时间。
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。</td>
</tr>
<tr>
<td><h5>lookup.partial-cache.caching-missing-key</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">true</td>
<td>Boolean</td>
<td>是否缓存维表中不存在的键,默认为true。
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。</td>
</tr>
<tr>
<td><h5>lookup.max-retries</h5></td>
Expand All @@ -201,6 +225,39 @@ ON myTopic.key = hTable.rowkey;
</tbody>
</table>

### 已弃用的配置
这些弃用配置已经被上述的新配置代替,而且最终会被弃用。请优先考虑使用新配置。
<table>
<thead>
<tr>
<th class="text-left" style="width: 25%">Option</th>
<th class="text-left" style="width: 8%">Required</th>
<th class="text-left" style="width: 8%">Forwarded</th>
<th class="text-left" style="width: 7%">Default</th>
<th class="text-left" style="width: 10%">Type</th>
<th class="text-left" style="width: 42%">Description</th>
</tr>
</thead>
<tbody>
<tr>
<td><h5>lookup.cache.max-rows</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Integer</td>
<td>请配置 "lookup.cache" = "PARTIAL" 并使用 "lookup.partial-cache.max-rows" 代替</td>
</tr>
<tr>
<td><h5>lookup.cache.ttl</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>请配置 "lookup.cache" = "PARTIAL" 并使用 "lookup.partial-cache.expire-after-write" 代替</td>
</tr>
</tbody>
<table>



数据类型映射表
Expand Down
79 changes: 68 additions & 11 deletions docs/content.zh/docs/connectors/table/jdbc.md
Original file line number Diff line number Diff line change
Expand Up @@ -202,28 +202,44 @@ ON myTopic.key = MyUserTable.id;
它决定了每个语句是否在事务中自动提交。有些 JDBC 驱动程序,特别是
<a href="https://jdbc.postgresql.org/documentation/head/query.html#query-with-cursor">Postgres</a>,可能需要将此设置为 false 以便流化结果。</td>
</tr>
<tr>
<td><h5>lookup.cache</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">NONE</td>
<td><p>枚举类型</p>可选值: NONE, PARTIAL</td>
<td>维表的缓存策略。 目前支持 NONE(不缓存)和 PARTIAL(只在外部数据库中查找数据时缓存)。</td>
</tr>
<tr>
<td><h5>lookup.cache.max-rows</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Integer</td>
<td>lookup cache 的最大行数,若超过该值,则最老的行记录将会过期。
默认情况下,lookup cache 是未开启的。请参阅下面的 <a href="#lookup-cache">Lookup Cache</a> 部分了解更多详情。</td>
<td>维表缓存的最大行数,若超过该值,则最老的行记录将会过期。
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。请参阅下面的 <a href="#lookup-cache">Lookup Cache</a> 部分了解更多详情。</td>
</tr>
<tr>
<td><h5>lookup.cache.ttl</h5></td>
<td><h5>lookup.partial-cache.expire-after-write</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>lookup cache 中每一行记录的最大存活时间,若超过该时间,则最老的行记录将会过期
默认情况下,lookup cache 是未开启的。请参阅下面的 <a href="#lookup-cache">Lookup Cache</a> 部分了解更多详情。</td>
<td>在记录写入缓存后该记录的最大保留时间
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。请参阅下面的 <a href="#lookup-cache">Lookup Cache</a> 部分了解更多详情。</td>
</tr>
<tr>
<td><h5>lookup.cache.caching-missing-key</h5></td>
<td><h5>lookup.partial-cache.expire-after-access</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>在缓存中的记录被访问后该记录的最大保留时间。
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。请参阅下面的 <a href="#lookup-cache">Lookup Cache</a> 部分了解更多详情。</td>
</tr>
<tr>
<td><h5>lookup.partial-cache.caching-missing-key</h5></td>
<td>可选</td>
<td style="word-wrap: break-word;">true</td>
<td>Boolean</td>
<td>标记缓存丢失的键,默认为true</td>
<td>是否缓存维表中不存在的键,默认为true。
使用该配置时 "lookup.cache" 必须设置为 "PARTIAL”。</td>
</tr>
<tr>
<td><h5>lookup.max-retries</h5></td>
Expand Down Expand Up @@ -263,6 +279,47 @@ ON myTopic.key = MyUserTable.id;
</tbody>
</table>

### 已弃用的配置
这些弃用配置已经被上述的新配置代替,而且最终会被弃用。请优先考虑使用新配置。
<table>
<thead>
<tr>
<th class="text-left" style="width: 25%">Option</th>
<th class="text-left" style="width: 8%">Required</th>
<th class="text-left" style="width: 8%">Forwarded</th>
<th class="text-left" style="width: 7%">Default</th>
<th class="text-left" style="width: 10%">Type</th>
<th class="text-left" style="width: 42%">Description</th>
</tr>
</thead>
<tbody>
<tr>
<td><h5>lookup.cache.max-rows</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Integer</td>
<td>请配置 "lookup.cache" = "PARTIAL" 并使用 "lookup.partial-cache.max-rows" 代替</td>
</tr>
<tr>
<td><h5>lookup.cache.ttl</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>请配置 "lookup.cache" = "PARTIAL" 并使用 "lookup.partial-cache.expire-after-write" 代替</td>
</tr>
<tr>
<td><h5>lookup.cache.caching-missing-key</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">true</td>
<td>Boolean</td>
<td>请配置 "lookup.cache" = "PARTIAL" 并使用 "lookup.partial-cache.caching-missing-key" 代替</td>
</tr>
</tbody>
<table>

<a name="features"></a>

特性
Expand Down Expand Up @@ -298,14 +355,14 @@ ON myTopic.key = MyUserTable.id;

JDBC 连接器可以用在时态表关联中作为一个可 lookup 的 source (又称为维表),当前只支持同步的查找模式。

默认情况下,lookup cache 是未启用的,你可以设置 `lookup.cache.max-rows` and `lookup.cache.ttl` 参数来启用。
默认情况下,lookup cache 是未启用的,你可以将 `lookup.cache` 设置为 `PARTIAL` 参数来启用。

lookup cache 的主要目的是用于提高时态表关联 JDBC 连接器的性能。默认情况下,lookup cache 不开启,所以所有请求都会发送到外部数据库。
当 lookup cache 被启用时,每个进程(即 TaskManager)将维护一个缓存。Flink 将优先查找缓存,只有当缓存未查找到时才向外部数据库发送请求,并使用返回的数据更新缓存。
当缓存命中最大缓存行 `lookup.cache.max-rows` 或当行超过最大存活时间 `lookup.cache.ttl` 时,缓存中最老的行将被设置为已过期
缓存中的记录可能不是最新的,用户可以将 `lookup.cache.ttl` 设置为一个更小的值以获得更好的刷新数据,但这可能会增加发送到数据库的请求数。所以要做好吞吐量和正确性之间的平衡。
当缓存命中最大缓存行 `lookup.partial-cache.max-rows` 或当行超过 `lookup.partial-cache.expire-after-write``lookup.partial-cache.expire-after-access` 指定的最大存活时间时,缓存中的行将被设置为已过期
缓存中的记录可能不是最新的,用户可以将缓存记录超时设置为一个更小的值以获得更好的刷新数据,但这可能会增加发送到数据库的请求数。所以要做好吞吐量和正确性之间的平衡。

默认情况下,flink 会缓存主键的空查询结果,你可以通过将 `lookup.cache.caching-missing-key` 设置为 false 来切换行为。
默认情况下,flink 会缓存主键的空查询结果,你可以通过将 `lookup.partial-cache.caching-missing-key` 设置为 false 来切换行为。

<a name="idempotent-writes"></a>

Expand Down
73 changes: 67 additions & 6 deletions docs/content/docs/connectors/table/hbase.md
Original file line number Diff line number Diff line change
Expand Up @@ -188,20 +188,48 @@ Connector Options
<td>Whether async lookup are enabled. If true, the lookup will be async. Note, async only supports hbase-2.2 connector.</td>
</tr>
<tr>
<td><h5>lookup.cache.max-rows</h5></td>
<td><h5>lookup.cache</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">-1</td>
<td style="word-wrap: break-word;">NONE</td>
<td><p>Enum</p>Possible values: NONE, PARTIAL</td>
<td>The cache strategy for the lookup table. Currently supports NONE (no caching) and PARTIAL (caching entries on lookup operation in external database).</td>
</tr>
<tr>
<td><h5>lookup.partial-cache.max-rows</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Long</td>
<td>The max number of rows of lookup cache, over this value, the oldest rows will be expired. Note, "lookup.cache.max-rows" and "lookup.cache.ttl" options must all be specified if any of them is specified. Lookup cache is disabled by default.</td>
<td>The max number of rows of lookup cache, over this value, the oldest rows will be expired.
"lookup.cache" must be set to "PARTIAL" to use this option.</td>
</tr>
<tr>
<td><h5>lookup.cache.ttl</h5></td>
<td><h5>lookup.partial-cache.expire-after-write</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">0 s</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>The max time to live for each rows in lookup cache, over this time, the oldest rows will be expired. Note, "cache.max-rows" and "cache.ttl" options must all be specified if any of them is specified.Lookup cache is disabled by default.</td>
<td>The max time to live for each rows in lookup cache after writing into the cache
"lookup.cache" must be set to "PARTIAL" to use this option. </td>
</tr>
<tr>
<td><h5>lookup.partial-cache.expire-after-access</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>The max time to live for each rows in lookup cache after accessing the entry in the cache.
"lookup.cache" must be set to "PARTIAL" to use this option. </td>
</tr>
<tr>
<td><h5>lookup.partial-cache.caching-missing-key</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">true</td>
<td>Boolean</td>
<td>Whether to store an empty value into the cache if the lookup key doesn't match any rows in the table.
"lookup.cache" must be set to "PARTIAL" to use this option.</td>
</tr>
<tr>
<td><h5>lookup.max-retries</h5></td>
Expand All @@ -224,6 +252,39 @@ Connector Options
</tbody>
</table>

### Deprecated Options
These deprecated options has been replaced by new options listed above and will be removed eventually. Please consider using new options first.
<table>
<thead>
<tr>
<th class="text-left" style="width: 25%">Option</th>
<th class="text-left" style="width: 8%">Required</th>
<th class="text-left" style="width: 8%">Forwarded</th>
<th class="text-left" style="width: 7%">Default</th>
<th class="text-left" style="width: 10%">Type</th>
<th class="text-left" style="width: 42%">Description</th>
</tr>
</thead>
<tbody>
<tr>
<td><h5>lookup.cache.max-rows</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Integer</td>
<td>Please set "lookup.cache" = "PARTIAL" and use "lookup.partial-cache.max-rows" instead.</td>
</tr>
<tr>
<td><h5>lookup.cache.ttl</h5></td>
<td>optional</td>
<td>yes</td>
<td style="word-wrap: break-word;">(none)</td>
<td>Duration</td>
<td>Please set "lookup.cache" = "PARTIAL" and use "lookup.partial-cache.expire-after-write" instead.</td>
</tr>
</tbody>
<table>



Data Type Mapping
Expand Down
Loading

0 comments on commit 3fa7d03

Please sign in to comment.