[WIP] Add Japanese translation of Data Wants to Be Free#617
Hidden character warning
[WIP] Add Japanese translation of Data Wants to Be Free#617lidavidm wants to merge 6 commits intoapache:mainfrom
Conversation
Co-authored-by: Sutou Kouhei <kou@cozmixng.org>
|
Thank you for the fast review!! |
|
|
||
| ## PostgreSQL対Arrow:データシリアライズ | ||
|
|
||
| [PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。 |
There was a problem hiding this comment.
| [PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。 | |
| [PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットで比較します。 |
| ## PostgreSQL対Arrow:データシリアライズ | ||
|
|
||
| [PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。 | ||
| この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。 |
There was a problem hiding this comment.
"後知恵" has a negative impression in Japanese. How about using other wording?
"先人たち" will be better than "前任者" for "predecessors" here. BTW, there is a proverb "先人の知恵" in Japanese.
| この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。 | |
| この比較で、Arrowは(先人たちの知恵を使って)先人たちよりも適切なトレードオフを選択することを証明します。 |
| [PostgreSQLのバイナリーフォーマット](https://www.postgresql.jp/document/current/html/sql-copy.html#id-1.9.3.55.9.4)と[Arrow IPC](https://arrow.apache.org/docs/format/Columnar.html#serialization-and-interprocess-communication-ipc)を同じデータセットに比較します。 | ||
| この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。 | ||
|
|
||
| PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。 |
There was a problem hiding this comment.
| PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。 | |
| PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けとります。 |
| この比較で、Arrowは(後知恵のおかげで)前任者より適切のトレードオフを行うのを証明します。 | ||
|
|
||
| PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。 | ||
| そのプロトコルの内に、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]。 |
There was a problem hiding this comment.
| そのプロトコルの内に、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]。 | |
| そのプロトコルの内で、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]。 |
| PostgreSQLでクエリを実行すると、クライアント(すなわちドライバ)はPostgreSQLの通信プロトコルでクエリを送り、結果を受けます。 | ||
| そのプロトコルの内に、結果セットはPostgreSQLのバイナリーフォーマットでエンコードされています[^textbinary]。 | ||
|
|
||
| [^textbinary]: テキストフォーマットもあります。クライアントはそのフォーマットをほとんど使っています。この記事でテキストフォーマットを論じません。 |
There was a problem hiding this comment.
We can close "ほとんど" and "クライアント" for "many clients".
"論じる" is a good translation for "discuss" but it's a bit formal here. "議論する" or "扱う" (a bit free translation) will be better than "論じる" here.
| [^textbinary]: テキストフォーマットもあります。クライアントはそのフォーマットをほとんど使っています。この記事でテキストフォーマットを論じません。 | |
| [^textbinary]: テキストフォーマットもあります。ほとんどのクライアントはデフォルトでテキストフォーマットを使っています。この記事ではテキストフォーマットを扱いません。 |
| 列が増えれば増えるほど、オーバーヘッドの比率が減ります。 | ||
| (しかし、行が増えればオーバーヘッドが変わりません。) | ||
| 極限において、50%オーバーヘッドに近づきます。 | ||
| エンディアン交換は高価な操作ではありませんが、それでも必要です。 |
There was a problem hiding this comment.
"高価" isn't storage here but "重い" (heavy) may be easier to understand here.
| エンディアン交換は高価な操作ではありませんが、それでも必要です。 | |
| エンディアン交換は高価な操作ではありませんが、それでも必要です。 |
| こういう技術は結構高価です。 | ||
|
|
||
| Arrowはどうでしょうか? | ||
| [ADBC](https://arrow.apache.org/adbc/current/driver/postgresql.html)でPostgreSQLテーブルを読み込み、そして前の通りにデータに注釈を付けます。 |
There was a problem hiding this comment.
| [ADBC](https://arrow.apache.org/adbc/current/driver/postgresql.html)でPostgreSQLテーブルを読み込み、そして前の通りにデータに注釈を付けます。 | |
| [ADBC](https://arrow.apache.org/adbc/current/driver/postgresql.html)でPostgreSQLテーブルを読み込み、そして前と同じようにデータに注釈を付けます。 |
| 00000210: <span class="a-data">67 65 72 20 73 74 72 69 ger stri</span> | ||
| 00000218: <span class="a-data">6e 67 79 65 74 20 61 6e ngyet an</span> | ||
| 00000220: <span class="a-data">6f 74 68 65 72 20 73 74 other st</span> | ||
| 00000228: <span class="a-data">72 69 6e 67</span> <span class="a-padding">00 00 00 00</span> <span class="a-data">ring</span><span class="a-padding">.... アラインメントのためのパッディング</span> |
There was a problem hiding this comment.
In general, "パディング" is used for padding in Japanese.
| 00000228: <span class="a-data">72 69 6e 67</span> <span class="a-padding">00 00 00 00</span> <span class="a-data">ring</span><span class="a-padding">.... アラインメントのためのパッディング</span> | |
| 00000228: <span class="a-data">72 69 6e 67</span> <span class="a-padding">00 00 00 00</span> <span class="a-data">ring</span><span class="a-padding">.... アラインメントのためのパディング</span> |
|
|
||
| 一見すると、Arrowは結構わかりにくいです。 | ||
| データセットに全然関係なさそうなヘッダーもあるし、 | ||
| まるで領域を占有するためにだけそうで謎のパッディングもあるし。 |
There was a problem hiding this comment.
| まるで領域を占有するためにだけそうで謎のパッディングもあるし。 | |
| まるで領域を占有するためだけそうな謎のパディングもあるし。 |
| 一見すると、Arrowは結構わかりにくいです。 | ||
| データセットに全然関係なさそうなヘッダーもあるし、 | ||
| まるで領域を占有するためにだけそうで謎のパッディングもあるし。 | ||
| しかし大事なのは、**オーバーヘッドが固定です**。 |
There was a problem hiding this comment.
| しかし大事なのは、**オーバーヘッドが固定です**。 | |
| しかし大事なところは、**オーバーヘッドが固定というところです**。 |
No description provided.