10.1. 概要

SQLは強く型付けされた言語です。 つまり、各データ項目は、その動作と許される使用方法を決定するデータ型を所有しています。 PostgreSQLには、他のSQLの実装よりもより一般的で柔軟性のある、拡張可能な型システムがあります。 このために、PostgreSQLでのほとんどの型変換の動作は、特定の目的について勝手に作り上げられることなく一般的な規則で管理されています。 これにより、ユーザ定義型についても型の混在する式を有意義に使用できます。

PostgreSQLのスキャナ/パーサは字句要素を、整数、非整数値、文字列、識別子、キーワードというわずか5個の基礎カテゴリに分解します。 ほとんどの非数値型定数は、まず文字列にクラス分けされます。 SQL言語定義では、文字列で型の名前を指定することを許していて、パーサが正しい手順に沿って処理を始められるようにPostgreSQLも採用しています。 例えば、以下のような問い合わせを考えてみましょう。

SELECT text 'Origin' AS "label", point '(0,0)' AS "value";

 label  | value
--------+-------
 Origin | (0,0)
(1 row)

この問い合わせは、textpointという2つの型を指定したリテラル定数を持ちます。 文字列リテラルに型が指定されていない場合、後述するように、後の段階で解決されるようにとりあえず場所を確保するための型であるunknownが割り当てられます。

PostgreSQLのパーサには、個別の型変換規則が必要な4つの基礎的なSQL構成要素があります。

関数呼び出し

PostgreSQL型システムの大部分は、高度な関数群によって構築されています。 関数は複数の引数を取ることができます。 PostgreSQLでは関数のオーバーロードが可能ですので、関数名だけでは呼び出すべき関数を一意に識別できません。 パーサは、提供される引数のデータ型に基づいて、正しい関数を選択しなければなりません。

演算子

PostgreSQLでは、(引数が2つの)二項演算子と同様に、(引数が1つの)前置、後置単項演算子を持つ式が使用できます。 関数と同様、演算子もオーバーロード可能ですので、正しい演算子を選択する時に同じ問題が存在します。

値の格納

SQLINSERTUPDATE文は式の結果をテーブルの中に格納します。 文内の式は対象となる列の型に一致する、または、変換できるものである必要があります。

UNIONCASE、および関連する構文

UNIONを構成するSELECT文からの選択結果は全て、ある1つの列集合として現れなければいけませんので、各SELECT句の結果型は統一された集合に一致し変換できる必要があります。 同様に、CASE式が全体として既知の出力型を持つようになるために、CASE構文の結果式は共通の型に変換される必要があります。 これはARRAY式でもGREATEST関数、LEAST関数でも同じです。

システムカタログには、データ型間の変換(キャストと呼ばれます)が有効かどうかやその変換の実行方法に関する情報を格納します。 ユーザはCREATE CASTコマンドを使用してキャストを追加することができます (これは通常新しいデータ型を定義する時にまとめて行われます。 組み込み型間のキャスト集合は注意深く作成されており、また、変更しないことが最善です)。

SQL標準型に対し、パーサがより適切な推測動作を行えるよう追加の自律機構を備えています。 基本的な型カテゴリとして、booleannumericstringbitstringdatetimetimespangeometricnetwork、ユーザ定義が定義されています。 ユーザ定義を除いた各カテゴリは、曖昧さがある場合に優先的に選択される、1つ以上の好ましい型を持ちます。 ユーザ定義カテゴリでは、それぞれの型はそれ自身の好ましい型です。 したがって、曖昧な式(複数の解析結果侯補を持つもの)は、複数の可能な組み込み型があったとしてもしばしば解決できますが、複数のユーザ定義型選択肢がある場合にはエラーが発生します。

全ての型変換規則は次のようないくつかの基本的な考え方に基づいて設計されています。