HiveQL Tips
Hive では、サイズの大きなテーブルをJOINする。 Hiveは、クエリの最後に出てくるテーブルを最大のテーブルと仮定し、 レコード結合をしながら他のテーブルをバッファした後、最後のテーブルをストリーム化しようとする。 ■巨大なテーブルをJOINする場合 年月日でPartitionが区切られているtable_largeをJOINする時、 以下のようなクエリだと、JOINが先に評価され、JOIN後にWHERE節が働きます。 <figure...
[Read More]