2021-01-01から1年間の記事一覧

Cloud Function で Bigqueryにデータ挿入

データフロー Bigqueryへデータを転送するとき一度GCSにデータを置きます。理由はエラー発生時にデータ再転送しなくて済むのとBigqueryのデータ更新回数1日1000回の制限超過を防ぐためです。しかしGCSにデータを置いた場合GCSからBigqueryへデータ転送バッチ…

BigqueryのELTがめちゃくちゃ便利だった

ELTとは ELTとはExtract/Load/Transformの頭文字を取っています。 (データ収集/データ転送/データ加工) pythonで機械学習をしたい時に大容量データを扱うことがあります。このデータを使用するには加工が必須になりますが、自分の環境上で大規模データを加工…