Cloud Runタイムアウト問題を自作ジョブキューで解決
直面した課題
Cloud Run のデフォルトタイムアウト(60秒)内に DeBERTa の推論処理が完了せず、502エラーが頻発。同期的なリクエスト処理では根本解決できなかった。
AIとの壁打ち
AIと壁打ちしながら「そもそもリクエストと推論を切り離せばよい」という発想を得た。ジョブキューパターンを調査し、Supabase の jobs テーブルに処理を登録→非同期ワーカーが消化する構成を設計。
解決策
リクエスト受信時にジョブをDBに登録してすぐ202を返し、別コンテナのワーカーが非同期で推論を実行。結果はSSEでクライアントにプッシュ通知。タイムアウトエラーをゼロにした。


