如何将 Mysql 实时同步到 Bigquery?

How to Sync Mysql into Bigquery in realtime?(如何将 Mysql 实时同步到 Bigquery?)
本文介绍了如何将 Mysql 实时同步到 Bigquery?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

目前我有一些脚本,它首先删除表并将表从 MySQL 上传到 Bigquery.而且很多时候都失败了.此外,它每天只运行一次.我正在寻找一些可扩展的实时解决方案.您的帮助将不胜感激:)

Currently I have some script which first deletes the table and upload the table from MySQL to Bigquery. And many time it had failed. Plus it run only once a day. I am looking for some scalable and realtime solution. Your Help will be much appreciated :)

推荐答案

阅读来自 Wepay 的这些系列文章,其中详细介绍了如何使用 Airflow 将 MySQL 数据库同步到 BigQuery:

Read these series of posts from Wepay, where they detail how they sync their MySQL databases to BigQuery, using Airflow:

  • https://wecode.wepay.com/posts/wepays-数据仓库-bigquery-airflow
  • https://wecode.wepay.com/posts/airflow-wepay
  • (第三个是关于 BigQuery)

作为总结(引用):

  • 设置身份验证、连接、DAG.
  • 定义要从 MySQL 中提取哪些列并加载到 BigQuery 中.
  • 选择加载数据的方式:增量加载或完全加载.
  • 去重.

这篇关于如何将 Mysql 实时同步到 Bigquery?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

Hibernate reactive No Vert.x context active in aws rds(AWS RDS中的休眠反应性非Vert.x上下文处于活动状态)
Bulk insert with mysql2 and NodeJs throws 500(使用mysql2和NodeJS的大容量插入抛出500)
Flask + PyMySQL giving error no attribute #39;settimeout#39;(FlASK+PyMySQL给出错误,没有属性#39;setTimeout#39;)
auto_increment column for a group of rows?(一组行的AUTO_INCREMENT列?)
Sort by ID DESC(按ID代码排序)
SQL/MySQL: split a quantity value into multiple rows by date(SQL/MySQL:按日期将数量值拆分为多行)